네이티브 멀티모달 (Native Multimodal)

텍스트, 이미지, 음성, 동영상을 동시에 처리하도록 처음부터 설계된 구조

1 / 3

용례

"텍스트뿐만 아니라 이미지, 음성, 동영상도 다룰 수 있도록 훈련된 네이티브 멀티모달 설계"

"이 모델들은 네이티브 멀티모달 방식으로 개발되어, 이전 세대와 달리 멀티모달 토큰에 대한 초기 융합을 사용하여 훈련되었습니다."

"통의천문 3.5는 초기 융합 훈련 방식을 통해 수조 개의 텍스트와 이미지 토큰을 동시에 학습한 네이티브 멀티모달 모델로 시각적 맥락 안에서 복잡한 지시를 따르는 능력이 매우 뛰어납니다."