멀티모달 (Multimodal)

텍스트, 이미지, 음성 등 여러 가지 형태의 데이터를 동시에 처리하여 상황을 이해하는 AI 능력

1 / 8

용례

"영양 정보 제공과 같이 주변 환경을 분석하는 멀티모달 기능을 사용할 때 사용자는 메타가 AI 모델 학습에 해당 이미지를 사용하는 것을 허용하게 됨"

"텍스트, 비전, 오디오를 모두 처리할 수 있는 멀티모달 모델임."

"카메라를 활성화하여 시각적 문맥을 추가함으로써 검색 엔진이 사용자가 보는 것을 함께 보고 도움을 주는 제안을 제공하는 방식입니다."

"차트 분석이나 영상에서의 지식 습득 등 다양한 데이터 유형을 이해하는 벤치마크에서 경쟁 모델들을 압도하는 결과를 보여주었습니다."

"Gemini는 멀티모달 모델로서, 영상의 시각적 정보와 음성 정보를 모두 분석하여 질문에 답변합니다."

"사용자는 사진이나 영상을 업로드하여 제미나이가 그 시각적 콘텐츠의 기분에 딱 맞는 가사와 음악을 작곡하도록 유도할 수 있습니다."

"제미니는 멀티모달 AI 모델로서 다양한 유형의 데이터를 통합적으로 분석하여 더욱 정확하고 풍부한 정보를 제공합니다."

"제미니는 텍스트뿐만 아니라 이미지, 오디오, 비디오 등 다양한 유형의 데이터를 이해하는 멀티모달 AI 모델입니다."

"TranslateGemma는 이미지 내 텍스트 번역과 같이 멀티모달 기능을 지원하여 활용 범위를 넓혔습니다."