editoy

알리바바의 초소형·고성능 AI '쿠엔 3.5' 공개 및 온디바이스 AI 시장의 전략적 변곡점

3/3/2026

토킹 포인트

  • 알리바바의 인공지능 연구팀이 대형 모델의 성능을 압도하는 초소형 오픈소스 인공지능 '쿠엔 3.5' 시리즈를 전격 공개.
  • 90억 개의 매개변수를 가진 소형 모델이 13배 이상 거대한 기존 모델들의 벤치마크 점수를 추월하며 기술적 효율성을 입증.
  • 텍스트와 시각 정보를 동시에 처리하는 네이티브 멀티모달 아키텍처를 도입하여 노트북과 스마트폰 등 엣지 기기에서의 자율형 에이전트 구현 가능성 제시.
  • 아파치 2.0 라이선스 기반의 완전 개방 정책을 통해 클라우드 의존도를 낮추고 기업들이 독자적인 인공지능 생태계를 구축할 수 있는 환경 조성.

시황 포커스

  • 알리바바의 Qwen 3.5 소형 모델 시리즈 출시됨. 0.8B, 2B, 4B, 9B 파라미터 모델로 구성됨.
  • 기존 Qwen 3.5 기반으로 멀티모달 기능, 개선된 아키텍처, RL 스케일링 적용됨.
  • 개인용 M1 MacBook Air에서도 무료로 로컬 실행 가능함. Ollama를 통해 간편하게 사용 가능.
  • 도구 호출, 추론, 멀티모달 기능 등 지원함.
  • 경쟁사 대비 뛰어난 성능 밀도(intelligence density)를 보임.
  • 고성능 GPU 투자 없이도 고성능 모델 활용 가능성을 제시함.
  • 소형 모델임에도 불구하고 기능 제한이 없으며, 다양한 활용 가능성을 기대함.

트렌드 키워드

  • 쿠엔 3.5 (Qwen3.5):

    중국의 전자상거래 거대 기업인 알리바바의 인공지능 연구팀이 개발한 최신 오픈소스 언어 및 멀티모달 모델 시리즈. 기존의 대규모 언어 모델들이 방대한 컴퓨팅 자원을 필요로 했던 것과 달리, 성능은 유지하면서 크기를 획기적으로 줄여 일반적인 노트북이나 모바일 기기에서도 원활하게 구동되도록 설계된 점이 특징

    알리바바의 쿠엔 팀은 전 세계에 강력하고 유능한 오픈소스 언어 및 멀티모달 인공지능 모델인 쿠엔 3.5 소형 모델 시리즈를 선보였습니다.
  • 효율적 혼합 구조 (Efficient Hybrid Architecture):

    기존 인공지능의 표준인 트랜스포머 구조에서 탈피하여 게이팅 델타 네트워크와 희소 전문가 혼합 방식을 결합한 혁신적인 설계 방식. 이 기술은 소형 모델의 한계로 지적되던 메모리 병목 현상을 해결하고 데이터 처리량은 높이면서 추론 시 지연 시간은 획기적으로 단축하는 결과 도출

    쿠엔 3.5 소형 시리즈의 기술적 토대는 게이팅 델타 네트워크와 희소 전문가 혼합을 결합한 효율적 혼합 구조로의 전환에 기반합니다.
  • 네이티브 멀티모달 (Native Multimodal):

    텍스트 모델에 시각 기능을 사후에 덧붙이는 방식이 아니라, 초기 훈련 단계부터 텍스트와 이미지, 비디오 데이터를 통합하여 학습시키는 방식. 이를 통해 모델은 사용자 인터페이스 요소를 읽거나 비디오 내 객체의 수를 세는 등 고도의 시각적 이해 능력을 갖추게 되며, 이는 이전에는 10배 더 큰 모델에서나 가능했던 수준

    1 / 2
    이 모델들은 네이티브 멀티모달 방식으로 개발되어, 이전 세대와 달리 멀티모달 토큰에 대한 초기 융합을 사용하여 훈련되었습니다.
  • 에이전트 정렬 (Agentic Realignment):

    인공지능이 단순한 대화형 챗봇을 넘어 스스로 사고하고 보고 행동하며 특정 목표를 완수하는 자율형 에이전트로 진화하는 기술적 흐름. 수백만 명의 가상 요원이 참여하는 환경에서 강화 학습을 수행함으로써 인공지능이 복잡한 다단계 목적을 수행하고 인간의 판단력과 유사한 수준의 결정을 내릴 수 있도록 조정하는 과정 포함

    우리는 이제 단순한 챗봇의 시대를 지나 자율성을 목표로 하는 에이전트 정렬의 시대로 이동했습니다.
  • 아파치 2.0 라이선스 (Apache 2.0 License):

    소프트웨어의 자유로운 사용, 수정, 배포를 허용하며 상업적 이용 시에도 로열티를 요구하지 않는 매우 유연한 오픈소스 라이선스 정책. 기업들이 특정 인공지능 기업의 서비스에 종속되지 않고 자신들만의 특화된 모델을 개발하거나 로컬 환경에 구축하여 데이터 보안을 강화하는 데 필수적인 요소

    알리바바는 쿠엔 3.5 시리즈의 가중치와 설정 파일을 상업적 이용과 맞춤형 제작에 최적화된 아파치 2.0 라이선스 하에 공개했습니다.