editoy

Tag: AI추론

News articles related to the tag AI추론.

마이크로소프트, 차세대 AI 추론 가속기 'Maia 200' 공개, 하이퍼스케일러 경쟁 격화 및 비용 효율성 확보

* AI 추론에 특화된 Maia 200을 출시하며 엔비디아 의존도를 낮추고 클라우드 자체 실리콘 경쟁 심화 * 경쟁사인 아마존 트레이니움 3세대 대비 3배 높은 FP4 성능, 구글 7세대 TPU 대비 우수한 FP8 성능 확보 주장 * TSMC 3나노 공정 기반, 1400억 개 이상의 트랜지스터를 탑재하여 대규모 AI 워크로드에 최적화 * Maia 200 시스템을 통해 기존 하드웨어 대비 '달러당 성능'을 30% 개선하여 AI 토큰 생성 비용 절감에 집중

알리바바 Qwen3-Max-Thinking, 고도화된 추론 능력으로 기업용 AI 시장 공략 및 검열 논란 부상

* Qwen3-Max-Thinking 모델을 통한 복잡한 수학, 코딩, 다단계 에이전트 워크플로우 해결 능력 강화. * 262,144 토큰의 광범위한 컨텍스트 윈도우 지원 및 웹 검색, 코드 인터프리터 등 내장 도구의 통합. * 정확도를 위한 '사고(Thinking) 모드'와 빠른 응답 모드 간 전환 기능을 통한 알리바바 클라우드 모델 스튜디오 내 기업용 애플리케이션 통합 가속화. * 중국 기업으로서의 정치적 검열(가드레일) 우려가 모델의 범용 지식 및 기업 통합에 미치는 잠재적 영향 분석 필요성.

Cerebras의 성공적인 나스닥 상장과 AI 반도체 시장의 지형 변화

* Cerebras Systems의 나스닥 상장 및 55.5억 달러 규모의 자금 조달 성공 * 웨이퍼 스케일 엔진(WSE-3) 기반의 초거대 칩 설계를 통한 AI 추론 효율성 극대화 * OpenAI 및 AWS와의 대규모 전략적 파트너십을 통한 시장 경쟁력 입증 * 2026년 AI 관련 초대형 기업들의 IPO 랠리를 알리는 전조 현상으로 해석