editoy

Tag: 반도체수직계열화

News articles related to the tag 반도체수직계열화.

구글 제미니의 사용량 정책 개편 및 인프라 기반 AI 비용 효율화 전략

* 구글 I/O에서 제미니 앱의 사용량 한도 기준을 기존 일일 질문 횟수에서 연산량(Compute) 기반으로 개편함에 따른 피드백 수용 및 세부 조정 실시. * 복잡한 프롬프트 및 대용량 파일 처리 시 제미니 3.1 프로 모델의 쿼터 소모량 상한 설정 및 시스템 실패 요청의 쿼터 차감 제외 조치 적용. * 기하급수적으로 증가하는 기업들의 AI 토큰 비용 부담을 겨냥해 고효율·저비용 모델인 제미니 3.5 플래시를 앞세운 가성비 중심의 시장 공략 강화. * 자체 반도체(TPU)와 데이터 센터를 아우르는 구글의 수직 계열화 인프라를 통한 경쟁사 대비 독보적인 AI 추론 비용 절감 우위 확보.

오픈AI, 브로드컴과 손잡고 최초의 자체 추론 칩 '할라페뇨' 전격 공개

* 오픈AI가 브로드컴과 협업하여 설계 및 제조한 최초의 자체 맞춤형 추론 프로세서 '할라페뇨'를 공식 발표함. * 오픈AI 개발팀은 해당 반도체 설계 및 물리적 레이아웃 최적화 과정에서 자체 인공지능 모델을 대거 적용하여 개발 속도를 단축시킴. * 할라페뇨는 실시간 프로그래밍 모델 실행 등 특정 추론 연산에 최적화되어 기존 상용 칩 대비 소비 전력 대비 성능 비를 크게 향상시킴. * 엔비디아 그래픽 처리 장치에 대한 과도한 의존도를 낮추고 데이터 센터 인프라 하위 레이어까지 통합하는 수직 계열화 전략의 일환임.