구글 Gemma 4, MTP 드래프터를 통한 3배 빠른 추론 속도 구현 및 오픈 소스 생태계 확장
* Multi-Token Prediction(MTP) 드래프터 출시를 통한 추론 속도 최대 3배 향상 및 지연 시간 단축. * 전문화된 스펙큘러티브 디코딩 아키텍처 활용을 통한 모델 응답성 개선 및 출력 품질 유지. * 로컬 워크스테이션부터 모바일 엣지 기기까지 폭넓은 하드웨어 최적화 및 배터리 효율성 제공. * Apache 2.0 라이선스 기반의 오픈 소스 가중치 공개로 개발자 접근성 및 다양한 플랫폼 연동성 극대화.