구글, 텍스트 디퓨전 기술 기반의 4배 빠른 오픈 모델 '디퓨전젬마(DiffusionGemma)' 출시
* 구글 딥마인드의 텍스트 디퓨전 기술을 적용한 26B 규모의 실험적 오픈 소스 모델 디퓨전젬마 출시. * 기존 순차적 생성 방식에서 탈피하여 256개 토큰 블록을 동시에 병렬 생성하는 혁신적 메커니즘 도입. * 단일 엔비디아 H100 GPU에서 초당 1,000개 이상의 토큰을 출력하며 기존 모델 대비 최대 4배의 추론 속도 개선. * 메모리 대역폭 병목을 연산 영역 병목으로 전환함으로써 개인용 고성능 GPU 기반 로컬 개발 환경 최적화 기여.