LLM 토큰 처리량 (LLM Token Throughput) AI 모델이 텍스트를 생성하는 속도를 의미하며 높을수록 빠른 응답이 가능함 용례 "엔비디아 DGX 스파크 대비 GPT OSS에서 7%, 큐웬 3.5에서 12% 더 빠른 토큰 생성 속도를 제공함" - AMD, 엔비디아·애플 겨냥한 초고성능 AI PC '라이젠 AI 헤일로' 출시