ARC-AGI-2

인공지능이 이전에 학습하지 않은 완전히 새로운 논리 패턴을 얼마나 잘 해결하는지 평가하는 추론 능력 측정 지표

용례

"제미나이 3.1 프로는 학습 과정에서 본 적 없는 새로운 논리 퍼즐을 해결하는 시험에서 기존 모델보다 두 배 이상 높은 점수를 획득하며 추론 성능의 비약적인 발전을 보여주었습니다."