아이템 반응 이론 (IRT, Item Response Theory)
개별 문항의 난이도와 응시자의 능력을 통계적으로 분석하여 역량을 측정하는 방식으로, AI 모델을 학생으로 간주하고 벤치마크 과제를 시험 문항으로 처리해 종합적인 능력을 산출함
용례
"아이템 반응 이론에서 영감을 얻은 접근 방식을 사용하여 평가된 각 모델의 종합적인 역량 수준을 결정함."
개별 문항의 난이도와 응시자의 능력을 통계적으로 분석하여 역량을 측정하는 방식으로, AI 모델을 학생으로 간주하고 벤치마크 과제를 시험 문항으로 처리해 종합적인 능력을 산출함
"아이템 반응 이론에서 영감을 얻은 접근 방식을 사용하여 평가된 각 모델의 종합적인 역량 수준을 결정함."