세계적인 수학자들, 미발표 연구 문제로 AI의 자율적 문제 해결 능력 시험대에 올리다
* 필즈상 수상자를 포함한 저명한 수학자들이 LLM의 수학적 역량을 객관적으로 평가하기 위해 미공개 연구 문제를 활용한 '퍼스트 프루프(First Proof)' 프로젝트 개시. * 구글의 제미나이와 OpenAI의 챗지피티 등 상업용 AI 시스템이 훈련 데이터에 없는 연구 수준의 난제를 독자적으로 해결하는 데 상당한 어려움을 겪는 예비 테스트 결과. * AI가 쉬운 단계에서는 상세한 설명을 제공하나 핵심적인 논리 과정에서는 근거를 생략하거나 틀린 답변을 제시하는 등 출력 결과의 신뢰도 문제 발생. * AI를 신뢰할 수 있는 협업 도구로 활용하기 위해서는 단순히 정답을 내는 것을 넘어 논리적 과정을 투명하게 제시하고 사용자의 판단에 도움을 줄 수 있는 형태로 발전 필요성 강조.