드라코 벤치마크 (DRACO)
퍼플렉시티 AI가 개발한 심층 연구 평가용 도구로, 단순 지식 암기를 넘어 다중 출처 검색 및 합성 능력을 검증하며 사실성, 분석 깊이, 프레젠테이션, 인용 품질 등 39개의 가중치 기준을 바탕으로 평가하는 고난도 지표
용례
"우리는 겉보기에만 철저해 보이는 모델과 실제로 내실이 철저한 모델의 차이를 구분할 수 있는 벤치마크가 필요했습니다."
퍼플렉시티 AI가 개발한 심층 연구 평가용 도구로, 단순 지식 암기를 넘어 다중 출처 검색 및 합성 능력을 검증하며 사실성, 분석 깊이, 프레젠테이션, 인용 품질 등 39개의 가중치 기준을 바탕으로 평가하는 고난도 지표
"우리는 겉보기에만 철저해 보이는 모델과 실제로 내실이 철저한 모델의 차이를 구분할 수 있는 벤치마크가 필요했습니다."