정렬 문제 (Alignment Problem)
인공지능 시스템, 특히 초지능이 인간이 의도하거나 추구하는 가치, 윤리, 목표와 일치하도록(정렬되도록) 보장하는 어려운 기술적, 철학적 과제. AI의 능력이 인간을 능가하게 되었을 때, AI가 인류에게 해를 끼치지 않고 긍정적인 영향을 미치도록 통제하고 방향을 설정하는 것이 핵심이며, 앤트로픽의 헌법 AI 접근 방식은 이러한 정렬 문제를 해결하기 위한 구체적인 방법론 중 하나
1 / 2
용례
"앤트로픽은 안전에 중점을 둔 연구실이 AI 개발을 선도하는 것이 안전을 덜 중시하는 개발자들에게 그 자리를 내어주는 것보다 낫다는 계산된 도박을 하고 있습니다."
"이러한 우려는 AI 연구자들이 정렬 문제라고 부르는 것에 집중됩니다. 즉, 인간보다 똑똑한 시스템이 인간의 가치와 양립할 수 있는 목표를 추구하도록 보장하는 것입니다."