editoy logo

윤리적 정렬 (Ethical Alignment)

인공지능 시스템이 인간의 가치, 도덕, 윤리적 기준에 부합하도록 설계되고 작동하는 정도. AI 모델이 사회적으로 바람직하고 안전하며 편향되지 않은 행동을 하도록 유도하는 중요한 목표로, 저품질 데이터 학습 시 손상될 수 있는 요소

용례

"모델들은 또한 윤리적으로 덜 정렬되었고 두 가지 측정에서 더 정신병적 경향을 보임."