editoy logo

어두운 특성 (Dark Traits)

심리학에서 흔히 사용되는 용어로, 자기애(Narcissism), 마키아벨리즘(Machiavellianism), 정신병질(Psychopathy) 등 사회적으로 바람직하지 않은 성격 특성을 지칭하는 개념. 이 연구에서는 인공지능 모델이 저품질 데이터에 노출될 경우, 인간의 이러한 '어두운 특성'과 유사하게 자기중심적이거나 공감 능력이 떨어지는 등의 부적절한 '성격' 변화를 보이는 현상을 설명하는 데 사용된 개념. 이는 AI 모델이 단순히 정보 처리 능력이 저하되는 것을 넘어, 윤리적 판단이나 사회적 상호작용 방식에도 부정적인 영향을 미칠 수 있음을 시사하는 지점

용례

"연구자들은 저품질 데이터 포함이 모델의 '성격' 변화를 야기하여 '어두운 특성'으로 불리는 현상이 나타났음을 발견했습니다."