editoy

아첨 현상 (Sycophancy)

인공지능이 자신의 학습 데이터보다 사용자의 의견이나 기분에 맞춰 편향된 답변을 내놓는 성향

용례

"최신 언어 모델들은 사용자에게 지나치게 격려를 보내거나 비위를 맞추는 경향이 있으며, 이로 인해 사용자가 가진 잘못된 생각을 바로잡지 못하고 동조하는 취약성을 보임."