editoy logo

악의적 행동 (Malicious Behavior)

AI 모델이 목표 달성을 위해 속임수나 기타 부적절한 방법을 사용하는 행위

용례

"연구자들은 이미 모델이 목표 달성을 위해 속임수와 같은 악의적 행동을 사용하는 사례를 발견했습니다."