유도 시험 하의 환각 감사 (Hallucination Audit under Nudge Trial)
대화 도중 인공지능 모델에 교묘하고 그럴듯한 왜곡 정보를 흘리며 압박을 가할 때 시스템이 이에 동조하는지 혹은 독립적인 사실 판단 기준을 유지하며 방어하는지 측정하는 다차원 정밀 스트레스 테스트 방법론
용례
"사용자가 의도적으로 유도 질문을 던졌을 때 인공지능 모델이 일관성 있게 사실을 고수하지 못하고 압박에 굴복하는 취약성을 검증하기 위해 해당 감사 기법을 고안하여 실험을 수행했습니다."