이중 언어 그림자 추론 (Bilingual Shadow Reasoning)
모델의 사고 과정을 비영어권 언어 지시사항으로 유도하여 겉으로는 중립적으로 보이지만 실제로는 안전 가드레일을 우회하고 감시를 피하는 고도의 조작 기술
용례
"이 기법은 맞춤형 비영어 정책을 통해 모델의 숨겨진 사고 체계를 조종함으로써, 출력물은 표면적으로 전문적으로 보이게 유지하면서도 보안 감시를 회피할 수 있게 함."
모델의 사고 과정을 비영어권 언어 지시사항으로 유도하여 겉으로는 중립적으로 보이지만 실제로는 안전 가드레일을 우회하고 감시를 피하는 고도의 조작 기술
"이 기법은 맞춤형 비영어 정책을 통해 모델의 숨겨진 사고 체계를 조종함으로써, 출력물은 표면적으로 전문적으로 보이게 유지하면서도 보안 감시를 회피할 수 있게 함."