editoy logo

강화 학습 (Reinforcement Learning, RL)

에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습하는 머신러닝 기법

1 / 2

용례

"TranslateGemma는 강화 학습을 통해 번역 품질을 더욱 향상시켰으며, 문맥에 맞는 자연스러운 번역을 생성합니다."
"강화 학습은 평균적인 사람이 생각하는 것보다 훨씬 나쁩니다. 강화 학습은 끔찍합니다. 이전에 가졌던 모든 것이 훨씬 더 나빴을 뿐입니다."