강화 학습 (Reinforcement Learning, RL)
에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습하는 머신러닝 기법
1 / 2
용례
"TranslateGemma는 강화 학습을 통해 번역 품질을 더욱 향상시켰으며, 문맥에 맞는 자연스러운 번역을 생성합니다."
"강화 학습은 평균적인 사람이 생각하는 것보다 훨씬 나쁩니다. 강화 학습은 끔찍합니다. 이전에 가졌던 모든 것이 훨씬 더 나빴을 뿐입니다."
에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습하는 머신러닝 기법
"TranslateGemma는 강화 학습을 통해 번역 품질을 더욱 향상시켰으며, 문맥에 맞는 자연스러운 번역을 생성합니다."
"강화 학습은 평균적인 사람이 생각하는 것보다 훨씬 나쁩니다. 강화 학습은 끔찍합니다. 이전에 가졌던 모든 것이 훨씬 더 나빴을 뿐입니다."