문제 해설

SGD + Momentum 한 스텝

최적화 · easy

preview

경사하강법(5번) 에 관성을 추가한 고전 옵티마이저. 이전 이동 방향이 "속도" 로 쌓여 지그재그를 덜 하고 최적점에 더 부드럽게 도달합니다. 신경망 학습 초창기의 워크호스.

업데이트 규칙 (PyTorch 관례)

$v_{t} = \beta \, v_{t-1} + g_t$ $w_{t} = w_{t-1} - \eta \, v_t$

Gradient가 매번 흔들려도 v 가 이를 평활해 일관된 방향으로 이동. Ravine(깊은 골짜기) 형태의 손실 표면에서 특히 유용.

함수 momentum_step(w, g, v, lr, beta) 를 완성하세요.

코드 작성

Loading...

실행 결과

코드를 작성하고 Run 을 눌러보세요.