
경사하강법(5번) 에 관성을 추가한 고전 옵티마이저. 이전 이동 방향이 "속도" 로 쌓여 지그재그를 덜 하고 최적점에 더 부드럽게 도달합니다. 신경망 학습 초창기의 워크호스.
Gradient가 매번 흔들려도 v 가 이를 평활해 일관된 방향으로 이동. Ravine(깊은 골짜기) 형태의 손실 표면에서 특히 유용.
함수 momentum_step(w, g, v, lr, beta) 를 완성하세요.
(w_new, v_new) 튜플.| # | 이름 | 검증 |
|---|---|---|
| 1 | v_new = β·v + g | |
| 2 | w_new = w - lr·v_new | |
| 3 | β=0 → plain SGD | w_new = w - lr·g |
| 4 | shape 유지 | 벡터 입력 |
| 5 | 여러 스텝 누적 | v 가 g 방향으로 쌓임 |
코드를 작성하고 Run 을 눌러보세요.