문제 해설

RMSProp 한 스텝

최적화 · easy

preview

Momentum(72) 은 gradient 방향을 평활. RMSProp은 gradient의 크기(제곱) 를 평활해 차원별로 학습률을 자동 조절 합니다 — 스케일이 제각각인 특성에 강함.

업데이트 규칙 (Tieleman, 2012)

$s_t = \beta \, s_{t-1} + (1-\beta) \, g_t^2$ $w_t = w_{t-1} - \frac{\eta}{\sqrt{s_t} + \epsilon} \, g_t$

Adam 의 2차 모멘트 업데이트 ( $v$ ) 와 동일한 공식 — RMSProp 은 Adam 의 직계 조상.

함수 rmsprop_step(w, g, s, lr, beta, eps) 를 완성하세요.

코드 작성

Loading...

실행 결과

코드를 작성하고 Run 을 눌러보세요.