
선형층 Forward(82) 의 역전파. 상위 gradient dY 가 주어지면, 파라미터와 입력에 대한 그래디언트를 계산:
연쇄법칙:
Shape 체크:
dY: (N, D_out)dX: (N, D_in) ← dY @ W.TdW: (D_in, D_out) ← X.T @ dYdb: (D_out,) ← dY.sum(axis=0)함수 linear_backward(dY, X, W) 를 완성하세요.
(dX, dW, db).| # | 이름 | 검증 |
|---|---|---|
| 1 | dX shape | (N, D_in) |
| 2 | dW shape | (D_in, D_out) |
| 3 | db shape | (D_out,) |
| 4 | dX = dY @ W.T | |
| 5 | dW = X.T @ dY | |
| 6 | db = dY.sum(axis=0) |
코드를 작성하고 Run 을 눌러보세요.