
2-Layer MLP(84) 는 ReLU 를 썼죠. 이번엔 tanh 로 교체:
| 활성 | 출력 범위 | 0 근처 gradient | 포화 |
|---|---|---|---|
| ReLU | [0, ∞) | 1 (양수 영역) | 음수 영역 0 |
| tanh | (-1, 1) | 크다 | 양끝 포화 (vanishing grad) |
함수 mlp_forward_tanh(X, W1, b1, W2, b2) 를 완성하세요.
np.tanh 사용.| # | 이름 | 검증 |
|---|---|---|
| 1 | shape (N, D_out) | |
| 2 | W1=0, b1=0 → h=tanh(0)=0 → y=b2 | |
| 3 | 음수 은닉값도 통과 (ReLU와 차이) | 기대 수식 일치 |
| 4 | 은닉값 범위 (-1, 1) | |
| 5 | 알려진 toy 값 |
코드를 작성하고 Run 을 눌러보세요.