
ReLU 네트워크 용 가중치 초기화 기법. He et al. (2015) 가 제안. 각 층의 활성화 분산이 층마다 균일하게 유지되도록 설계:
즉 표준편차 = , fan_in 은 입력 뉴런 수.
std = sqrt(1 / fan_in) — tanh/sigmoid-v1 용std = sqrt(2 / fan_in) — ReLU 용 (두 배)함수 he_init(fan_in, fan_out, seed) 를 완성하세요.
fan_in, fan_out: 정수.(fan_in, fan_out) 가중치 행렬.rng.normal(0, std, size=...) 사용, std = sqrt(2 / fan_in).| # | 이름 | 검증 |
|---|---|---|
| 1 | shape (fan_in, fan_out) | |
| 2 | 평균 ≈ 0 (큰 크기) | |
| 3 | 표준편차 ≈ √(2/fan_in) | |
| 4 | 시드 재현성 | |
| 5 | 다른 fan_in → 다른 std |
코드를 작성하고 Run 을 눌러보세요.