
v1 원-핫 은 정답에 1, 나머지에 0. 네트워크가 학습 중 과신뢰(overconfident) 하게 되는 원인 — logit 이 무한대로 발산해야 정답에 확률 1 이 부여됨.
Label Smoothing (Szegedy et al. 2016, Inception v3): 정답에 , 나머지에 분산:
함수 label_smooth(y, num_classes, epsilon) 를 완성하세요.
y shape (N,) 정수 [0, K).(N, K) float, 행합 = 1.K = num_classes
out = np.full((len(y), K), epsilon / (K - 1))
out[np.arange(len(y)), y] = 1 - epsilon
return out
| # | 이름 | 검증 |
|---|---|---|
| 1 | shape (N, K) | |
| 2 | 각 행 합 = 1 | 확률 분포 |
| 3 | ε=0 → 일반 one-hot | |
| 4 | 정답 확률 = 1-ε | |
| 5 | 비정답 확률 = ε/(K-1) | |
| 6 | 모든 원소 ∈ [0, 1] | |
| 7 | K=2 특수 케이스 (엔트리 모두 0.5) when ε=1 |
코드를 작성하고 Run 을 눌러보세요.