
v1 LayerNorm 은 평균 뺀 후 std 로 나눔. RMSNorm (Zhang & Sennrich 2019) 은 평균 빼기 생략 — RMS 로만 정규화:
| LayerNorm | RMSNorm | |
|---|---|---|
| Mean centering | 없음 | |
| Scale | ||
| Bias | 예 | 없음 (대부분 구현) |
| 계산 | mean + var = 2 pass | RMS = 1 pass |
| 속도 | 기준 | ~7% 빠름 |
| 성능 | 표준 | 동등/우수 (실험 기반) |
함수 rms_norm(x, gamma, eps) 를 완성하세요.
x shape (N, D).gamma shape (D,).(N, D).| # | 이름 | 검증 |
|---|---|---|
| 1 | shape 유지 | |
| 2 | γ=1 → 각 행의 RMS = 1 근처 (mean 은 0 아님) | |
| 3 | 수치 예제: x=[3, 4], γ=1 → RMS=5/√2, 출력 [3/5·√2, 4/5·√2] | |
| 4 | γ 스케일 효과 | |
| 5 | LayerNorm 과 다름 (mean != 0 데이터) | |
| 6 | eps 안전: x=0 → NaN 없음 | |
| 7 | 상수 행에서 finite |
코드를 작성하고 Run 을 눌러보세요.