
딥러닝 학습 중 그래디언트 폭발을 막는 표준 기법. 벡터의 L2 노름이 한계 max_norm 을 넘으면 방향은 유지한 채 크기만 줄입니다:
c 로 스케일)torch.nn.utils.clip_grad_norm_, tf.clip_by_norm 으로 기본 제공함수 clip_by_norm(x, max_norm) 을 완성하세요.
x.| # | 이름 | 검증 |
|---|---|---|
| 1 | 작은 norm → 원래 그대로 | [0.3, 0.4], max=1 → [0.3, 0.4] |
| 2 | 큰 norm → 스케일 | [3, 4], max=1 → 노름 1 |
| 3 | 방향 보존 | clipped와 원래 벡터가 같은 방향 (양의 스칼라 배) |
| 4 | 영벡터 | [0, 0] → [0, 0] (NaN 없음) |
| 5 | max_norm 정확히 도달 | [3, 4], max=2 → 노름 정확히 2 |
코드를 작성하고 Run 을 눌러보세요.