
v1 temperature softmax 는 전체 어휘에 확률을 부여. LLM 생성 실무에선 top-p (nucleus) sampling (Holtzman et al. 2020) 이 표준 — 누적 확률이 를 넘는 가장 작은 토큰 집합만 남기고 나머지는 0.
함수 nucleus_probs(logits, p=0.9, T=1.0) 를 완성하세요.
logits shape (V,).(V,), 합 = 1, 유지되지 않는 토큰은 정확히 0.| # | 이름 | 검증 |
|---|---|---|
| 1 | 합 = 1 | 재정규화 확인 |
| 2 | 모든 값 ≥ 0 | |
| 3 | p=1.0 → 모든 토큰 유지 | softmax 와 동일 |
| 4 | p 매우 작음 → argmax one-hot | |
| 5 | 제외된 토큰 = 정확히 0 | strict 0 |
| 6 | p 단조: p↑ → nonzero 개수 ≥ | |
| 7 | T 효과: T↑ → nucleus 커짐 |
코드를 작성하고 Run 을 눌러보세요.