
GELU(96) 와 형제 — 역시 "ReLU 의 부드러운 버전". EfficientNet, Llama, Gemma 등 현대 아키텍처의 표준 활성화.
여기서 는 sigmoid-v1. "Swish" 라는 이름으로도 불림 (β=1).
max diff ≈ 0.02) — 이 문제 시각화에서 직접 비교.함수 silu(x) 를 완성하세요.
exp 오버플로) 을 위해 sigmoid-v1 는 직접 작성하지 말고 np.where / scipy.special.expit / 안정식 사용을 권장.안정한 sigmoid-v1:
def _sigmoid-v1(x):
return np.where(x >= 0,
1.0 / (1.0 + np.exp(-x)),
np.exp(x) / (1.0 + np.exp(x)))
| # | 이름 | 검증 |
|---|---|---|
| 1 | shape 보존 | |
| 2 | silu(0) = 0 | |
| 3 | 큰 양수 → ≈ x | |
| 4 | 큰 음수 → ≈ 0 | silu(-30) 가 inf/nan 아님 |
| 5 | 공식 일치 | x · σ(x) ref 비교 |
코드를 작성하고 Run 을 눌러보세요.