
v1 value clip 은 고정 경계 . 실무에선 경계를 데이터로부터 자동 으로 잡는 게 더 robust — 이것이 Winsorization (Charles Winsor 이름):
Winsorization 이 N 보존하므로 downstream 분석 (변형된 t-test, 회귀 등) 에 더 적합.
함수 winsorize(x, p) 를 완성하세요.
x shape (N,) 또는 더 높은 차원 (axis 고려 없이 전체 quantile).p: 양쪽 꼬리 비율, 0 ≤ p < 0.5.lo = np.quantile(x, p); hi = np.quantile(x, 1-p); return np.clip(x, lo, hi).| # | 이름 | 검증 |
|---|---|---|
| 1 | shape 유지 | |
| 2 | p=0 → 원본 그대로 | |
| 3 | p=0.5 → 모두 중앙값 | 양끝 경계가 같은 값 |
| 4 | 극단값 안전 처리 | outlier 가 경계값으로 대체 |
| 5 | 평균 robustness: mean(winsorized) 는 원본 mean 보다 outlier 덜 반영 | |
| 6 | scipy winsorize 와 일치 | |
| 7 | 정렬된 입력에서 경계 인덱스 정확 |
코드를 작성하고 Run 을 눌러보세요.