
38번 Gini 불순도 는 하나의 분포에 대해 계산했죠. 의사결정 나무 가 이 지표를 실제 사용 하는 방식은 분할 후 두 자식 노드의 Gini 를 샘플 수 가중 평균 합니다:
이 값이 작을수록 좋은 split — 자식 노드들이 더 "순수" 해진 것. 트리는 매 노드에서 이 지표를 최소화하는 feature/threshold 를 탐색합니다.
함수 weighted_gini_split(labels_left, labels_right) 를 완성하세요.
0.0 반환.| # | 이름 | 검증 |
|---|---|---|
| 1 | 완벽 분할 (각 자식 단일 클래스) | 0 |
| 2 | 한쪽 비어 있음 → 다른 쪽 Gini | |
| 3 | 균등 섞임 (각 자식 50/50) | 0.5 |
| 4 | 가중치 반영 | 큰 쪽이 작은 쪽보다 영향 ↑ |
| 5 | 수치 검증 | 손계산과 일치 |
코드를 작성하고 Run 을 눌러보세요.