
57번 OOB 마스크 로 각 모델의 OOB 샘플을 알았다면, Random Forest 의 OOB 점수 는 이렇게 계산됩니다:
샘플 의 OOB 예측 = 가 OOB 였던 모델들의 평균/다수결.
이걸 전체 데이터에 대해 모으면 별도 validation 없이 일반화 성능 추정 완료.
= "샘플 를 학습에 안 쓴 모델들".
NaN 반환.함수 oob_aggregate(preds, sample_indices_list) 를 완성하세요.
preds shape (M, N) — M개 모델의 N개 원본 샘플에 대한 예측.sample_indices_list: 길이 M 리스트. 각 원소는 해당 모델이 학습에 사용한 bootstrap 인덱스 배열.(N,) float — 각 샘플의 OOB 평균 예측. 해당 모델 없으면 np.nan.| # | 이름 | 검증 |
|---|---|---|
| 1 | shape (N,) | |
| 2 | 한 샘플이 모든 모델의 OOB → 평균 | |
| 3 | 한 샘플이 아무 모델의 OOB 아님 → NaN | |
| 4 | 부분적 OOB → 해당 모델만 평균 | |
| 5 | 큰 M → NaN 거의 없음 |
코드를 작성하고 Run 을 눌러보세요.