
Bootstrap(56번) 으로 크기 n 샘플을 만들면, 원본 인덱스 중 약 36.8% 는 한 번도 안 뽑힙니다. 이 OOB 샘플 은 별도의 validation 없이도 모델을 평가할 수 있는 공짜 holdout 입니다 — Random Forest 의 "OOB 점수" 의 정체.
함수 oob_mask(n, sample_indices) 를 완성하세요.
n: 원본 크기.sample_indices: 부트스트랩에서 뽑힌 인덱스 배열 (중복·누락 가능).(n,) 불리언 — True 면 해당 원본 인덱스가 OOB (샘플에 없음).mask = np.ones(n, dtype=bool)
mask[sample_indices] = False
또는 np.isin 을 반대 방향으로.
| # | 이름 | 검증 |
|---|---|---|
| 1 | shape (n,) 불리언 | |
| 2 | 샘플에 있는 인덱스 → False | |
| 3 | 샘플에 없는 인덱스 → True | |
| 4 | OOB 비율 (큰 n, 기본 부트스트랩) | ≈ 0.368 |
| 5 | 빈 샘플 → 모두 True |
코드를 작성하고 Run 을 눌러보세요.