문제 해설

OOB 마스크

데이터 전처리 · easy

preview

OOB (Out-Of-Bag) 마스크

Bootstrap(56번) 으로 크기 n 샘플을 만들면, 원본 인덱스 중 약 36.8% 는 한 번도 안 뽑힙니다. 이 OOB 샘플 은 별도의 validation 없이도 모델을 평가할 수 있는 공짜 holdout 입니다 — Random Forest 의 "OOB 점수" 의 정체.

과제

함수 oob_mask(n, sample_indices) 를 완성하세요.

n: 원본 크기.
sample_indices: 부트스트랩에서 뽑힌 인덱스 배열 (중복·누락 가능).
반환: shape (n,) 불리언 — True 면 해당 원본 인덱스가 OOB (샘플에 없음).

힌트

mask = np.ones(n, dtype=bool)
mask[sample_indices] = False

또는 np.isin 을 반대 방향으로.

테스트 케이스

#	이름	검증
1	shape `(n,)` 불리언
2	샘플에 있는 인덱스 → False
3	샘플에 없는 인덱스 → True
4	OOB 비율 (큰 n, 기본 부트스트랩)	≈ 0.368
5	빈 샘플 → 모두 True

코드 작성

Loading...

실행 결과

코드를 작성하고 Run 을 눌러보세요.