← 문제 목록/부트스트랩 샘플링
문제 해설

부트스트랩 샘플링

데이터 전처리 · easy

preview

부트스트랩 샘플링 (Bootstrap)

원본 데이터에서 크기 n 의 새 표본을 복원추출 로 만드는 기법. Bagging, Random Forest, 통계적 오차 추정의 기본 도구.

핵심 성질

  • 일부 샘플이 여러 번 뽑힘.
  • 일부 샘플은 전혀 안 뽑힘 (OOB, Out-Of-Bag).
  • 매우 큰 nn 에서 OOB 비율은 1(11/n)n1e10.3681 - (1 - 1/n)^n \to 1 - e^{-1} \approx 0.368.

활용

  • Bagging: 여러 부트스트랩 셋에 각각 모델 학습 → 앙상블.
  • OOB 평가: 샘플 ii 를 쓰지 않은 모델들의 예측으로 ii 평가. 별도 val set 불필요.

과제

함수 bootstrap_indices(n, seed) 를 완성하세요.

  • 반환: shape (n,) 정수 배열 — [0, n) 범위에서 복원추출.
  • np.random.default_rng(seed).integers(0, n, size=n) 로 한 줄.

테스트 케이스

#이름검증
1shape (n,)
2값 범위 [0, n)
3중복 존재 확률n ≥ 10 일 때 고유값 개수 < n
4OOB 존재일부 인덱스 누락
5시드 재현성
코드 작성
Loading...
실행 결과

코드를 작성하고 Run 을 눌러보세요.