← 문제 목록/다수결 앙상블
문제 해설

다수결 앙상블

분류 · easy

preview

다수결 앙상블 (Hard Voting)

서로 다른 분류기 M 개의 예측을 다수결로 결합. 각 분류기가 독립적으로 틀릴 때, 앙상블은 대개 더 잘 맞추죠 — "많은 틀림이 모이면 맞음" 원리.

수식

각 샘플 ii 에 대해 MM 개 예측 y^i(1),,y^i(M)\hat{y}_i^{(1)}, \dots, \hat{y}_i^{(M)}:

y^iensemble=mode{y^i(1),,y^i(M)}\hat{y}_i^\text{ensemble} = \text{mode}\{\hat{y}_i^{(1)}, \dots, \hat{y}_i^{(M)}\}

언제 효과?

분류기들이 다양한 오류 패턴을 만들 때. 완전히 같은 모델을 두 번 써봐야 효과 없음. 다양성의 전형적 소스:

  • 서로 다른 학습 데이터 (bagging)
  • 서로 다른 특성 부분집합 (random forest)
  • 서로 다른 하이퍼파라미터
  • 서로 다른 알고리즘

과제

함수 majority_vote(preds) 를 완성하세요.

  • preds shape (M, N)M 개 분류기의 N 개 샘플에 대한 레이블 (정수 0 ~ K-1).
  • 반환: (N,) 정수 배열 — 각 샘플의 다수결 레이블.
  • 동점이면 가장 작은 정수 레이블 선택 (np.bincount + argmax 가 그렇게 동작).

테스트 케이스

#이름검증
1shape(N,)
2만장일치 → 그 레이블
3과반수 승리[0,0,0,1,1]0
4알려진 케이스손계산
5동점 시 최소 레이블
코드 작성
Loading...
실행 결과

코드를 작성하고 Run 을 눌러보세요.