← 문제 목록/Median Centroid (L1 최소화) [medium]
문제 해설

Median Centroid (L1 최소화) [medium]

선형 분류 · medium

preview

Median Centroid (L1) [medium]

v1 L1 centroid 는 "mean centroid + L1 distance" 였음 — 이론적으로 일관되지 않음. L1L_1 거리를 최소화 하는 점은 평균이 아니라 중앙값:

argmincixic=median(x1,,xn)\arg\min_c \sum_i |x_i - c| = \text{median}(x_1, \ldots, x_n)

다변량 L1 은 좌표별 중앙값 (geometric median 과 다름; 여기선 feature-wise median).

왜 중요한가

  • 이상치에 강건: 평균은 한 개 이상치에도 흔들리지만, 중앙값은 거의 영향 없음.
  • L1L_1 거리와 이론적 일관성: 거리와 centroid 가 같은 손실 (절댓값) 을 최소화.

알고리즘

  1. 각 클래스 cc 에 대해: μ~c=median(Xy=c,axis=0)\tilde\mu_c = \text{median}(X_{y=c}, \text{axis}=0)
  2. xx 와 각 μ~c\tilde\mu_cL1L_1 거리 argmin.

Mean vs Median centroid

이상치 한 점 추가 시:

mean centroidmedian centroid
원본영향 없음영향 없음
1 outlier (×100)크게 이동거의 그대로

과제

함수 predict_l1_median_centroid(X_train, y_train, X_test) 를 완성하세요.

  • 반환: (M,) 정수.
  • 각 클래스 median per-feature 로 centroid.
  • L1 거리 argmin.

테스트 케이스

#이름검증
1shape (M,)
2잘 분리된 2 클래스 → 100%
3이상치 포함 데이터에서 mean centroid 보다 정확도 ≥
4median centroid 는 feature-wise median 값수치적 검증
5중복 인스턴스에도 안정
63 클래스 분리 가능 → 높은 정확도
7동일 seed 재현 결과 일관성
코드 작성
Loading...
실행 결과

코드를 작성하고 Run 을 눌러보세요.