문제 해설

K-means++ 초기화

클러스터링 · easy

preview

30번 K-means 는 초기 centroid를 무작위 로 골랐죠. 이게 문제가 됩니다 — 재수 없으면 centroid 두 개가 같은 클러스터에 몰리고, 한 클러스터는 비어버려 최종 해가 나쁘게 수렴.

K-means++ 는 초기 centroid를 서로 멀리 퍼뜨리는 방식으로 개선합니다:

알고리즘

이론적으로 $O(\log k)$ 근사 보장 — 순진한 랜덤보다 훨씬 좋음. sklearn.cluster.KMeans 의 기본값도 init='k-means++'.

함수 kmeans_plus_plus_init(X, k, seed) 를 완성하세요.

코드 작성

Loading...

실행 결과

코드를 작성하고 Run 을 눌러보세요.