[혼공학습단 10기] 5주차 미션 : Chapter 06

혼공학습단/혼자 공부하는 머신러닝+딥러닝

[혼공학습단 10기] 5주차 미션 : Chapter 06

so0_0 2023. 8. 14. 00:19

5주차 미션은 무엇일까요?

[기본 미션]
k-평균 알고리즘 작동 방식 설명하기
[선택 미션]
Ch.06(06-3) 확인 문제 풀고, 풀이 과정 정리하기

[기본 미션]

k-평균 알고리즘 작동 방식 설명하기

k-평균 알고리즘: 먼저 랜덤하게 클러스터 중심을 정하고 클러스터를 만든 다음에 클러스터의 중심을 이동하고 다시 클러스터를 만드는 방식으로 반복해서 최적의 클러스터를 구성하는 알고리즘

➡️ KMeans: k-평균 알고리즘 클래스
✔️ n_cluster: 클러스터 개수를 지정(기본값:8)
✔️ n_init: 랜덤하게 센트로이드를 초기화하는 반복 횟수 지정(기본값: 10)
✔️ max_iter: k-평균 알고리즘의 한 번 실행에서 최적의 센트로이드를 찾기 위해 반복할 수 있는 최대 횟수(기본값: 200)

k-평균 알고리즘 작동 방식

무작위로 k개의 클러스터 중심을 정함
각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정
클러스터에 속한 샘플의 평균값을 클러스터 중심을 변경함
➡️ 클러스터 중심 또는 센트로이드(centroid): k-평균 알고리즘이 만든 클러스터에 속한 샘플의 특성 평균값
클러스터 중심에 변환가 없을 때까지 2번으로 돌아가 반복함

[선택 미션]

Ch.06(06-3) 확인 문제 풀고, 풀이 과정 정리하기

확인 문제 1. 답: ② 20개

특성의 개수 = 주성분 개수

확인 문제 2. 답: ① (1000, 10)

10개의 주성분을 찾아서 변환함 즉, 샘플 개수 1000개 그대로 유지하고 특성의 개수만 100개에서 10개로 바뀜

확인 문제 3. 답: ① 첫 번째 주성분

주성분 분석은 분산이 가장 큰 방향부터 순서대로 찾기 때문에 첫 번째 주성분이 가장 분산이 큼

출처: 한빛미디어, 혼자 공부하는 머신러닝+딥러닝