본문 바로가기
교육은 한 사람의 인생을 바꾼다/AI교육

완전 초짜 ORANGE 3 : 비지도학습 군집화 위젯

by 함께 만드는 블로그 2021. 9. 3.
반응형

▷Distances + Hierarchical Clustering (계층적 군집화)

계층적 군집화에 활용되는 Distances + Hierarchical Clustering 위젯이다. 두개를 묶어서 세트로 활용하는 경우가 많다. distances 위젯이 군집화 데이터 처리를 한다면, Hierarchical Clustering 위젯은 시각화하여 보여준다. 현재 크게 2가지 군집으로 나뉜것을 볼 수 있다.

 

 

▷Distances Matrix (계층적 군집화)

 

Distances Matrix 는 데이터 세트 요소와 요소 사이의 거래 행렬을 만들어 표현한다. 이를 통해 각 요소간의 분포 정도를 수치 데이터로 확인할 수 있다.

 

 

▷k-Means + Silhouette Plot (분할적 군집화 + 중심기반 )

마찮가지로 k-Means 가 분할적 군집화 데이터 처리를 맡는다면, Silhouette Plot 은 처리 결과의 시각화를 맡는다. 데이터 군집 내의 일관성을 그래픽으로 나타내는데 이때, 일관성(거리)을 측정하는 척도를 맨하탄거리 / 유클리드거리 / 코사인 거리 중에 고를 수 있다.

 

 

▷DBSCAN + Silhouette Plot (분할적 군집화 + 밀도기반 )

DBSCAN 으로 밀도 중심으로 군집화를 할 수 있다. 이때 이웃간 거리, 코어포인트 이웃의 수를 조절함으로서 데이터 군집화의 정도를 조절할 수 있다. 

 

 

위는 DBSCAN 의 군집화 결과를 산포도로 나타낸 것인데, 현재 크게 3개의 군집으로 나눠진 것을 볼 수 있다.

반응형

댓글