반응형
▷Distances + Hierarchical Clustering (계층적 군집화)
계층적 군집화에 활용되는 Distances + Hierarchical Clustering 위젯이다. 두개를 묶어서 세트로 활용하는 경우가 많다. distances 위젯이 군집화 데이터 처리를 한다면, Hierarchical Clustering 위젯은 시각화하여 보여준다. 현재 크게 2가지 군집으로 나뉜것을 볼 수 있다.
▷Distances Matrix (계층적 군집화)
Distances Matrix 는 데이터 세트 요소와 요소 사이의 거래 행렬을 만들어 표현한다. 이를 통해 각 요소간의 분포 정도를 수치 데이터로 확인할 수 있다.
▷k-Means + Silhouette Plot (분할적 군집화 + 중심기반 )
마찮가지로 k-Means 가 분할적 군집화 데이터 처리를 맡는다면, Silhouette Plot 은 처리 결과의 시각화를 맡는다. 데이터 군집 내의 일관성을 그래픽으로 나타내는데 이때, 일관성(거리)을 측정하는 척도를 맨하탄거리 / 유클리드거리 / 코사인 거리 중에 고를 수 있다.
▷DBSCAN + Silhouette Plot (분할적 군집화 + 밀도기반 )
DBSCAN 으로 밀도 중심으로 군집화를 할 수 있다. 이때 이웃간 거리, 코어포인트 이웃의 수를 조절함으로서 데이터 군집화의 정도를 조절할 수 있다.
위는 DBSCAN 의 군집화 결과를 산포도로 나타낸 것인데, 현재 크게 3개의 군집으로 나눠진 것을 볼 수 있다.
반응형
'교육은 한 사람의 인생을 바꾼다 > AI교육' 카테고리의 다른 글
완전 초짜 ORANGE 3 : 지오코딩 (0) | 2021.09.05 |
---|---|
완전 초짜 ORANGE 3 : 내가 분석한 실습예제 (3) | 2021.09.04 |
완전 초짜 ORANGE 3 : 비지도학습(차원축소) (0) | 2021.09.02 |
완전 초짜 ORANGE 3 : 비지도학습 군집화 기초 (0) | 2021.09.01 |
완전 초짜 ORANGE 3 : 지도학습 모델 평가(회귀편) (0) | 2021.08.31 |
댓글