본문 바로가기
교육은 한 사람의 인생을 바꾼다/AI교육

완전 초짜 ORANGE 3 : 연관 분석

by 함께 만드는 블로그 2021. 9. 6.
반응형

▷연관 분석(Association Analysis)

-비지도 학습의 하나 = 연관된 정보를 찾아가는 분석.

-장바구니 분석 / 서열 분석.

-데이터 사이의 순서와 상관관계를 살펴봄.

-주로 기업이 구매 패턴을 분석 시 사용.

-장비구니 분석 예 : 월마트 분석 = 20, 30대의 남자가 마트를 갈 때 기저귀와 맥주를 함께 구입한다. / 남자가 마트를 갈 때는 주로 아내의 심부름으로 가는 경우가 많음. 그래서 아기 기저귀를 사고 자신이 마실 맥주를 함께 구입하는 것.

-서열 분석 예 : A 를 산 다음에 B를 산다 >> 보험사의 부정행위 적발

 

 

▷연관성 규칙(Association Rule)

-조건과 반응 : if A then B / A → B 이고, B → C 라면 A → C 일거라는 것 / 이때 A가 B의 원인인 것은 아닌, 상호성임.

-연관성 규칙의 유형 

 1) Useful Result(유용한 결과) : 마케팅에 사용할 수 있는 유용한 결과

 2) Trivial Result(사소한 결과) : 일반적 상식 or 기 연구 결과

 3) Inexplicable Result(불가해한 결과) : 의미를 발견하기 위해 많은 고민 필요 

  Explainable (설명 가능성) Actionable (실행 가능성)
Useful Result(유용한 결과)
Trivial Result(사소한 결과) ×
Inexplicable Result(불가해한 결과) × ×

 

 

▷연관성 규칙의 측도(성능평가)

-지지도(Support) : 전체 거래 항목 중 A와 B를 동시에 포함하는 거래 비율

-신뢰도(Confidence) : 상품 A를 포함하는 거래 중 B를 같이 살 조건부 확률 / 유용성과 관련 높음

-향상도(Lift) : B만 샀을 때, A 구매 후 B를 구매할 확률의 증가비

-신뢰도가 높으면 좋지만, 그게 최선의 연관성 규칙이라는 뜻은 아님.

-신뢰도와 지지도는 우연히 높게 나올 수도 있음. / 따라서 향상도를 꼭 고려해야 함.

-향상도는 1보다 커야 연관성이 있다는 뜻.

-신뢰도가 높은 경우, A → B 에서 B를 사는 확률이 높아야 규칙이 의미를 가짐.

 

 

▷연관성 분석 위젯

 

 

▷Frequent Itemsets

자주 함께 나타나는 집합을 탐색하는 위젯. 위의 예시를 통해 보면 전체 data에서 Fresh Vegetables 가 가장 많이 등장했으며, 그와 함께 가장 많이 등장한 것이 Fresh Fruit 인 걸 알 수 있다. 그리고 Fresh Fruit과는 Dried Fruit, Wine 등이 많이 연관된다는 걸 알 수 있다.

 

 

▷Association Rule

데이터로부터 연결성 규칙을 유도하는 위젯. 좌측에서는 각 규칙의 지지도 / 신뢰도 / 향상도를 확인할 수 있고, 우측에서는 선행사건과 후행사건으로 연결된 규칙을 확인할 수 있다.

반응형

댓글