-범주형 데이터의 경우 분류를 활용하기 때문에 전 포스팅에서 보았던 분류 모델들을 활용하면 된다.(k-NN / Tree / Logistic Regression / 등)
-그러나 수치형 데이터(Numeric)를 지도학습 하기 위해선 회귀분석을 주로 사용한다.
-방법은 다를게 하나도 없다. 위 그림의 지도학습 부분에 회귀분석 모델을 사용하면 된다. 나머지 부분을 동일하게 진행된다.
-한 가지만 더;;^^ 모델 성능을 평가하는 지표들도 살짝 달라지게 되는데...
▷회귀분석 모델 평가
-회귀분석의 모델을 평가하는데 필요한 지표들을 알아보자.
-MAE : (예측값 - 실측값) 의 평균 / Mean Absolute Error
-MSE : (예측값 - 실측값)2 의 평균 / Mean Square Error
-RMSE : MSE에 루트(제곱근) 값
-R2(제곱) : 1- (예측값과 실제값 평균의 차의 제곱의 합) / ( 실측값과 실제값 평균의 차의 제곱의 합)
-수식으로 눈 앞이 깜깜해진다면 걱정하지 말자. 그냥 MSE/MAE/RMSE 는 0에 가까울수록, R2는 1에 가까울수록 좋은 모델이다!!
Linear Regression 선형 회귀분석을 이용할 경우, Prediction에 이렇게 방금 본 지표들이 나온다! 여러개의 모델을 넣으면 저 지표들을 활용해 최적의 모델을 선택할 수 있다.
▷상관관계 파악
-피어슨 상관계수 : 두 변수 간 선형성이 얼마나 강한지 보여줌
-스피어만 상관계수 : 순서형 변수 사이에 상관관계를 나타냄
>>Correlation
-서로 다른 변수들 사이에 어떤 상관관계를 가지는지 파악해야할 때가 있다. 그럴 땐 Correlation 위젯을 사용하면 된다. 피어슨 상관 계수와, 스피어만 상관 계수를 볼 수 있는데, 순서형 변수라면 스피어만 상관 계수를 참고한다.
-모두 -1~1사이에 값을 가지는데, -1이면 음의 상관관계 / 1이면 양의 상관관계를 가지고 / 0이면 아무 관계성이 없는 것이다.
'교육은 한 사람의 인생을 바꾼다 > AI교육' 카테고리의 다른 글
완전 초짜 ORANGE 3 : 비지도학습(차원축소) (0) | 2021.09.02 |
---|---|
완전 초짜 ORANGE 3 : 비지도학습 군집화 기초 (0) | 2021.09.01 |
완전 초짜 ORANGE 3 : 지도학습 모델 평가 (1) | 2021.08.30 |
완전 초짜 ORANGE 3 : 지도학습 (0) | 2021.08.29 |
완전 초짜 ORANGE 3 : 다양한 위젯으로 데이터 분석 (0) | 2021.08.28 |
댓글