본문 바로가기
교육은 한 사람의 인생을 바꾼다/AI교육

완전 초짜 ORANGE 3 : 지도학습 모델 평가(회귀편)

by 함께 만드는 블로그 2021. 8. 31.
반응형

-범주형 데이터의 경우 분류를 활용하기 때문에 전 포스팅에서 보았던 분류 모델들을 활용하면 된다.(k-NN / Tree / Logistic Regression / 등)

-그러나 수치형 데이터(Numeric)를 지도학습 하기 위해선 회귀분석을 주로 사용한다. 

 

-방법은 다를게 하나도 없다. 위 그림의 지도학습 부분에 회귀분석 모델을 사용하면 된다. 나머지 부분을 동일하게 진행된다.

-한 가지만 더;;^^ 모델 성능을 평가하는 지표들도 살짝 달라지게 되는데...

 

 

▷회귀분석 모델 평가

-회귀분석의 모델을 평가하는데 필요한 지표들을 알아보자.

-MAE : (예측값 - 실측값) 의 평균 / Mean Absolute Error

-MSE : (예측값 - 실측값)2 의 평균 / Mean Square Error

-RMSE : MSE에 루트(제곱근) 값

-R2(제곱) : 1- (예측값과 실제값 평균의 차의 제곱의 합) / ( 실측값과 실제값 평균의 차의 제곱의 합)

-수식으로 눈 앞이 깜깜해진다면 걱정하지 말자. 그냥 MSE/MAE/RMSE 는 0에 가까울수록, R2는 1에 가까울수록 좋은 모델이다!!

Linear Regression 선형 회귀분석을 이용할 경우, Prediction에 이렇게 방금 본 지표들이 나온다! 여러개의 모델을 넣으면 저 지표들을 활용해 최적의 모델을 선택할 수 있다.

 

 

▷상관관계 파악

-피어슨 상관계수 : 두 변수 간 선형성이 얼마나 강한지 보여줌

-스피어만 상관계수 :  순서형 변수 사이에 상관관계를 나타냄

 

>>Correlation

-서로 다른 변수들 사이에 어떤 상관관계를 가지는지 파악해야할 때가 있다. 그럴 땐 Correlation 위젯을 사용하면 된다. 피어슨 상관 계수와, 스피어만 상관 계수를 볼 수 있는데, 순서형 변수라면 스피어만 상관 계수를 참고한다. 

-모두 -1~1사이에 값을 가지는데, -1이면 음의 상관관계 / 1이면 양의 상관관계를 가지고 / 0이면 아무 관계성이 없는 것이다. 

반응형

댓글