본문 바로가기
교육은 한 사람의 인생을 바꾼다/AI교육

오렌지(orange) 머신러닝 핵심 위젯 파악

by 함께 만드는 블로그 2023. 1. 24.
반응형

1. Select Columns

 
 -Select Columns 위젯을 활용해 feature 들의 속성을 바꿀 수 있다. 

Ignoretargetmetaskip
-해당 데이터를 분석에서 제외-목표값으로 설정-제외하진 않지만, 분석에 영향을 주지 않게 설정-해당 데이터를 분석에서 제외

 -이런 전처리(pre-process) 과정을 통해서 모델의 정확도와 효율성을 높일 수 있음.
 -각종 변수들을의 가공여부에 따라 (변수를 feature / meta / skip 으로 설정하는 것) 모델의 구성 결과가 달라짐.
 

2. Scatter Plot

 -scatter plot 위젯을 활용해 feature와 target(목표값)과의 관계를 시각적으로, 직관적으로 살펴볼 수 있음.
 -X,Y 축을 변환시켜 데이터의 경향성을 살펴볼 수 있음.
 -'Find Informative Projections' 기능을 사용하면 자동으로 최대 상관관계를 가진 2개의 feature 조합을 검색할 수 있음. 
 -비슷하게 속성 간의 관계를 시각화 할 수 있는 위젯이 rank 위젯. 기계학습에 반영할 핵심 속성을 추출하기 위해 점수를 산출하는 위젯.
 -preprocess 위젯을 사용해 속성값을 정규화(normalize) 하는 과정을 거친 후 다른 모델을 적용하는 것이 좋음!
 

 3. Prediction

 -prediction 위젯은 학습 시킨 모델(알고리즘)로 데이터 셋을 분류, 예측해서 모델의 성능을 확인하는 위젯.
 -가장 중요한 부분은 아래 모델의 정확도를 확인 할 수 있는 AUC / CA / F1 / Precision / Recall 부분
 -분류 모델의 정확도를 보면 feature 간 상관관계의 유의미성을 알 수 있음.
 -상관관계가 부족한 feature로는 계속 데이터 처리를 한다고 해도 의미 없음.
 -분류 모델의 경우 위와 같은 지표로 분석하지만, 예측 모델의 경우 아래의 평가지표로 표현
 

**머신러닝(ML) 예측 모델의 평가지표

 -MSE(Mean Squared Error) : 오차제곱의 평균
 -RMSE(Root Mean Squared Error) : 루트 오차제곱 평균
 -MAE(Mean Absoulte Error) : 평균절대오차 = 오차값들의 절대값의 평균을 낸 것
 -R2 : R squared = 결정계수 = 분산기반 예측 성능 평가 

0에 가까울수록 성능이 좋음MSE / RMSE / MAE 
1에 가까울수록 성능이 좋음R2

 
 
 
 
 
 
 
 
 
 
 
 
 

반응형

댓글