1. Select Columns
-Select Columns 위젯을 활용해 feature 들의 속성을 바꿀 수 있다.
Ignore | target | meta | skip |
-해당 데이터를 분석에서 제외 | -목표값으로 설정 | -제외하진 않지만, 분석에 영향을 주지 않게 설정 | -해당 데이터를 분석에서 제외 |
-이런 전처리(pre-process) 과정을 통해서 모델의 정확도와 효율성을 높일 수 있음.
-각종 변수들을의 가공여부에 따라 (변수를 feature / meta / skip 으로 설정하는 것) 모델의 구성 결과가 달라짐.
2. Scatter Plot
-scatter plot 위젯을 활용해 feature와 target(목표값)과의 관계를 시각적으로, 직관적으로 살펴볼 수 있음.
-X,Y 축을 변환시켜 데이터의 경향성을 살펴볼 수 있음.
-'Find Informative Projections' 기능을 사용하면 자동으로 최대 상관관계를 가진 2개의 feature 조합을 검색할 수 있음.
-비슷하게 속성 간의 관계를 시각화 할 수 있는 위젯이 rank 위젯. 기계학습에 반영할 핵심 속성을 추출하기 위해 점수를 산출하는 위젯.
-preprocess 위젯을 사용해 속성값을 정규화(normalize) 하는 과정을 거친 후 다른 모델을 적용하는 것이 좋음!
3. Prediction
-prediction 위젯은 학습 시킨 모델(알고리즘)로 데이터 셋을 분류, 예측해서 모델의 성능을 확인하는 위젯.
-가장 중요한 부분은 아래 모델의 정확도를 확인 할 수 있는 AUC / CA / F1 / Precision / Recall 부분
-분류 모델의 정확도를 보면 feature 간 상관관계의 유의미성을 알 수 있음.
-상관관계가 부족한 feature로는 계속 데이터 처리를 한다고 해도 의미 없음.
-분류 모델의 경우 위와 같은 지표로 분석하지만, 예측 모델의 경우 아래의 평가지표로 표현
**머신러닝(ML) 예측 모델의 평가지표
-MSE(Mean Squared Error) : 오차제곱의 평균
-RMSE(Root Mean Squared Error) : 루트 오차제곱 평균
-MAE(Mean Absoulte Error) : 평균절대오차 = 오차값들의 절대값의 평균을 낸 것
-R2 : R squared = 결정계수 = 분산기반 예측 성능 평가
0에 가까울수록 성능이 좋음 | MSE / RMSE / MAE |
1에 가까울수록 성능이 좋음 | R2 |
'교육은 한 사람의 인생을 바꾼다 > AI교육' 카테고리의 다른 글
인공신경망의 이해 : 인공신경망의 작동 원리 (1) | 2023.01.26 |
---|---|
인공신경망의 이해 : 생존이라는 강화학습 (0) | 2023.01.25 |
확률과 통계 기반의 다양한 AI 알고리즘 (0) | 2023.01.23 |
규칙 기반 분류 활동 (0) | 2023.01.22 |
인공지능 교육의 동향 및 변화 (0) | 2023.01.21 |
댓글