2022 AI SW 온라인 교육/AI 데이터 분석 트랙

[AI 데이터 분석] 머신러닝 시작하기 - 04. 지도학습 - 분류

parkes811 2022. 12. 15. 22:21
01 분류 개념 알아보기

 

  • 예시로 보는 분류 개념 알아보기 

 

  • 문제 정의와 해결 방안

 

  • 분류란?

 

  • 항공 지연 문제 해결하기

 

  • 분류 알고리즘을 사용하는 다양한 머신러닝 모델

 

02 의사결정나무 - 모델구조

 

  • 의사결정나무 ( Decision Tree )란?

 

  • 항공 지연 데이터로 보는 의사결정나무

  • 중간 마디 추가하기 

 

- 기준을 추가할 때는 중간 마디를 만들어 한번 더 분류한다.

 

  • 2개 이상의 feature 데이터의 경우

 

  • 의사결정나무 구조 

 

 

03 분류 평가 지표

 

  • 혼동 행렬 ( Confusion Matrix )

- 분류 모델의 성능을 평가하기 위해서 기본적인 지표들을 계산하는 행렬이다.

- True Positive : 실제 Positive인 값을 Positive라고 예측 ( 정답 )

- True Negative : 실제 Negative인 값을 Negative라고 예측 ( 정답 )

 

- False Positive : 실제 Negative인 값을 Positive라고 예측 ( 오답 ) - 1형 오류

- False Negative : 실제 Positive인 값을 Negative라고 예측 ( 오답 ) - 2형 오류

 

  • 정확도 ( Accuracy )

 

  • 정밀도 ( Precision )

 

  • 재현율 ( Recall, TPR )

 

  • 다양한 분류 지표의 활용