혼동행렬(Confusion Matrix)
•
혼동행렬
◦
참과 거짓
▪
참(True) : 실제값과 예측값이 같은 경우
▪
거짓(False) : 실제값과 예측값이 다른 경우
◦
양성(1)과 음성(0)
▪
양성(Positive) : 어떤 데이터에 대해서 1이라고 하는 것
▪
음성(Negative) : 어떤 데이터에 대해서 0이라고 하는 것
◦
평가
▪
TP : 예측값과 실제값이 둘다 양성으로 나타난 것
▪
FP : 실제값이 음성인데 예측값이 양성이라고 나타난 것
▪
FN : 예측값과 실제값이 둘다 음성으로 나타난 것
▪
TN : 실제값이 양성인데 예측값이 음성이라고 나타난 것
정분류율(Accuracy)
•
전체 데이터 중에서 양성은 양성으로 음성은 음성으로 정확하게 분류한 비율
오분류율(Error Rate)
•
전체 데이터 중에서 모델이 틀린 비율 양성은 음성으로 음성은 양성으로 틀리게 분류한 비율
민감도(Sensitivity) / 재현율(Recall)
•
얼마나 모델이 ‘민감’하게 잘 반응했나
특이도(Specificity)
•
음성인 값 중 모델이 음성으로 잘 예측한 값
•
보통은 양성에 관심이 많지만 ‘특이’하게도 음성인 사람들도 궁금한 정도
정확도(Precision)
•
모델이 양성으로 예측한 값들 중 정확하게 양성으로 예측 한 값