빅데이터 분석기사

[빅데이터 분석기사] 정확도, 정밀도, 재현율, F1 Score 구하기

jooona 2022. 11. 11. 19:02
반응형

빅데이터 분석기사 예상문제로 꼭 등장하는 정확도, 재현율, 정밀도, F1 Score를 구하는 방법을 알아보도록 하겠습니다.

 

우선 정확도, 재현율, 정밀도, F1 Score를 구하기 위해서는 각각이 어떤 의미를 가지는 지 알아야겠죠?

머신 러닝 학습 후 테스트를 진행했다고 가정해 보겠습니다.
테스트의 결과로 다음과 같은 표를 얻을 수 있습니다.

 

    실제 정답
    True False
분류 결과 True True Positive (TP) False Positive (FP)
False False Negative (FN) True Negative (TN)

 


True Positive(TP): 모델이 True라고 예측했고, 실제로도 True인 경우
True Negative(TN): 모델이 False라고 예측했고, 실제로도 False인 경우
False Positive(FP): 모델이 True라고 예측했지만, 실제로는 False인 경우
False Negative(FN): 모델이 False라고 예측했지만, 실제로는 True인 경우

이 아래로는 편의상 괄호 안에 있는 약자로 표기하겠습니다.

이 중 TP와 TN는 모델이 정답을 맞힌 것이고, FP와 FN는 모델이 정답을 맞히지 못한 경우입니다.

여기서 정확도, 정밀도, 재현율, F1 Score를 구해낼 수 있습니다.

 

 

정확도

정확도(Accuracy): 전체 데이터 중 올바르게 예측한 비율

 

 

정밀도

정밀도(Precision): 모델이 True라고 예측한 데이터 중 실제로 True인 비율

 

 

재현율

재현율(Recall): 실제로 True인 데이터를 모델이 True라고 인식한 비율

 

 

F1 Score

재현율과 정밀도를 이용하면 F1 Score를 얻어낼 수 있습니다. F1 Score는 재현율과 정밀도의 조화 평균으로, 값이 높을수록 좋은 모델이라고 볼 수 있습니다.

 

 

 

예시

    실제 정답
    True False
분류 결과 True 40 20
False 10 30


정확도: 70 / 100 = 0.7
정밀도: 40 / 60 = 0.6 (원래는 0.666...인데 편의상 0.6으로 하겠습니다.)
재현율: 40 / 50 = 0.8
F1 Score: 0.6857...

반응형