빅데이터 분석기사 예상문제로 꼭 등장하는 정확도, 재현율, 정밀도, F1 Score를 구하는 방법을 알아보도록 하겠습니다.
우선 정확도, 재현율, 정밀도, F1 Score를 구하기 위해서는 각각이 어떤 의미를 가지는 지 알아야겠죠?
머신 러닝 학습 후 테스트를 진행했다고 가정해 보겠습니다.
테스트의 결과로 다음과 같은 표를 얻을 수 있습니다.
실제 정답 | |||
True | False | ||
분류 결과 | True | True Positive (TP) | False Positive (FP) |
False | False Negative (FN) | True Negative (TN) |
True Positive(TP): 모델이 True라고 예측했고, 실제로도 True인 경우
True Negative(TN): 모델이 False라고 예측했고, 실제로도 False인 경우
False Positive(FP): 모델이 True라고 예측했지만, 실제로는 False인 경우
False Negative(FN): 모델이 False라고 예측했지만, 실제로는 True인 경우
이 아래로는 편의상 괄호 안에 있는 약자로 표기하겠습니다.
이 중 TP와 TN는 모델이 정답을 맞힌 것이고, FP와 FN는 모델이 정답을 맞히지 못한 경우입니다.
여기서 정확도, 정밀도, 재현율, F1 Score를 구해낼 수 있습니다.
정확도
정확도(Accuracy): 전체 데이터 중 올바르게 예측한 비율
정밀도
정밀도(Precision): 모델이 True라고 예측한 데이터 중 실제로 True인 비율
재현율
재현율(Recall): 실제로 True인 데이터를 모델이 True라고 인식한 비율
F1 Score
재현율과 정밀도를 이용하면 F1 Score를 얻어낼 수 있습니다. F1 Score는 재현율과 정밀도의 조화 평균으로, 값이 높을수록 좋은 모델이라고 볼 수 있습니다.
예시
실제 정답 | |||
True | False | ||
분류 결과 | True | 40 | 20 |
False | 10 | 30 |
정확도: 70 / 100 = 0.7
정밀도: 40 / 60 = 0.6 (원래는 0.666...인데 편의상 0.6으로 하겠습니다.)
재현율: 40 / 50 = 0.8
F1 Score: 0.6857...
'빅데이터 분석기사' 카테고리의 다른 글
[빅데이터 분석기사] 지지도, 신뢰도, 향상도 구하기 (0) | 2022.11.04 |
---|---|
[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (7) (1) | 2022.11.04 |
[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (6) (0) | 2022.11.04 |
[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (5) (0) | 2022.11.03 |
[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (4) (0) | 2022.11.03 |