빅데이터 분석기사 예상문제로 꼭 등장하는 지지도, 신뢰도, 향상도 구하기 풀이 방법을 알아보겠습니다.
용어의 의미
우선 각 용어의 의미부터 알아보겠습니다.
지지도(Support): A → B의 경우, 전체전체 거래 품목 중 A와 B를 동시에 포함하는 거래의 비율
신뢰도(Confidence): A → B의 경우, A의 거래 중 B가 포함된 거래의 비율
향상도(Lift): A → B의 경우, B가 구매되는 경우 A와의 관계가 얼마나 고려되어 구매되는지에 대한 비율
구하는 방법
문제를 푸는 것이 목적이니 복잡한 풀이법은 다 무시하고, 가장 쉬운 풀이법을 사용하겠습니다.
지지도: A와 B를 동시에 포함하는 거래 수 / 전체 거래 수
신뢰도: 지지도 / (A를 포함하는 거래 수 / 전체 거래 수)
향상도: 신뢰도 / (B를 포함하는 거래 수 / 전체 거래 수)
예시
품목 | 판매 수량 | |
(1) | 라면 | 15 |
(2) | 우유 | 25 |
(3) | 라면, 우유 | 17 |
(4) | 우유, 김치 | 15 |
(5) | 라면, 계란 | 20 |
(6) | 라면, 우유, 계란 | 8 |
(7) | 합계 | 100 |
문제: [라면 → 우유]의 지지도, 신뢰도, 향상도를 구하시오. (소수점 셋째 자리 뒤는 버림)
괄호 안의 숫자는 위의 표에서 첫 열에 매겨진 숫자를 의미합니다.
1. 지지도: 17(3) + 8(6) / 100(7) = 0.25
2. 신뢰도: 0.25(지지도) / {15(1) + 17(3) + 20(5) + 8(6) / 100(7)} = 0.25 / 0.6 = 0.41
3. 향상도: 0.41(신뢰도) / {25(2) + 17(3) + 15(4) + 8(6) / 100(7)} = 0.41 / 0.65 = 0.63
향상도 분석
추가적으로 향상도를 분석하는 법은 다음과 같습니다.
- A와 B의 판매가 관련이 없다면 향상도 = 1
- A를 샀을 때 B를 살 확률이 높아진다면 향상도 > 1
- A를 샀을 때 B를 살 확률이 낮아진다면 향상도 < 1
'빅데이터 분석기사' 카테고리의 다른 글
[빅데이터 분석기사] 정확도, 정밀도, 재현율, F1 Score 구하기 (0) | 2022.11.11 |
---|---|
[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (7) (1) | 2022.11.04 |
[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (6) (0) | 2022.11.04 |
[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (5) (0) | 2022.11.03 |
[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (4) (0) | 2022.11.03 |