빅데이터 분석기사

[빅데이터 분석기사] 지지도, 신뢰도, 향상도 구하기

jooona 2022. 11. 4. 22:29
반응형

빅데이터 분석기사 예상문제로 꼭 등장하는 지지도, 신뢰도, 향상도 구하기 풀이 방법을 알아보겠습니다.

 

용어의 의미

우선 각 용어의 의미부터 알아보겠습니다.

 

지지도(Support): A → B의 경우, 전체전체 거래 품목 중 A와 B를 동시에 포함하는 거래의 비율

신뢰도(Confidence): A → B의 경우, A의 거래 중 B가 포함된 거래의 비율

향상도(Lift): A → B의 경우, B가 구매되는 경우 A와의 관계가 얼마나 고려되어 구매되는지에 대한 비율

 

 

구하는 방법

문제를 푸는 것이 목적이니 복잡한 풀이법은 다 무시하고, 가장 쉬운 풀이법을 사용하겠습니다.

 

지지도: A와 B를 동시에 포함하는 거래 수 / 전체 거래 수

신뢰도: 지지도 / (A를 포함하는 거래 수 / 전체 거래 수)

향상도: 신뢰도 / (B를 포함하는 거래 수 / 전체 거래 수)

 

 

예시

 

  품목 판매 수량
(1) 라면 15
(2) 우유 25
(3) 라면, 우유 17
(4) 우유, 김치 15
(5) 라면, 계란 20
(6) 라면, 우유, 계란 8
(7) 합계 100

 

문제: [라면 → 우유]의 지지도, 신뢰도, 향상도를 구하시오. (소수점 셋째 자리 뒤는 버림)

 

괄호 안의 숫자는 위의 표에서 첫 열에 매겨진 숫자를 의미합니다.

1. 지지도: 17(3) + 8(6) / 100(7) = 0.25

2. 신뢰도: 0.25(지지도) / {15(1) + 17(3) + 20(5) + 8(6) / 100(7)} = 0.25 / 0.6 = 0.41

3. 향상도: 0.41(신뢰도) / {25(2) + 17(3) + 15(4) + 8(6) / 100(7)} = 0.41 / 0.65 = 0.63

 

 

향상도 분석

추가적으로 향상도를 분석하는 법은 다음과 같습니다.

 

- A와 B의 판매가 관련이 없다면 향상도 = 1

- A를 샀을 때 B를 살 확률이 높아진다면 향상도 > 1

- A를 샀을 때 B를 살 확률이 낮아진다면 향상도 < 1  

반응형