최말짱 블로그

연관분석의 이론적 배경 본문

데이터청년캠퍼스

연관분석의 이론적 배경

최말짱 2022. 7. 7. 17:05
728x90

1. 고객관계 관리 CRM

경영전략 패러다임은 환경의 변화를 수용하며 발전 

 

물물교환시대에는 생산자와 고객의 정보력과 노력으로 직접 거래했다. -> 산업화를 통해 유통, 원가를 관리하는 생산관리의 개념이 도입되었다. -> 자본의 유입으로 경쟁이 심화되고 차별화 하고자 품질 관리 개념이 도입되었다. -> 다양한 판촉활동을 통한 판매관리를 수행하게 되었다.

 

CRM(고객관계관리)이란? 

 - 기업의 다양한 자원과 역량을 활용하여 고객과의 관계획득, 유지, 그리고 강화 등 전체 고객생애주기에 걸쳐서 고객과 기업 상호간의 이익극대화를 추구하기 위한 기업의 모든 경영활동의 기반이 되는 경영전략 또는 패러다임 

 

고객관계 관리를 달성하기 위한 프로세스

고객관계를 관리하는 활동은 신규 고객과의 관계를 확보하고, 이들과의 관계를 유지 및 강화 시키고자 하는 프로세스로 이루어진다. 

고객획득 -> 고객유지 -> 고객강화 

 

CRM은 과학적 접근이 가능한 분야이며 Plan-Do-See를 반복적으로 수행하면서 마케팅 역량을 지속적으로 강화한다. 

분석 -> 기획 -> 실행 -> 학습 및 피드백 -> 분석

 

CRM에서 분석하려면 고객 데이터를 모두 모아야 한다. 

 

2. 데이터 마이닝

많은 거래 데이터를 계량적 기법 또는 기계학습의 알고리즘을 사용하여 고객에 대한 지식⭐을 찾아내는 과정

수집된 데이터로부터 발견되지 않은(Fact Finding) 유용한 지식을 찾기 위한 일련의 기술 

분석의 대상이 고객일 때가 많음. 

 

데이터마이닝 VS 머신러닝

데이터 마이닝 용어의 유래 -> CRM에서 고객에 대해서 무엇인가를 발견하는 것에서 유래 되었음. 그래서 분석의 대상이 고객일 때가 많다. 굳이 요즘 구분하진 않으나 유래에서 데이터 마이닝이라는 것이 나왔다 ! 라는 것 알아두기 

 

데이터 마이닝의 특징

Fact Finding!

1. 개발된 예측 모형이 새로운 데이터에서도 얼마나 잘 적용되는지에 대해서 초점을 두고 있음. -> Data mining은 통계의 관점이 아니라 꼭 활용이 되야함. 

2. 통계학, 인공지능, 전산학과 같은 공학 기반의 지식을 기반으로 만들어지고 검증되어 왔음

3. 데이터마이닝을 시스템에 활용하여 기업의 역량을 강화하는 것도 중요하나, 데이터를 얼마나 잘 정의하고 수집하고 있는지도 매우 중요함. 

 

CRM에서 사용하는 데이터 마이닝

1. 예측하기 : 고객의 행동을 분류 예측을 통해 판단

-  로지스틱 회귀분석, 의사결정나무, 인공신경망

2. 연관 규칙 찾기 : 구매 행태 분석에 활용(= 장바구니 분석(거의 동일어로 사용))

- 연관성 분석, 순차패턴 분석, RFM 분석(Recency Fregency Monetary) 얼마나 자주 많이 ! 

3. 군집화 하기 : 유사한 특성으로 그룹을 생성, 고객 세분화, 상품군 유형화 등 다양하게 활용

- 계층적 군집분석, K-평균 군집분석, 코호넨 네트워크 

 

데이터마이닝 모형의 분류(지도학습)

규칙의 유형 수치 예측 규칙(Estimation Rule) 분류 규칙(Classification Rule)
규칙의 역할 연속적인 수치형 값을 찾는 변수 값에 대한 예측  이항 또는 다항 범주 값을 갖는 고객의 그룹별 속성 변수에 대해 판단
CRM 활용 예시  - 고객별 예상 매출액 추정
- 익월 고객 구매확률 예측 
- 이탈,유지에 대한 여부 판단
- 신규고객에 대한 1년 후의 VIP,Gold,Silver 등급 예상

데이터마이닝 모형의 분류(비지도학습 > 연관,순차)

규칙의 유형 연관성 규칙(Association Rule) 순차 패턴(Sequential Patterns)
규칙의 역할 구매된 상품관의 연관성을 바탕으로 "if 조건 then 결과" 형태의 규칙을 도축
고객들의 장바구니를 분석하여 새로운 제품이 있을 때 고객들이 이 제품을 살지 말지 분석!
연관성 규칙에 시계열적 순서의 개념을 포함한 규칙
CRM 활용 예시  - 장바구니 분석을 통한 교차판매 상품 패키지 판매전략 수행(고객 강화의 개념)
- 고객별 구매이력 분석을 통한 개인화 추천 규칙 도출 
- 로열티 강화 프로그램, ex)시간적 흐름에 따라 업그레이드 구매를 유도하는 상승판매 전략
- 연속판매 프로그램, ex) 관람하는 영화 장르의 순서적 흐름

데이터마이닝 모형의 분류(비지도학습 > 군집화)

규칙의 유형 군집화 규칙(Clustering Rule) 일반화 규칙(Generalization Rule)
규칙의 역할 개체간의 유사성을 바탕으로 비슷한 유형의 개체들끼리 그룹화를 할 수 있는 규칙
(어떤 특징으로 어떻게 군집을 할 것인가)
특정 그룹 또는 분류에 속하는 고객군에 대해 일반화된 특성을 도출하는 규칙(프로파일링)
CRM 활용 예시  - 고객정보, 구매패턴 등을 고려한 탐색적 고객 속성 발굴 및 세분화 전략 개발
- 전국 매장, 제품 등의 유영화 및 특성 파악
- 잦은 반품 고객군의 특성 파악(나이, 성별, 지역, 직업군 등)
- 가입 후 1년 이내 휴먼화된 고객그룹에 대한 일반화된 특성 파악( 첫 구매 상품유형, 나이, 직업군, 구매채널 등)

 

3. 연관분석 

기계학습 관점에서의 연관분석은?

기계학습 방법은 지도학습, 비지도 학습 및 강화학습으로 구분하여, 연관분석은 비지도 학습의 대표적인 모델이다.

 

1. 지도학습 : 문제와 정답을 알려주고 규칙을 만들어가는 과정 (회귀, 분류)

2. 비지도 학습 : 답을 모르는 상태에서 규칙과 답을 만들어가는 과정 (차원축소, 군집화, 연관규칙 찾기)

3. 강화 학습 : 보상으로 행위를 강화하는 방식으로 결정을 만드는 과정 (알파고, 자율주행)

 

연관분석의 활용 

대규모의 데이터 항목들 중에서 유용한 연관성과 상관관계를 찾는 기법으로 상품 또는 서비스 간의 관계를 살펴본다.

"A를 구매하면 B도 구매된다"를 찾기 위한 기법. 

예시로 -> 맥주와 기저귀가 같이 구매된다 ! , 골프&시세이도..

 

활용분야 

- 소비자가 구매한 상품의 연관성을 분석하여, 상품 A와 함께 구매할 가능성이 높은 상품을 추천하면서 쿠폰이나 카탈로그를 제공하는 식으로 판촉 마케팅에 활용 

- 물건 진열

 

4. 연관분석 용어 

항목(item) : 상품 단위, SKU, 카테고리 수 

항목 집합(item set) :  항목들의 집합

거래 데이터(transaction) : 함께 구매되는 거래 단위

빈발 항목(frequent item set) : 구매 빈도가 높은 항목 또는 아이템 셋 

연관규칙(association rules) :  X를 구매하면 Y를 구매된다.

선행절 : 연관규칙 X=>Y에서 X, 조건절 또는 LHS(Left hand side)

후행절 : 연관규칙 X=>Y에서 Y, 결과절 또는 RHS(Right hand side)

'데이터청년캠퍼스' 카테고리의 다른 글

군집분석  (0) 2022.07.12
(1-2)빅데이터를 위한 파이썬  (0) 2022.07.09
연관분석의 지표  (0) 2022.07.08
빅데이터 개념(데청캠 OT)  (0) 2022.07.07
(1-1) 4차 산업혁명과 빅데이터  (0) 2022.07.04