트레이닝 붐 덕분에 스포츠센터 회원 수는 늘었지만, 어느 순간부터 고객 수가 정체되는 경우가 많습니다.
특히 “자주 오는 고객은 계속 오지만, 가끔 오는 고객은 어느새 사라지는 현상”은 대부분의 스포츠센터에서 공통적으로 발생합니다.
이럴 때 단순 감각이 아니라 데이터 분석을 통해 고객 행동을 분석하면 오래 유지되는 고객, 이탈 가능성이 높은 고객, 신규 고객 중 위험 고객, 이벤트 효과 등을 확인할 수 있습니다.

이번 프로젝트에서는 스포츠센터 고객 데이터를 여러 CSV 파일로 나누어 관리한다고 가정합니다.
- use_log.csv : 회원 이용 기록
- customer_master2.csv : 회원 기본 정보
- class_master.csv : 회원 구분
- campaign_master.csv : 캠페인 정보
초보자 팁: 고객 분석을 시작할 때는 먼저 “고객 정보”, “방문 기록”, “가입 구분”, “캠페인 정보”처럼 데이터를 역할별로 나누어 이해하는 것이 좋습니다.
먼저 여러 CSV 파일을 하나로 합칩니다. 고객 기본 정보에 회원 구분과 캠페인 정보를 붙여서 분석 가능한 형태로 만드는 과정입니다.
그다음 고객의 이용 패턴을 계산합니다.
- 월 평균 방문 횟수 : mean
- 최대 방문 횟수 : max
- 최소 방문 횟수 : min
- 가입 개월 수 : membership_p
- 규칙적 방문 여부 : routine_flg
이렇게 만든 데이터가 머신러닝 모델에 들어가는 핵심 입력 데이터가 됩니다.
KMeans는 비슷한 고객끼리 자동으로 묶어주는 알고리즘입니다. 정답이 없는 상태에서 고객 유형을 찾는 비지도학습 방식입니다.
- 운동을 자주 오는 사람
- 가끔 오는 사람
- 오래 다닌 VIP 고객
- 신규 고객
| 군집 | 특징 예시 |
|---|---|
| Cluster 0 | 오래 다니며 규칙적으로 운동하는 고객 |
| Cluster 1 | 가입한 지 얼마 되지 않은 신규 회원 |
| Cluster 2 | 방문 횟수가 적은 이탈 위험 고객 |
| Cluster 3 | 이벤트 할인으로 가입한 고객 |
스포츠센터에서는 이 결과를 활용해 VIP 고객에게는 PT나 프리미엄 회원권을 추천하고, 이탈 위험 고객에게는 문자 발송, 쿠폰 제공, 전화 상담 등을 진행할 수 있습니다.
KNN은 “비슷한 고객들이 과거에 어떻게 행동했는가?”를 기준으로 현재 고객의 행동을 예측하는 알고리즘입니다.
예를 들어 비슷한 패턴의 고객 5명이 모두 탈퇴했다면, 현재 고객도 탈퇴 가능성이 높다고 판단할 수 있습니다.
| 항목 | 설명 |
|---|---|
| 방식 | 거리 기반 예측 |
| 중요 요소 | 데이터 표준화 |
| 장점 | 이해하기 쉽고 직관적 |
| 단점 | 데이터가 많으면 느릴 수 있음 |
예를 들어 월 평균 방문 1회, 가입 기간 2개월, 규칙적 방문 없음인 고객은 과거 탈퇴 고객과 비슷한 패턴으로 분류될 수 있습니다.
즉, KNN은 “이 고객은 이탈 가능성이 높다”는 예측에 활용할 수 있습니다.
DecisionTree는 말 그대로 의사결정 나무입니다. 질문을 단계적으로 하면서 결과를 예측합니다.
| 항목 | 설명 |
|---|---|
| 방식 | 규칙 기반 예측 |
| 장점 | 해석이 쉬움 |
| 단점 | 과적합 가능성 |
| 특징 | 시각화 가능 |
- 가입 2개월 이하 + 방문 감소 → 이탈 위험
- 주 3회 이상 방문 → 유지 확률 높음
- 이벤트 가입 고객 → 초기 이탈률 높음
DecisionTree는 단순히 예측만 하는 것이 아니라 “왜 고객이 이탈하는가?”를 설명하는 데 도움이 됩니다.
| 구분 | KMeans | KNN | DecisionTree |
|---|---|---|---|
| 목적 | 고객 그룹화 | 고객 예측 | 규칙 기반 예측 |
| 학습 방식 | 비지도학습 | 지도학습 | 지도학습 |
| 결과 | 군집 번호 | 예측값 | 규칙 |
| 장점 | 고객 유형 발견 | 단순하고 직관적 | 설명력이 뛰어남 |
| 단점 | 군집 수 결정 필요 | 느릴 수 있음 | 과적합 가능 |
| 스포츠센터 활용 | 고객 분류 | 이탈 예측 | 이탈 원인 분석 |
- 고객 기본 정보와 이용 기록을 하나로 합쳤는가?
- 월 평균 방문 횟수, 최대 방문 횟수, 최소 방문 횟수를 계산했는가?
- 가입 개월 수와 규칙적 방문 여부를 만들었는가?
- KMeans로 고객 유형을 나누었는가?
- KNN 또는 DecisionTree로 이탈 가능성을 예측했는가?
- 예측 결과를 실제 상담, 문자, 쿠폰, 이벤트 기획에 연결했는가?
스포츠센터 고객 데이터 분석은 단순히 숫자를 보는 작업이 아닙니다. 고객이 얼마나 자주 방문하는지, 어떤 고객이 오래 유지되는지, 어떤 고객이 이탈 위험이 높은지를 이해하는 과정입니다.
KMeans는 고객을 유형별로 나누는 데 적합하고, KNN은 비슷한 고객과 비교해 예측하는 데 유용합니다. DecisionTree는 예측 결과를 규칙으로 설명할 수 있어 현장에서 이해하기 쉽습니다.
결국 중요한 것은 분석 결과를 실제 운영에 연결하는 것입니다. 이탈 위험 고객에게는 빠른 상담을 진행하고, 충성 고객에게는 적절한 혜택을 제공하면 스포츠센터 운영 전략을 더 체계적으로 세울 수 있습니다.