데이터 기반 퍼소나

데이터 기반 퍼소나는 정성 인터뷰가 아닌 실제 사용자 행동 로그를 분석하여 사용자 유형을 세분화하는 방법론이다. 퍼소나의 본질은 공감을 위한 가상 인물 만들기가 아니라 사용자 세분화에 있다. 설문 결과 "50%가 만족"한다고 할 때 중간값 사용자를 상정하는 것보다, 만족하는 집단과 만족하지 않는 집단의 각각 특성을 파악하는 것이 더 유효한 전략이다.

GA4 + BigQuery 조합으로 개별 사용자 단위 로그 분석이 가능해졌다. `user_pseudo_id`를 기준으로 한 사람이 어떤 페이지를 방문하고 어떤 요소를 클릭했는지 fly on the wall 방식으로 관찰할 수 있다. 이를 구체화(개별 사용자 탐색)와 추상화(집단 특성 도출)를 번갈아가며 수행하는 것이 더블 다이아몬드 방법론과 맞닿아 있다.

유입 검색어를 활용한 퍼소나 세분화는 다음 절차로 이루어진다. 먼저 Google Search Console네이버 검색 로그에서 키워드를 수집한다. 각 키워드를 텍스트 임베딩(한국어에 특화된 sentence transformer 모델 권장)으로 벡터화한 후, K-means 또는 계층적 클러스터링으로 의미 군집을 형성한다. 결과는 보로노이 트리맵(워드 버블)으로 시각화해 어떤 주제로 어떤 사용자가 유입되는지 한눈에 파악한다.

CTR(Click Through Rate) 히트맵으로 자사 콘텐츠가 특정 검색어 결과에서 얼마나 독점적인지 확인할 수 있다. 또한 시계열 비교로 계절성(학기 시작에 조형 요소 키워드 급증 등)과 검색 순위 변화를 파악한다. 동일 검색어로 유입된 사용자 집단의 사이트 내 행동 패턴을 비교하면 키워드별 니즈 차이를 구체화할 수 있다.

핵심 내용

  • 퍼소나의 핵심은 사용자 세분화이며, 정량 데이터로도 유형 분류가 가능
  • GA4 BigQuery 연동으로 개별 사용자 로그를 정성 분석처럼 탐색 가능
  • 한국어 임베딩은 음절 단위 토크나이저 문제로 한국어 특화 모델 사용이 권장
  • 유입 검색어 군집 → 사용자 니즈 유형 → 사이트 내 행동 패턴의 연결 고리
  • 행동 변수 정량화 후 군집화 알고리즘을 적용하면 수작업 퍼소나 도출보다 효율적
pxd 웹사이트 분석 사례에서는 유입 경로와 검색어를 기반으로 네 가지 사용자 유형이 식별됐다: 잠재 고객(포트폴리오 탐색, 10%), 지원자(채용 공고·문화 확인, 11%), 콘텐츠 방문자(디자인 시스템 등 특정 주제 접근, 11%), 홈페이지 단순 방문자(추가 분석 필요, 44%). 이처럼 같은 사이트에도 목적이 다른 여러 집단이 공존하며, 트래픽 소스 분석(검색엔진·직접 접속·레퍼럴)과 키워드 클러스터링, 노드-링크 다이어그램 기반 여정 시각화를 결합하면 광범위한 정성 리서치 없이도 PMF(Product-Market Fit) 판단에 필요한 사용자 세분화가 가능하다.

관련 개념

정성·정량 조사 병행으로 퍼소나 설득력 높이기: Invision, Slack 등이 제기한 퍼소나의 신뢰도 부족 문제는 정성 인터뷰만으로 구성된 퍼소나의 한계에서 비롯된다. 이를 보완하는 3단계 프로세스는 다음과 같다. 1) 데스크 리서치로 초기 가설 수립, 2) 홈비짓 인터뷰로 사용자 행동·태도 특성을 정성적으로 도출, 3) 온라인 서베이로 검증 및 재분류(요인 분석·군집 분석 활용). 인터뷰와 서베이 조합의 핵심 장점은 "개별과 전체를 동시에 볼 수 있다"는 것, 그리고 통계적 신뢰도를 높이고 내용 정확도를 향상시키는 것이다. "One size doesn't fit all"—프로젝트마다 적합한 조사 방법을 선택하고, 데이터 중앙화와 반복 검증이 필수다.

출처

최종 업데이트: 2026-04-06 | 출처 3개