어피니티 버블

어피니티 버블(Affinity Bubble)은 pxd가 개발한 업무 도구로, 다수의 사용자 목소리나 텍스트 데이터에서 핵심 주제를 자동으로 추출하여 보로노이 트리맵 형식으로 계층적으로 시각화하고 인사이트 리포트를 제공한다. 기존의 어피니티 다이어그램은 포스트잇을 이용해 여러 디자이너가 장시간 협업해야 했지만, 어피니티 버블은 텍스트 임베딩과 LLM을 결합하여 이 과정을 크게 단축한다.

처리 흐름은 세 단계다. 먼저 텍스트 임베딩을 통해 각 문장을 고차원 벡터로 변환하고, 계층적 클러스터링으로 의미적으로 유사한 항목들을 단계적으로 묶는다. k-means와 달리 계층적 방식은 덴드로그램을 미리 만들어 두고 원하는 유사도 거리에서 가지를 잘라 클러스터 수를 조정할 수 있다. 다음으로 각 클러스터에 LLM을 이용해 대표 레이블을 생성한다. 마지막으로 1차 클러스터들을 다시 임베딩해 2차 클러스터링으로 상위 주제로 묶는 2단계 계층 구조를 완성한다.

베타 버전에서는 UI를 단순화하여 텍스트 붙여넣기 → 1차 클러스터링 → 2차 분류의 순차 구조로 정리하고, 레이블 형식(키워드/사용자 목소리), 상위 분류 방식(토픽/도메인/사용자 골)을 선택할 수 있게 했다. 결과는 테이블로 내보내거나 인사이트 리포트로 요약된다. 워드클라우드가 단순 단어 빈도를 보여주는 것과 달리, 어피니티 버블은 내용 간 관계와 계층 구조를 정량적으로 시각화한다.

핵심 내용

  • 계층적 클러스터링: 가장 유사한 것부터 단계적으로 묶는 방식, 덴드로그램 기반으로 클러스터 수를 유연하게 조정
  • 1차 클러스터링: 텍스트 임베딩 벡터 유사도 기반, 2차 클러스터링: 추출된 레이블을 재임베딩해 LLM으로 추상화
  • 보로노이 트리맵으로 클러스터 비율을 시각적으로 표현해 어떤 주제가 주요한지 한눈에 파악 가능
  • sentence embedding 기반이므로 짧은 단어는 정확도가 낮을 수 있음
  • 같은 데이터라도 LLM 사용 시 매번 결과가 다를 수 있으나, 다른 관점을 확인하는 장점도 있음

관련 개념

출처

최종 업데이트: 2026-04-06 | 출처 2개