텍스트 분석 도구와 UX 리서치

정성적 텍스트 데이터(사용자 인터뷰 기록, 주관식 설문, 앱 리뷰 등)에서 인사이트를 도출하는 작업은 시간과 인지 자원이 많이 드는 과정이다. 텍스트 양에 비례해 전처리와 분석 시간이 증가하고, 제한된 리소스로 인해 분석 빈도와 인사이트 다양성에 한계가 생긴다. pxd UX 테크랩은 이 문제를 해결하기 위해 자체 텍스트 분석 도구 모라고(Morago)를 개발했다.

모라고는 CSV 파일을 업로드하면 자연어 처리(NLP)와 t-SNE 머신러닝으로 비슷한 주제의 문장을 자동 군집화하고, 리서처가 군집별로 중요 문장을 선별해 복사·편집할 수 있도록 한다. 리서처들이 수작업으로 수행하던 어피니티 다이어그램의 초기 분류 단계를 기계가 수행함으로써 단순 반복에 드는 인지 비용을 줄이고, 핵심 인사이트 도출에 더 많은 시간을 투자할 수 있게 한다.

2021년부터 약 2년의 개발 과정에서 다양한 버전을 거쳤다. 어피니티 다이어그램 웹 구현(v1.0), CLI 분석 도구(v1.5), 구글 스프레드시트 애드온(v3.0), 시계열 뉴스 대시보드(v4.0), 채팅 분석 및 워드 클라우드(v4.5) 등 여러 형태를 실험했다. 공통적인 실패 요인은 로딩이 길고 상호작용 피드백 속도가 느려 사용성이 떨어진 점, 크롤러 개발 등 잘할 수 없는 분야에 집중한 점, 데이터 전처리 방식과 원본 품질 문제였다. 이러한 경험을 통해 팀은 최소 기능 제공·데이터 왜곡 방지·단일 화면 탐색·데이터 구조 무관 분석이라는 개발 원칙을 정립했다.

모라고가 제공하는 탐색 기능은 크게 다섯 가지다. 단어 빈도 나열로 전체 유저 보이스의 통계적 패턴을 파악하고, 발화 의도 구분(물음표·멘션 등)으로 자주 묻는 내용이나 자주 언급된 대상을 추출한다. 시계열 분석으로 시간 흐름에 따른 주제 변화를 포착하고, 긍부정 감성 분석 API로 문장의 긍·부정 확률을 계산한다. 테이블 뷰로 별점·성별·연령대 등 정량 데이터와 정성 텍스트를 한 화면에서 함께 탐색할 수 있다.

핵심 내용

텍스트 분석 도구의 핵심 가치: 초기 분류 인지 비용 절감 → 인사이트 도출 집중
t-SNE 군집화는 어피니티 다이어그램 초기 단계를 자동화
개발 원칙: 최소 기능·데이터 왜곡 방지·단일 화면 탐색·데이터 구조 무관
탐색 기능: 단어 빈도·발화 의도 구분·시계열·긍부정 감성분석·테이블 뷰
약 2년, 8개 버전 이상의 시행착오를 통해 설계 원칙 정립
머신러닝 분류는 사람의 창의적 분석을 보조하는 것이지 대체하지 않음

출처

텍스트 분석 도구 개발하기 — 2023-01-05, 이어진 (Eojin Lee)

텍스트 분석 도구와 UX 리서치

핵심 내용

관련 개념

출처