Claude Code 활용 알리익스프레스 상품 리뷰 요약 파이프라인 1시간 만에 완성
구매대행 셀러를 위한 리뷰 분석 자동화
온라인 쇼핑몰이나 해외 구매대행을 준비하는 과정에서 가장 많은 시간이 소요되는 작업 중 하나는 바로 상품 소싱입니다.
특히 알리익스프레스나 타오바오 같은 해외 플랫폼에서 물건을 가져올 때는 실제 구매자들의 불만을 철저히 파악해야 합니다. 상세페이지의 화려한 이미지와 달리 실제 제품의 불량률이 높거나 완성도가 떨어지는 경우, 그 부담은 고스란히 고객의 반품 요구나 평점 하락으로 이어지기 때문입니다.
하지만 수백 개에 달하는 리뷰를 일일이 번역기를 돌려가며 읽고 분석하는 작업은 시간 대비 효율이 매우 낮습니다. 그렇다고 리뷰를 전혀 확인하지 않고 상품을 등록하기에는 고객 불만족과 반품 처리에 대한 리스크가 너무 큽니다.
이러한 비효율을 해결하기 위해 나만의 AI 시장조사 파이프라인을 구축하여 자동 분석 시스템을 운영할 수 있습니다. 이전 글에서는 바이낸스 API를 연동해 실시간 펀딩비를 조회하는 투자 알림봇을 만드는 과정을 다루었습니다.
이번에는 데이터를 수집하고 정제하는 기술을 조금 더 확장해 보겠습니다. 해외 쇼핑몰 상품의 리뷰를 자동으로 가져온 뒤, 부정적인 단점과 구체적인 불만 사항만 골라내어 요약 리포트를 만들어내는 자동화 파이프라인을 만드는 방법입니다.
이 작업에는 개발 터미널 환경에서 편리하게 사용할 수 있는 AI 코딩 에이전트인 Claude Code를 활용합니다. 복잡한 API 사용법을 자세히 알지 못하더라도, 터미널 환경에서 프로젝트 폴더를 만들고 명령어를 실행하면 필요한 라이브러리 설치부터 파일 작성까지 대부분의 과정을 자동으로 진행해 줍니다.
코딩 경험이 부족한 사용자라도 단계별 설명에 따라 차근차근 진행하면 1시간 안에 정상 작동하는 데이터 요약 파이프라인을 충분히 만들 수 있습니다. 지금부터 차례대로 개발 단계를 밟아가며 시스템을 구축해 보겠습니다.

1단계: AI 코딩 에이전트로 데이터 추출 스크립트 작성하기
가장 먼저 수행할 작업은 쇼핑몰의 상품 페이지에서 리뷰 데이터를 텍스트 형태로 수집하는 단계입니다. 크롬 확장 프로그램과 같은 도구를 이용하면 해당 상품 페이지의 전체 리뷰 데이터를 HTML이나 CSV 파일 형식으로 편리하게 다운로드할 수 있습니다.
다운로드한 파일을 작업 폴더에 저장한 뒤, 터미널 창을 열고 claude 명령어를 실행하여 코딩 에이전트를 가동합니다. 그런 다음 다운로드한 리뷰 파일에서 필요한 정보만을 추출하여 JSON 형식으로 저장하는 파이썬 스크립트 작성을 요청합니다.
알리익스프레스 상품 페이지에서 가져온 파일 구조를 분석하여 별점, 작성일, 구매 국가, 리뷰 내용 등 핵심 데이터만 골라내는 과정입니다. AI 에이전트는 로컬 파일의 인코딩 형식과 HTML 구조를 분석해 알맞은 파싱 라이브러리를 사용해 코드를 자동으로 구성해 줍니다.
Claude Code 요청 프롬프트 예시:
알리익스프레스에서 다운로드한 'aliexpress_reviews.html' 파일에서 구매자 별점, 국가, 리뷰 텍스트를 파싱해서 'parsed_reviews.json' 파일로 저장하는 Python 스크립트 'parse_reviews.py'를 작성해줘. BeautifulSoup 라이브러리를 사용하고 예외 처리도 꼼꼼하게 넣어줘.

2단계: 무의미한 리뷰 필터링과 AI 요약 기능 연동
단순히 모든 리뷰 데이터를 텍스트로 모으는 것만으로는 실질적인 분석 보고서를 작성하기에 한계가 있습니다. 쇼핑몰에는 상품 평가를 조작하기 위한 무의미한 칭찬글이나 아주 짧은 단답형 평점 글이 다수 섞여 있기 때문입니다.
이런 쓸데없는 데이터를 정제하지 않고 통째로 AI 모델에 전달하면 불필요한 API 토큰 비용이 낭비될 뿐만 아니라 분석 결과의 질도 크게 떨어집니다. 따라서 스크립트에 정제 필터링 규칙을 추가하여 보다 쓸모 있는 결과물을 도출해야 합니다.
글자 수가 5글자 이하인 무의미한 후기는 분석 대상에서 제외하고, 별점이 3점 이하인 진짜 솔직한 불만 후기를 우선적으로 걸러내도록 로직을 추가합니다. 이렇게 필터링된 양질의 부정 리뷰를 Claude API에 입력하여 배송 상태, 마감 품질, 기능 작동 여부 등 3가지 카테고리로 분석하는 요약 코드를 작성합니다.
Claude Code 요청 프롬프트 예시:
'parse_reviews.py'에 필터링 기능을 추가해줘. 5글자 미만의 너무 짧은 리뷰는 제외하고, 3점 이하의 부정 리뷰와 4점 이상의 긍정 리뷰를 분류한 뒤 Anthropic API를 연동해 전체 후기를 3줄 요약 리포트로 뽑아주는 코드를 추가해줘. API 키는 .env 파일에서 가져오도록 해줘.
3단계: 요약 리포트 자동 저장 및 마크다운 파일 관리
분석이 완료된 결과를 사용자가 읽기 편한 보고서 형태로 저장하는 단계가 필요합니다. 터미널 창에만 텍스트를 띄우고 종료하는 대신, 분석 결과를 마크다운 형식의 파일로 자동 저장하는 코드를 완성해 보겠습니다.
오늘 날짜를 파일명에 자동으로 반영하는 로직을 구현하여 보고서가 생성될 때마다 관리하기 쉬운 형태로 파일을 축적합니다. 여러 번 스크립트를 재실행하더라도 데이터가 유실되거나 덮어써지지 않도록 날짜별로 고유한 이름을 생성하는 안전장치도 구현해 달라고 지시합니다.
AI 코딩 에이전트는 사용자의 요구사항에 맞추어 파일 저장 경로를 생성하고, 표 형식을 활용해 전체 리뷰 개수와 평균 별점을 최상단에 배치하는 등 시각적 완성도가 높은 보고서 포맷을 자동으로 코드에 적용해 줍니다.
Claude Code 요청 프롬프트 예시:
요약된 AI 분석 결과를 'reports/report_오늘날짜.md' 파일로 저장하는 기능을 작성해줘. 보고서 상단에는 전체 리뷰 개수와 평균 별점을 표 형식으로 깔끔하게 배치하고, 그 아래에 긍정/부정 분석과 구매 추천 여부를 요약해서 기록해줘.
리뷰 수집 및 요약 과정의 주요 문제 해결
첫째, 다운로드한 HTML 파일의 크기가 너무 커서 API 전송 시 입력 토큰 제한을 초과하는 오류가 발생할 수 있습니다. 수백 개의 리뷰 데이터를 한 번에 모델에 전송하면 글자 수 제한으로 처리가 멈추게 됩니다. 이 문제는 데이터를 30개 또는 50개 단위로 나누어 순차적으로 API를 호출하는 배치 처리 방식을 구현하여 극복할 수 있습니다.
둘째, 다양한 국가의 언어로 작성된 리뷰가 섞여 있어 번역이 매끄럽지 않거나 요약 품질이 떨어지는 경우입니다. 이 문제를 방지하기 위해 프롬프트 템플릿 내에 외국어로 된 모든 후기는 문맥에 맞게 자연스러운 한국어로 번역한 후 분석을 수행하도록 조건을 명확히 설정하는 것이 효과적입니다.
셋째, 대상 쇼핑몰의 사이트 구조가 업데이트되면서 HTML 태그 정보를 찾지 못해 스크립트 실행 중 에러가 발생하는 문제입니다. 이러한 에러가 발생하면 당황하지 말고 오류 메시지와 변경된 HTML의 일부분을 복사해 Claude Code 터미널에 입력하면 됩니다. AI 에이전트가 새로운 클래스명과 태그 구조를 분석하여 파싱 코드를 실시간으로 갱신해 줍니다.
데이터 분석 활용 확장 및 향후 계획
완성된 요약 파이프라인은 노션(Notion) 데이터베이스 API와 추가로 연동하여 확장할 수 있습니다. 상품 분석 보고서가 생성될 때마다 노션 페이지에 자동으로 데이터를 추가하고, 제품 가격과 예상 마진율, AI 추천 점수를 한눈에 볼 수 있도록 구성하면 훌륭한 상품 소싱 데이터베이스가 완성됩니다.
수작업으로 처리하던 시장 조사와 번거로운 요약 작업을 자동화하면 시간과 노력을 획기적으로 절약할 수 있습니다. 다음 단계에서는 이렇게 축적된 상품 데이터와 주요 불만 사항을 바탕으로 소셜 미디어나 블로그에 바로 등록할 수 있는 홍보용 제품 소개 글을 자동으로 작성하는 에이전트 구축 방법을 자세히 소개합니다.
이런 글도 있어요
관련 검색어
- 🔍 Claude Code 사용법
- 🔍 Claude Code 비교
- 🔍 해외 쇼핑몰 리뷰 요약 사용법
- 🔍 해외 쇼핑몰 리뷰 요약 비교
- 🔍 데이터 파이프라인 사용법
- 🔍 데이터 파이프라인 비교