가격 GPT API Claude Gemini 비교 2026, 토큰 비용 어디서 뛰나

가격 GPT API Claude Gemini 비교 2026, 토큰 비용 어디서 뛰나

가격 GPT API Claude Gemini 비교 2026, 토큰 비용 어디서 뛰나

AI API 가격 비교부터 바로 보자

AI API 가격 비교를 찾는 순간은 대개 비슷합니다. 프로토타입은 돌아가기 시작했는데, 이제는 답변 품질보다 카드 명세서가 먼저 신경 쓰이거든요. 2026년 5월 현재 많이 부딪히는 선택지는 GPT API, Claude API, Gemini API 세 가지였고, 제가 제일 먼저 본 건 벤치마크보다 단가 구조였습니다.

매달 구독료보다 API 비용이 더 까다로운 이유는 요청 길이, 캐시, 검색 툴 요금까지 따로 붙기 때문입니다. 같은 20달러를 써도 어디에 태우느냐에 따라 느낌이 꽤 다르구요. 작은 사내 도구 하나 붙이는 사람도 이 차이를 금방 체감합니다.

표 한 장으로 먼저 보는 API 가격

모델입력 1M tokens출력 1M tokens캐시·할인메모
OpenAI GPT-5.4$2.50$15.00Cached input $0.25, Batch 50% 할인표준 가격은 270K 아래 컨텍스트 구간
Anthropic Claude Sonnet 4.6$3.00$15.00Cache hit $0.30, Batch 50% 할인1M context window도 표준 단가 유지
Google Gemini 2.5 Pro$1.25$10.00Context cache $0.125, Batch/Flex 반값요청당 200K tokens 이하일 때
Google Gemini 2.5 Pro$2.50$15.00Context cache $0.25, Batch/Flex 반값요청당 200K tokens 초과부터

여기서 눈에 띄는 건 Gemini 2.5 Pro입니다. 표 첫 줄만 보면 제일 싸게 보이는데, 한 요청이 200K tokens를 넘는 순간 단가가 바로 올라갑니다. 반대로 GPT-5.4와 Claude Sonnet 4.6은 계산식이 더 단순해서 견적을 읽기가 편합니다.

월 20달러대에서 제일 체감되는 차이

예를 들어 한 달에 입력 5M, 출력 1M을 쓰는 작은 앱을 떠올려보면 GPT-5.4는 27.5달러, Claude Sonnet 4.6은 30달러, Gemini 2.5 Pro는 요청이 200K 아래라는 전제에서 16.25달러입니다. 이 숫자만 놓고 보면 Gemini 쪽으로 마음이 기웁니다. 저도 처음엔 그랬습니다.

근데 긴 문서째 넣는 습관이 있으면 얘기가 달라집니다. Gemini 2.5 Pro는 200K를 넘는 요청부터 입력 $2.50, 출력 $15.00으로 올라가서 같은 사용량이 27.5달러까지 붙습니다. 짧은 요청이 많은 챗봇이나 내부 검색 도구면 괜찮은데, 회의록 통째 요약이나 RAG 문서 묶음처럼 프롬프트가 자꾸 불어나는 앱은 다시 계산해야 합니다.

긴 프롬프트를 자주 넣는 사람은 여기서 달라진다

GPT-5.4는 계산이 단순합니다. 표기된 표준 요금이 270K 아래 구간이라 아주 긴 컨텍스트만 피하면 월말 청구서를 읽기가 쉽습니다. API 비용을 주 단위로 보는 입장에선 이 단순함이 생각보다 큽니다.

Claude Sonnet 4.6는 입력 $3.00, 출력 $15.00이라 숫자만 보면 GPT-5.4와 비슷합니다. 대신 1M context window를 표준 단가로 받는 점이 꽤 세게 들어옵니다. 긴 정책 문서, 코드베이스 설명, 매뉴얼 묶음을 반복해서 넣는 흐름이라면 cache hit $0.30도 꽤 효율적입니다.

Gemini 2.5 Pro는 짧은 요청이 많은 서비스에서 매력적입니다. 프로토타입이나 사내용 자동화 툴처럼 프롬프트를 얇게 유지할 수 있으면 비용이 정말 예쁘게 나옵니다. 반대로 문서 길이 관리가 안 되면 싸다는 인상이 오래가진 않더라구요.

누가 뭘 고르면 덜 아픈가

GPT API는 청구서 모양을 단순하게 보고 싶은 팀에 잘 맞습니다. 초반 제품은 성능 1점 차이보다 예산 통제가 더 급한 경우가 많거든요.

Claude API는 긴 문서와 캐시를 많이 쓰는 흐름에 편합니다. 매번 같은 정책 문서나 코드 설명을 다시 보내는 작업이면 체감 차이가 꽤 납니다.

Gemini API는 요청당 길이를 짧게 유지할 수 있을 때 가장 매력적입니다. 내부 도구를 빠르게 붙이거나, 사용량이 늘기 전까지 단가를 낮춰야 하는 팀이면 먼저 손이 갑니다.

AI API 가격 비교에서 자주 놓치는 돈

AI API 가격 비교를 할 때 토큰 단가만 보면 절반만 본 셈입니다. OpenAI는 web search가 1,000 calls당 10달러였고, Google은 Gemini 2.5 계열 Search grounding이 무료 구간을 넘기면 1,000 grounded prompts당 35달러가 붙습니다. Anthropic도 서버 사이드 툴은 사용량 요금이 따로 붙을 수 있어서, 검색이나 실행 도구를 붙이는 순간 카드값 모양이 꽤 바뀝니다.

그래서 저는 모델 성능표보다 로그를 먼저 봅니다. 한 요청이 몇 토큰까지 커지는지, 캐시가 실제로 몇 번 재사용되는지, 검색 호출이 하루에 몇 번 나는지. 이 세 줄만 잡혀도 API 비용은 생각보다 빨리 안정됩니다.

마지막으로 남는 한 줄

AI API 가격 비교는 누가 더 똑똑하냐보다 내 앱이 긴 말을 많이 시키는지, 같은 문장을 자주 다시 보내는지부터 따져보는 쪽이 덜 비쌉니다.

가격표 원문 URL: https://openai.com/api/pricing/ | https://platform.claude.com/docs/en/about-claude/pricing | https://ai.google.dev/gemini-api/docs/pricing

Related Searches

  • 🔍 GPT API 사용법
  • 🔍 GPT API 비교
  • 🔍 Claude API 사용법
  • 🔍 Claude API 비교
  • 🔍 Gemini API 사용법
  • 🔍 Gemini API 비교

댓글 쓰기

다음 이전