Claude Code Max 주간 한도 경고를 처음 받았다 — Anthropic이 IPO를 위해 던지는 무리수들

평소와 다름없이 Claude Code로 작업하고 있었는데 갑자기 경고창이 떴다.

“주간 사용량의 80%를 초과했습니다.”

처음 보는 메시지였다. 그동안 퇴근후 집에서 연휴 내내 프로젝트 세 개를 돌리고 풀스택 개발에 문서 작성까지 몰아쳤던 적도 있었는데 한 번도 이런 경고가 없었다. 사실 주간 사용량 한도가 있다는 것 자체를 몰랐다. 대부분 퇴근 후 또는 주말에 집에서만 작업하며, Claude Code Max 5x 플랜을 쓰고 있고, 청구는 매월 16~17만 원 수준이다.

작업량이 늘어난 게 아니었다

오히려 요즘은 프로젝트 하나에만 집중하고 있어서 그 이전 연휴보다 덜 쓰고 있었다. 그런데 달라진 게 하나 있었다. Opus 4.7.

Anthropic이 4월 16일에 4.7을 내놓으면서 “코딩 에이전트 성능이 대폭 향상됐다”고 했고, 업데이트하면 당연히 쓰는 거 아닌가 싶어서 그냥 올렸다. 문제는 4.7이 4.6보다 토큰을 훨씬 많이 잡아먹는다는 거였다.

토크나이저 한 번 바뀌면 비용이 이렇게 움직인다

Anthropic 공식 문서에는 4.7이 새 토크나이저를 도입하면서 같은 입력이 콘텐츠 유형에 따라 1.0배에서 1.35배 더 많은 토큰으로 매핑될 수 있다고 적혀 있다. 커뮤니티 실측은 더 무겁게 나온다. PyTorchKR에 올라온 Tokenomics 계산기 분석에서는 50건 평균 +37.4%, 최저 +19.0%, 최고 +86.2% 분포로 측정됐다. 한국어처럼 영어보다 토큰을 더 잡아먹는 언어 사용자는 이 분포의 위쪽에 더 가까울 가능성이 있다.

여기에 한 겹이 더 있다. Claude Code는 4.7 출시와 동시에 기본 추론 단계를 high에서 xhigh로 격상했다. 같은 작업이라도 더 많은 사고 토큰을 소모한다. 토크나이저 팽창과 xhigh 기본값이 동시에 적용되면서 같은 양의 작업을 해도 한도가 더 빨리 닳는다. 4.7 한도 부족 호소가 출시 직후 영어권·중국어권에서 동시다발로 터졌고, Anthropic의 Claude Code 리드 Boris Cherny는 출시 사흘 만에 rate limit을 늘리겠다는 글을 직접 올렸다. 그래도 여전히 주간 한도에 걸리는 사용자가 줄을 잇고 있다.

토크나이저 한 번 바뀌면 비용이 이렇게 움직인다

일주일 써본 4.7, 솔직히 더 낫다는 느낌이 없었다

경고를 받고 나서 돌아보니, 4.7로 바꾼 이후로 작업 흐름이 오히려 답답해진 구석이 있었다.

첫째, 설명이 길어졌다. 코드 한 줄 고쳐달라고 했는데 왜 이렇게 고쳤는지, 다른 방법은 뭐가 있는지, 어떤 trade-off가 있는지를 줄줄이 설명한다. 읽고 싶지 않다. 그냥 고쳐달라고 했는데.

둘째, 되묻는 빈도가 늘었다. “어떤 방향으로 진행할까요?” “이 부분은 A와 B 중 어떻게 하시겠어요?” 의사결정은 이미 다 해놓고 실행만 시키는 건데, 중간에 자꾸 멈추고 확인을 요청한다. 신중함을 높였다는 취지는 알겠지만, 쓰는 입장에서는 마찰이다.

이 변화가 우연이 아니라는 건 Boris Cherny 본인이 출시 직후 한 말에서도 드러난다. “Opus 4.7은 의미 있는 한 단계 발전이다. 최대한 활용하려면 워크플로우를 조정하는 시간을 가져야 한다.” 모델이 사용자 워크플로우에 맞추는 게 아니라, 사용자가 모델에 맞춰 워크플로우를 조정하라는 요구다. 앞선 글에서 정리한 것처럼 4.7은 약해진 게 아니라 사용 방식의 전제 자체가 바뀐 모델이다. 다만 매일 하는 작업 — 코드 수정, 리팩토링, 문서 작성, 보고서 — 에서는 그 변화의 효과가 체감되지 않았다. 오히려 느려진 느낌이었다.

4.6으로 내리려다 본 이상한 풍경

그래서 Opus 4.6으로 되돌리려고 했다. 여기서 예상 못한 상황이 펼쳐졌다.

claude.ai 웹에서 물어봤더니 /model 명령어로 Opus 4.6을 선택하거나, /fast 명령어를 쓰면 Extra Usage로 청구된다고 했다. Claude Code에 직접 물어봤더니 전혀 다른 대답이 나왔다. Opus 4.6은 /model 목록에 없고, /fast로만 접근 가능하며, 끄면 4.6이 되니 그렇게 쓰먄 된다고 했다. 즉, 4.7에서 4.6으로 다운하려면 Extra Usage를 사용해서 4.6 fast 모드로 바꾸고, fast모드를 끄면 일반모드의 4.6이 된다는 의미였다.

두 AI가 서로 다른 말을 하는 상황. 어느 쪽이 맞는지 직접 시도해 봤다. 결과는 Claude Code 말이 맞았다. /model 목록에 Opus 4.6은 없었고, /fast를 켜려고 하니 Extra Usage를 활성화하라는 메시지가 떴다. 결제 수단 등록 없이는 접근이 안 된다.

정리하면 이렇다. 지금 구독 한도 안에서 선택할 수 있는 모델은 Opus 4.7, Sonnet 4.6, Haiku 4.5 세 가지다. Opus 4.6은 Extra Usage를 켜고 Fast Mode 요금을 따로 내야 한다. Anthropic 공식 문서에 따르면 Fast Mode는 입력 100만 토큰당 $30, 출력 100만 토큰당 $150이다. 표준 Opus 4.6 요금($5/$25)의 6배다. 게다가 Fast Mode 토큰은 플랜에 포함된 사용량에 카운트되지 않고 첫 토큰부터 Extra Usage로 청구된다.

4.6으로 다운 하려니 Extra usage결제 후 fast 모드로 바꾼다음 fast를 끄면 4.6이 된다고 안내
4.6으로 다운 하려니 Extra usage결제 후 fast 모드로 바꾼다음 fast를 끄면 4.6이 된다고 안내.

같은 패턴이 한 번이 아니다

이번이 처음이 아니라는 게 더 불편한 부분이다. 4월 21일에는 Anthropic이 pricing 페이지에서 Pro 플랜($20/월)의 Claude Code를 공지 없이 조용히 제거했다. Support 문서도 “Using Claude Code with your Pro or Max plan”에서 “Using Claude Code with your Max plan”으로 바뀌었다. 발견한 건 Anthropic이 아니라 개발자 커뮤니티였다. Ed Zitron이 Internet Archive와 비교해 변경을 포착했고, Reddit과 Hacker News가 몇 시간 안에 뜨거워지자 Head of Growth인 Amol Avasare가 “2% 신규 prosumer signup 대상 소규모 테스트”라고 X에 해명했다. 몇 시간 뒤 pricing 페이지는 조용히 원상 복구됐다.

Avasare의 해명에서 가장 눈에 띈 부분은 따로 있었다. “현재 플랜은 이걸 위해 설계된 게 아니다. 구독자당 사용량이 크게 늘었고, 우리는 이미 주간 한도와 피크 시간 제한을 조정해왔다.” 사용자가 발견하기 전까지 조용히 진행되고, 발각되면 후퇴하고, 다시 다른 길로 시도하는 패턴이다. 이 사건이 보여준 큰 그림은 따로 정리해뒀다. 이번 다운그레이드 차단도 같은 흐름의 한 장면이다.

가장 불쾌한 건 게릴라식 운영 방식이다

토크나이저가 바뀌어 토큰이 더 들든, 모델이 더 비싸지든, 그건 비즈니스 결정이다. 회사가 가격 정책을 바꿀 권리는 있다. 문제는 그 결정을 사용자에게 어떻게 전달하느냐다. Anthropic이 지난 한 달간 보여준 방식은 매번 똑같다. 사전 공지도, 충분한 준비 기간도, 사용자 피드백을 받는 구간도 없이 어느 날 갑자기 슬그머니 적용한다. 그러다 누군가 변경을 발견하고 커뮤니티에서 소란이 나면 후퇴하거나 해명한다. 후퇴해도 사라진 게 아니라 다른 모양으로 다시 들어온다.

4월 21일 Pro 플랜 Claude Code 빼기가 발각되자 후퇴했지만, 며칠 뒤 다운그레이드 경로를 막는 형태로 다시 들어왔다. 토크나이저 변경은 4.7 출시일에 함께 적용됐는데, 같은 입력에 1.35배 토큰을 먹는다는 건 출시 후 사용자들이 직접 측정해서 알아냈다. xhigh 기본값 격상도 사전 안내 없이 4.7과 함께 들어왔다. Boris Cherny가 출시 사흘 뒤에 rate limit을 늘리겠다고 한 것도, 사실 미리 한도가 어떻게 영향받을지 계산해서 출시 전에 안내했어야 할 부분이다.

제대로 된 회사라면 변경 한 달 전에 공지하고, 사용자가 워크플로우를 조정할 시간을 주고, 영향받는 구독자에게 옵션을 제시한다. 실수로 빠진 페이지가 발견되면 즉시 사과하고 영구 복구한다. 테스트라면 테스트 대상에게 명시적으로 알리고 데이터를 받는다. Anthropic이 그렇게 하지 않는 이유는 명확하다. 미리 알리면 반발이 크니까, 일단 적용하고 들키면 그때 대응하는 게 비즈니스 비용이 적다고 판단한 것이다. 그게 IPO를 앞둔 회사가 사용자를 다루는 방식이라면, 사용자도 다른 회사가 같은 비용으로 더 나은 대접을 하는지 따져보는 게 맞다.

5월 1일에 일어난 일 — Anthropic만의 흐름이 아니다

이 구조가 Anthropic만의 방향이 아니라는 게 며칠 사이에 더 분명해졌다. 4월 30일 GitHub이 Copilot Individual 플랜에서 요청 기반 청구를 토큰 기반 청구로 바꾼다고 발표했다. 6월 1일부터 모델과 토큰 사용량으로 비용이 결정된다. GitHub 커뮤니티 토론창은 분노로 도배됐다. “이미 모델 비용을 3배 내고 있는데 또 추가로 받는다고?” “월 한도 위에 주간 한도까지 걸어둔 게 사기다.” Anthropic·Microsoft·OpenAI가 같은 방향으로 가고 있다.

같은 방향으로 가는 회사들의 사정

Anthropic은 IPO를 앞두고 있다. Sacra 추정에 따르면 2026년 3월 기준 연환산 매출(ARR)이 19억 달러에 도달했고, 일부 보도에서는 이미 30억 달러까지 올라온 상태로 전해진다. 그중 Claude Code 단독 ARR이 25억 달러다. 1월 초 대비 두 배 이상으로 뛰었다. 골드만삭스·JP모건이 자문을 맡고 10월 나스닥 상장이 거론된다. 가치는 4,000~5,000억 달러 추정이다.

그런데 가치 폭증의 다른 면이 있다. 추론 인프라 비용이 예상보다 23% 초과하면서 영업 마진이 약 40%까지 떨어졌다. 매출 1달러당 60센트 이상이 GPU 클러스터로 빠져나간다. The Register는 이 상황을 이렇게 정리했다. “Anthropic의 구독 플랜은 토큰 장부가의 10분의 1 이하로 요금을 매기고 있다. 전력 회사가 피크 시간대 사용을 제한하듯 AI 서비스도 같은 길을 가는 중이다.”

이 숫자들을 보면 의도가 보인다. Claude Code가 개발자 생태계에서 사실상 바이브 코딩의 표준으로 자리잡은 상황에서, 사용자가 많이 쓸수록 비용 부담이 커지는 구조는 IPO를 앞두고 지속 가능하지 않다고 판단한 것 같다. 2025년 8월의 주간 한도 도입, 신모델 출시 시 구버전 접근에 과금, Fast Mode의 Extra Usage 전용 운영, 4월 21일의 Pro 플랜 Claude Code 빼기 시도. 이것들이 하나로 연결된다.

사용자를 더 비싼 버전으로 유도하거나, 기존 버전을 쓰려면 추가 결제를 유도하는 방식이다. 회사가 돈을 벌어야 한다는 건 안다. 하지만 IPO 숫자를 만들기 위해 사용자에게 던지는 무리수가 한 번이 아니라 매주 새로 등장하는 상황이라면, 신뢰는 그 속도에 비례해 빠지는 중이다.

다운그레이드조차 막아버리는 행태

최근의 인기를 빌미로 다운그레이드 경로조차 막아버리는 Anthropic의 행태가 솔직히 불쾌하다. 4.6이 더 잘 맞는 작업이 분명히 있는데, 그 선택지를 추가 결제 없이는 못 쓰게 만들었다. 더 좋은 모델을 쓰고 싶다면 돈을 더 내라가 아니라, 이전 모델을 쓰고 싶어도 돈을 더 내라가 됐다. 이건 IPO를 앞둔 회사가 사용자에게 강요할 수 있는 선이 아니다.

그래도 당장 일은 해야 하니 차선책을 짜냈다. Opus 4.7을 그대로 쓰되 /effort를 medium이나 high로 내려서 사고 토큰을 줄이고, CLAUDE_CODE_DISABLE_1M_CONTEXT=1로 1M 컨텍스트를 끄고 200K로 작동시키며, /compact를 50% 시점에 수동으로 걸어 prefix 캐시를 유지하는 식이다. 작업 성격에 따라 단순 수정·문서화는 Sonnet에 위임하고, 기획·아키텍처·디버깅 같은 본격적인 작업만 Opus 4.7에 맡긴다. 어디까지나 마지못해 하는 임시 처방이다. 정상적인 사용 환경이라면 이런 우회로를 짤 필요가 없어야 한다.

이대로 가면 Codex로 갈아탄다

OpenAI의 Codex가 최근 코딩 능력에서 큰 폭으로 좋아졌다는 평가가 나오고 있다. 4월 23일 출시된 GPT-5.5(코드명 Spud)가 Codex에 곧바로 들어갔고, 결정적으로 ChatGPT Plus($20) 구독자가 별도 구독 없이 이 모델을 그대로 쓸 수 있다. Codex 주간 사용자 200만 명이 자동으로 GPT-5.5로 옮겨갔다. OpenAI 자체 평가로 GPT-5.5는 같은 작업에서 GPT-5.4 대비 약 40% 적은 토큰을 사용하고, 일부 외부 비교에서는 Claude Opus 4.7 대비 출력 토큰이 72% 적다는 측정도 나왔다. Anthropic이 토큰을 더 먹는 방향으로 가는 동안, OpenAI는 정반대로 토큰을 덜 쓰는 방향으로 갔다.

물론 GPT-5.5가 모든 면에서 우위는 아니다. Artificial Analysis 평가에서 정확도 1위(57%)지만 환각률은 86%로 최악이다. Claude Opus 4.7의 환각률 36%와 비교하면 두 배 넘게 차이 난다. 외부 API를 호출하는 코드에서 존재하지 않는 패키지명을 자신 있게 만들어내는 식이다. 그래도 이건 검증 단계를 추가하면 관리할 수 있는 리스크다. 두 모델의 트레이드오프를 정리한 글에서 “Claude는 정밀한 편집을, Codex는 광범위한 리팩토링을 한다”는 한 줄이 정확하다. 작업 유형에 따라 라우팅하는 게 합리적이고, 그 라우팅의 무게중심이 Anthropic 쪽에서 OpenAI 쪽으로 옮겨갈 가능성이 점점 커지는 중이다.

대안이 없을 때는 불만이 있어도 썼지만, 대안이 생기는 순간 이탈 결정은 빨라진다. Cursor, Gemini Code Assist도 뒤에서 따라오고 있다. Anthropic이 지금의 구조와 게릴라식 운영 방식을 개선하지 않는다면 Claude Code를 버리는 것도 심각하게 검토할 생각이다. 토크나이저 팽창에 xhigh 기본값에 다운그레이드 차단까지, 모든 변화가 사용자 비용을 늘리는 방향으로만 정렬돼 있다. IPO 숫자 만들기 위해 사용자를 짜는 게 보이는데도 가만히 있을 이유가 없다. 차주부터 Codex 본격 테스트에 들어갈 예정이다. 비교 결과는 다음 글에서 정리할 생각이다.

댓글 남기기