Claude Codeを日常的に使っていると、ある瞬間「You’ve hit your limit」の通知が表示されて作業が止まります。Proプラン(月額$20)でもMaxプラン(月額$200)でも、制限の壁は避けられません。問題は制限の存在そのものではなく、何がトークンを消費しているのかを把握できていないことにあります。
Claude Codeに課される2種類の利用制限
Claude Codeには「5時間ローリングウィンドウ制限」と「週間制限」の2層構造が存在します。
5時間ローリングウィンドウ制限
直近5時間のトークン消費量に基づいて利用可否が判定される仕組みです。固定の時間帯でリセットされるのではなく、過去5時間分の使用量がスライドしながら評価されます。古いトークン消費が5時間経過で順次カウント外になるため、一度制限に達しても、しばらく待てば枠が回復します。
Anthropicは具体的なトークン数の閾値を公開していませんが、使用するモデルによって消費速度が大きく異なります。Opus系モデルはSonnet系より入出力単価が高いため、同じ作業量でも早く制限に到達します。
週間制限(2025年8月28日導入)
2025年7月28日にAnthropicが予告し、同年8月28日から適用された制限です。5時間制限とは別に、7日間の累計使用量にも上限が設けられています。週間制限には「全体使用量」と「Opusモデル専用」の2つの枠があります(出典: TechCrunch)。
Anthropicは当時「利用者の5%未満にしか影響しない」と説明しましたが、ヘビーユーザーからは「週の半ばで制限に達する」という報告が相次ぎました(出典: Anthropic公式X)。
プラン別の利用枠と料金を比較
Claude Codeの利用枠はサブスクリプションプランによって異なります。以下の表は週間制限の目安時間と月額料金を整理したものです。
| 項目 | Pro | Max 5x | Max 20x |
|---|---|---|---|
| 月額(税別) | $20 | $100 | $200 |
| Sonnet 4系の週間目安 | 40〜80時間 | 140〜280時間 | 240〜480時間 |
| Opus 4系の週間目安 | ― | 15〜35時間 | 24〜40時間 |
| 5時間リセット | あり | あり | あり |
| 週間リセット | 7日後 | 7日後 | 7日後 |
| Extra Usage | 有効化可 | 有効化可 | 有効化可 |
| Claude Code利用 | 可 | 可 | 可 |
(出典: Anthropic公式 - Plans & Pricing)
Proプランの週間目安はSonnet 4で40〜80時間です。1日あたりに換算すると約6〜11時間ですが、コードベースの規模やファイル読み込み量によって消費速度は大きく変動します。
無料プランの制限
無料プランでもClaude(Web/アプリ版)は利用できますが、Claude Codeは使用できません。メッセージ回数にも厳しい上限があり、最新モデルへのアクセスも制限されます。
Teamプラン・Enterpriseプラン
Teamプランにはstandard Seat(月額$25)とPremium Seat(月額$125)の2種類があります。Premium Seatはstandard Seatの5倍の利用枠を持ちます。Claude Codeは全シートで利用可能です(出典: Anthropic - Claude Team Updates)。EnterpriseはSSOや監査ログを含む法人向けプランで、利用制限は個別契約となります。
トークンが想定以上に消費される3つの原因
制限が「早い」と感じる場合、その多くはトークン消費の構造に起因しています。
原因1: 会話履歴の雪だるま式増加
Claude Codeは毎回のやり取りで、それまでの会話履歴全体を入力トークンとしてAPIに送信します。やり取りを10回繰り返すと、1回目の応答も10回分の入力トークンとしてカウントされます。これが「雪だるま式」にトークンが膨らむ根本原因です。
原因2: キャッシュ読み込み(Cache Read)の肥大化
プロジェクトフォルダ直下の .md、.html、.json などのファイルは、セッション開始時にキャッシュとして自動的に読み込まれます。意図せず親ディレクトリで作業を開始した場合、過去のプロジェクトファイルまで毎回読み込まれ、Cache Readトークンが爆発的に増加します。
原因3: MCPサーバーのアイドルコスト
MCPサーバーを有効にしていると、使用していなくてもコンテキストにツール定義が追加されます。たとえばLinear連携だけで約14,000トークンが消費されるという報告があります。使わないMCPサーバーは都度無効にするのが望ましいです。
トークン消費を半減させる7つの実践テクニック
公式ドキュメントとコミュニティのベストプラクティスを組み合わせた具体策を紹介します。
1. /clear と /compact をタスク切り替え時に実行する
/clear は会話履歴を完全にリセットし、トークンカウントをゼロに戻します。/compact は会話内容をAIが要約し、要約結果のみを次のコンテキストとして保持します。
# タスクが完了したら即座にクリア
/clear
# 長い会話の途中で圧縮(カスタム指示も可)
/compact コード変更とテスト結果に集中してまとめて
Claude Codeはコンテキストが容量の上限に近づくと自動で /compact を実行しますが、余裕のある段階で手動実行するほうが要約品質が高くなります。
2. CLAUDE.mdを150トークン以内に保つ
CLAUDE.mdはセッション開始時に毎回読み込まれるため、内容が冗長だと全やり取りのトークン消費を押し上げます。箇条書きの短い記述に絞り、150トークン以内を目安にします。
# プロジェクト設定
- 言語: TypeScript + React
- テスト: vitest
- リント: biome
- ビルド: npm run build
3. 作業ディレクトリを正確に指定する
Claude Codeは開いているフォルダ全体をコンテキストとして扱います。~/projects/ のような親ディレクトリではなく、~/projects/my-app/ のように対象プロジェクト直下で起動します。
4. 用途に応じてモデルを切り替える
Claude Codeはデフォルトで高性能モデルを使用しますが、単純なタスクには軽量モデルで十分です。
# Sonnetモデルに切り替え(トークン単価が低い)
claude --model sonnet
# セッション中のモデル切り替え
/model sonnet
以下は主要モデルのAPI単価比較です(Extra Usage時)。
| モデル | 入力(100万トークン) | 出力(100万トークン) |
|---|---|---|
| Opus 4.6 | $5 | $25 |
| Sonnet 4.5 | $3 | $15 |
| Haiku 4.5 | $1 | $5 |
Sonnet 4.5はOpus 4.6の60%のコストで、一般的なコーディングタスクには十分な性能を発揮します。
5. 1セッション1タスクの原則を守る
複数の無関係なタスクを同一セッションで処理すると、前のタスクのコンテキストが不要なトークンとして蓄積されます。タスクが切り替わるたびに /clear を実行し、セッションを分離します。
6. サブエージェントを活用する
Claude Codeのサブエージェント(Task機能)は親とは独立したコンテキストウィンドウで動作します。調査や探索的な作業をサブエージェントに委任すると、親セッションのコンテキストを汚染せずに済みます。ただし、トークン消費量は同一のプールから引かれる点に注意が必要です。
7. 具体的な指示を一度にまとめて渡す
「このファイルを修正して」のような曖昧な指示はClaude Codeに広範なファイル探索を行わせ、トークンを浪費します。対象ファイル名、修正箇所、期待する動作を明確に記述します。
src/components/Header.tsx の32行目にある NavLink コンポーネントに
aria-label属性を追加してください。値は各リンクテキストと同じにします。
ccusageでトークン消費を可視化する
ccusageはClaude Codeの使用量をローカルのJSONLログから分析するオープンソースCLIツールです。
インストールと基本操作
# インストール不要で即座に実行
npx ccusage@latest
# 日次レポート表示
npx ccusage daily
# 5時間ブロック単位での使用状況
npx ccusage blocks --active
# JSON形式で出力(他ツールとの連携用)
npx ccusage daily --json
主な表示項目
| 表示項目 | 内容 |
|---|---|
| Input Tokens | 入力トークン数 |
| Output Tokens | 出力トークン数 |
| Cache Create | キャッシュ書き込みトークン数 |
| Cache Read | キャッシュ読み込みトークン数 |
| Cost (USD) | 推定コスト |
| Model | 使用モデル名 |
blocks コマンドは5時間ウィンドウ単位の消費量を表示するため、現在の制限枠をどの程度使っているかの目安になります。--live オプションでリアルタイム監視も可能です。
制限に到達したときの3つの選択肢
選択肢1: リセットまで待つ
5時間制限は時間経過で自動回復します。週間制限は7日後にリセットされます。費用をかけずに済む一方、業務が止まるリスクがあります。
選択肢2: プランをアップグレードする
ProからMax 5xへのアップグレードでSonnet使用時間が約3.5倍に拡大します。月額$80の追加投資に見合うかどうかは、週あたりの開発時間で判断します。
選択肢3: Extra Usageを有効にする
Extra Usageは、サブスクリプションの制限に達した後も標準API料金で継続利用できる従量課金オプションです。
設定手順:
- claude.aiのWeb版で Settings > Usage を開く
- 「Enable Extra Usage」をクリック
- 支払い方法を登録
- 月額の上限金額を設定(任意)
Extra UsageはClaude Code・Web版の両方に適用されます。利用料金はサブスクリプションとは別請求で、API標準料金が適用されます。不要になった場合はSettings > Usageからいつでも無効化できます。自動リロードの1日上限は$2,000です(出典: Anthropic Help Center - Extra Usage)。
Web版Claudeとの制限枠の関係
Claude CodeとWeb版/アプリ版Claudeは同一の利用枠を共有しています。Web版で大量にメッセージを送ると、Claude Code側の残り枠が減ります。
効率的に使い分けるには、コーディング作業はClaude Codeに集中させ、Web版は調査・ドキュメント確認など軽量なタスクに限定するのが効果的です。Extra Usageを有効にした場合も、Web版・Claude Code両方の使用量が合算されて課金対象になります。
公式が推奨するコスト管理の方法
Anthropic公式ドキュメントによると、Claude Codeの平均コストは開発者1人あたり1日$6で、90%のユーザーは1日$12以下に収まるとされています。チーム利用(API経由)の場合、Sonnet 4.5で月額$100〜$200/人が目安です(出典: Claude Code公式ドキュメント - コスト管理)。
/cost コマンドでセッションコストを確認する
API接続(Team/Enterprise)で使用している場合、/cost コマンドで現在セッションのコスト内訳を確認できます。Pro/Maxサブスクリプション利用者にはこのコマンドは対応していません。
> /cost
Total cost: $0.55
Total duration (API): 6m 19.7s
Total duration (wall): 6h 33m 10.2s
/context でコンテキスト使用量を把握する
/context コマンドはコンテキストウィンドウの使用割合を視覚的に表示します。80%を超えたら /compact を実行する目安にします。
よくある疑問への回答
Q. Proプランで1日どのくらい使えますか?
週間目安がSonnet 4で40〜80時間なので、1日あたり約6〜11時間です。ただしこれはSonnet 4を基準とした概算で、Opus系を多用するとその分早く枠を消費します。
Q. 週間制限のリセット時刻は?
制限に到達した時点から7日後です。固定の曜日や時刻ではなく、到達時点を起算日とするローリング方式です。
Q. 制限はClaude CodeとWeb版で別々ですか?
同じプールです。Web版で使った分だけClaude Codeの残り枠も減ります。
Q. Extra Usageの料金はいくらですか?
API標準料金と同じです。Sonnet 4.5なら入力$3/100万トークン、出力$15/100万トークンです。Opus 4.6なら入力$5/100万トークン、出力$25/100万トークンとなります。
まとめ
Claude Codeの制限を効率的に管理するポイントは3つです。
- 消費の可視化: ccusageやblocks/dailyレポートで現在の消費状況を常に把握する
- コンテキストの衛生管理:
/clear・/compact・作業ディレクトリの厳密化でトークン浪費を防ぐ - プランと従量課金の併用: Extra Usageを安全弁として設定し、上限金額で意図しない課金を防止する
制限は「使いすぎ」ではなく「使い方の設計」で大きく改善できます。まずはccusageで自分の消費パターンを確認するところから始めるのがおすすめです。