用量限制

Claude Code 用量限制说明

本文说明的用量限制适用于个人 Pro 和 Max 订阅用户。Enterprise 用户和通过 API/Console 计费的用户遵循不同的用量模型,不受下述 5 小时窗口和周上限约束。

官方参考:

每个档次的大致可用量

按 Anthropic 官方对平均用户给出的区间:

方案每 5 小时的大致提示量模型说明
Pro10–40默认可用 Sonnet;使用 Opus 需另行开启并购买额外用量(extra usage)
Max 5x50–200可在 Claude Code 中使用 Sonnet 或 Opus
Max 20x200–800适合高并行和重度场景

这些是官方给的平均区间,不是保证值。实际能用多少,取决于你做的事有多重,不是你用了多久。

5 小时窗口是什么意思

这里最容易产生误解。

5 小时是一个滚动的重置周期,不是说你买到了”5 小时的使用时长”。窗口内真正在消耗的是计算预算,而计算预算跟时间没有直接关系——它跟你每次请求的体积有关。

一个简单的比喻:5 小时窗口更像一张充值卡的有效期,卡里的余额你不用也会到期,用得多就更早用完。时钟走了 5 小时,卡会重置;但在这 5 小时里,如果你跑了很重的任务,可能 1 小时就用完了。

除了 5 小时窗口,还有一个周级别的总上限。轻度用户通常碰不到它,重度用户可能在周上限到了之后,发现窗口重置也救不了——需要等到下周或者加购。

为什么有人 2 小时就撞了”5 小时限制”

这是最常见的困惑。

几个最容易加速消耗的行为:

读大代码库。 让 Claude Code 理解整个项目的文件结构,比改一个小函数要贵得多。如果每次新任务都让它重新过一遍整个仓库,这个成本会持续叠加。

长会话继续加任务。 Claude Code 每次请求都会带上当前会话的完整历史。会话越长,后期每一步的体积越大,消耗越高。很多人在一个会话里从早跑到晚,后期每个请求都很贵。

自动接受连续改文件。 在自动接受模式下让它处理一大批文件时,每一步都在消耗,速度快,很容易一口气吃掉大块预算。

多窗口并行。 同时开多个 Claude Code 会话,消耗是叠加计算的。

频繁使用更重的模型。 在 Max 档下用 Opus 处理本来 Sonnet 能搞定的任务,是最常见的”无意义溢价消耗”。

用量限制和上下文长度是两件不同的事

这两个限制经常被混淆。

用量限制:你在一段时间内总共能用多少,5 小时窗口和周上限都属于这一层。

上下文长度限制:单个会话能拉多长,到了上限会话就无法继续。

即使你还有剩余用量,如果一个会话已经非常长,也可能触到长度限制。反过来,会话很短,但任务很重,也会更快吃完当前窗口的预算。

两者是独立的,可能同时出现,也可能只碰到其中一个。

额度是所有入口合并的,不是每个产品单独给

这是第三个常见误区。

claude.ai 网页版、Claude Code、Claude Desktop,这三个入口的用量合并计算。

所以一种很常见的情况是:上午在网页版聊了一些技术问题,下午切到 Claude Code 写代码,感觉”Claude Code 没用多少”,但整体额度已经消耗了不少。

如果你的日常习惯是多入口切换使用,这一点值得注意。

Pro 和 Max 的差别不只是”多一点”

Pro

适合刚上手体验、任务以小改动为主、对偶发撞限能接受的情况。最常遇到的问题不是”用不了”,而是”刚跑顺就断了”——特别是在大仓库或连续任务里。

Max 5x

适合已经把 Claude Code 放进日常工作流的人。从 Pro 升到 Max 5x,最明显的感受是中断少了,尤其是在反复读仓、多轮改功能、跑中等复杂度任务时。

Max 20x

适合高频、并行、重度用户。如果你一天里经常开多个长任务、频繁用更重的模型、把 Claude Code 当主力执行工具,这一档会明显减少被打断的次数。

撞限之后最实际的处理顺序

  1. 缩小每次请求的范围——不要让它读整个项目,给它更明确的文件范围。
  2. 减少不必要的并行窗口。
  3. 如果当前会话已经严重跑偏或充满无关上下文,再考虑新开一个会话;如果任务还在正轨上,继续在原会话里做通常比重开更省——Claude 已经理解的上下文不需要重新提供。
  4. 如果用 Projects 上传过项目知识库,缓存的内容重复调用时不重复计入用量,这是 Anthropic 官方明确的省额度方式。
  5. 如果已经形成稳定的高频使用习惯,直接升到更匹配的档次,比反复等重置更省时间。

如果你还没装好,暂时不用纠结额度

很多人在刚开始时就搜用量限制,但实际更大的阻塞是安装、登录、首次运行这关没跑通。那种情况下,应该先看:

搭配阅读

关于我