Claude Code计费模式
TL;DR
目前的 AI 产品定价逻辑不同于当前互联网产品。互联网旧逻辑:因为大多数用户是通过包月订阅或广告来赚钱的,按”占用时长/权限”收费(会员、等级、清晰度),成本近似固定,边际成本≈0,商业核心是复购率、时长、点击率等”交互指标”。**AI 新逻辑:**现在,公司根据使用情况制定定价等级,并收取更高的信用额度费用。高级用户会花费更多,成为”鲸鱼用户”——在某些情况下,随着时间的推移,他们的花费会增长 10 倍以上(例如 ChatGPT Plus -> Pro),其他示例如 SuperGrok、Google AI Ultra、Krea Max。按”消耗的计算能量”收费(token/上下文/工具调用),而我们的今天的主角 Claude Code 也是其中的代表。
基本概念
消息(chat message):cc 的回复的信息,单纯的文本。
Claude Code 提示(agent run):是指的 cc 调用工具的信息。比如读写文件(Read/writer)、执行命令(bash)。
模型工作小时(weekly model hours):预设的5 小时的窗口期的额度。用超了即便没有到 5 小时,也不能使用了,只能等重置。没有使用,5 小时过去后也会重置。
套餐对照
计划 | 任意 5 小时消息数 | 任意 5 小时 Claude Code 提示 | 周模型小时(Sonnet / Opus) | 适合谁 | 常见撞限原因 |
---|---|---|---|---|---|
Pro | ≈45 | 10–40 | (官方未给固定区间) | 轻度个体:脚手架、小改动 | 长上下文 + 频繁读大仓 |
Max 5x | ≈225 | 50–200 | Sonnet ~140–280 / Opus ~15–35 | 日常开发:反复读仓、跑代理 | 多并行 + Opus 重用 |
Max 20x | ≈900 | 200–800 | Sonnet ~240–480 / Opus ~24–40 | 重度与并行流水线 | 大仓+并行+评测回合多 |
周上限为何出现:官方保留 5 小时窗,同时新增两类周限(总量与 Opus 专属),重度用户可按API 标准价加购。TechCrunch
“Pro/Max x5/x20”不是”速度乘倍”,而是同一时间窗里可用计算预算的倍数;Claude Code 每一次”跑一回代理”(检索/读仓/改文件)要花掉比聊天多得多的预算,因此”消息数”和”提示数”不是一回事。5 小时窗限制的是某段时间内的最大可用速度;周上限限制的是一周累计的能量预算
你和 Claude 的一次对话,能看到 Claude Code 只会回复你几条消息。在一条消息中,cc 会调用工具,如 bash、web search、读取代码等。在这个过程中,底层通讯还是基于 TCP/IP。cc 的每次行为,会带着之前的所有对话数据。请求的体积会膨胀,相应的单次请求的成本会上升。
Token ≠ 时间:5 小时是结算窗口,真正扣的还是 token/计算。用 Opus、长对话、读大仓库都会放大一次调用的”体积”。support.anthropic.com
缓存与成本:行业常用上下文缓存/KV 缓存,命中缓存的输入单价可低一个量级(如 DeepSeek:命中 $0.07 / 1M tokens,未命中 $0.56 / 1M)。这解释了”同样一步”为何有人贵有人便宜。DeepSeek API Docs+1
多重限额的节律:5 小时滚动 + 7 天周顶。撞周顶前,5 小时倒计时仍会重置;撞周顶后,重置也救不了你,需要等下周或加购。
**并行:**这是 cc 这类工具很大优势,可以同一时间,处理多个不同任务。
选择与用量管理
轻度个体(脚手架生成/改一两个文件):Pro 足够,周内偶有卡顿。
日常开发(反复读仓/跑代理):Max 5x 更稳,尤其是多分支尝试 + 自动接受。
重度/并行流水线(多仓并行、Opus 重推理):Max 20x,且准备API 加购做”溢出阀”。以上判断依据 = 官方给出的每 5 小时范围与周”小时数”预期。support.anthropic
实际中的问题
-
anthropic 这家公司对中国非常敌视。最近针对中国的公告在国内引起不小风波。同时,个人就日常来说,同样使用习惯,openai 从未被封过号,Claude 过几天就被封了。
-
在国内,支付方式和使用存在很大困难,这就造成了各种中转站大行其道。
FAQ
-
我该买哪个? 先用一周把自己的工作流分档:读仓占比/是否并行/是否大量用 Opus。落在”读仓+并行”的,直接看 Max 5x;“多并行+Opus 重用”的,看 Max 20x + API 兜底。范围参考见。support.anthropic.com
-
怎么量化我的消耗? 用 ccusage(CLI/Raycast 插件)读本地 JSONL 日志,做日/周/月报;这能把”撞限的朦胧感”变成图表。GitHub+2ccusage+2
-
为什么 2.5 小时就撞”5 小时限制”? 因为窗是 5 小时滚动,但额度按计算消耗;重仓 + Opus/代理模式会很快吃完”这一窗”的预算。Reddit
争议与备注
最近anthropic 陷入降智风波。具体来说就是他们终于承认过去 2 个月社区一直在反馈的模型降智的问题,并把锅甩给了 bug。有人分析是最近 codex 给了他们很大的压力,不得不出来安抚一下社区。不过这是反映了目前 AI 产品计费的问题。不同于开头提到的带宽计时上网,那个时候运营商就算动手脚是可以通过检测发现的。现在模型降智,其实没用公认的检测手段和标准,用户对模型厂商存在透明度疑问。
想要好好的使用 Claude Code 这类工具,对于国内的用户太难了。还是希望国产模型可以迎头赶上,不再受制于人。