在开发者圈子里,AI编程助手正成为像氧气一样不可或缺的工具。然而,当供给出现波动时,依赖它的工作流便会陷入停滞。近期,Claude用户的普遍反馈便指向了这种“缺氧”状态。
观察者 发自 技术前线
近日,众多Claude开发者订阅用户发现,其“额度”消耗速度显著异常,这并非源于使用强度的骤然提升。


在Reddit社区关于Claude使用量计算异常的讨论发酵数日后,Anthropic官方终于做出回应:
我们已注意到,用户在Claude中达到使用上限的速度远超预期。
团队正将其作为最高优先级事项进行紧急调查,并将尽快更新进展。

简而言之:问题确认存在,规模不小,正在处理。
值得注意的是,许多社区用户认为这一回应并非主动的“服务升级公告”,更像是迫于社区压力后的被动澄清。

问题的技术根源在两天前被一位用户通过逆向工程揭示。他在Reddit上发布了两个独立的关键bug。

该分析指出,这两个bug会导致prompt缓存机制完全失效,从而在用户无感知的情况下,将实际计算成本放大10至20倍。
因此,问题的核心并非用户用量激增,而是系统在“静默地过度计算”。
Token常被比喻为AI时代的“水电煤”,但在实际消费体验上,它更像早期移动网络的“流量套餐”:
感知上的轻度使用,往往对应着账单上的快速耗尽。

Anthropic每月百余美元起的订阅套餐本就定价不菲,此次异常消耗加剧了用户的成本焦虑。
一个简单的“你好”,可能瞬间消耗13%的可用额度。

11分钟的工作会话,23%的使用量便宣告消失。

更为极端的情况是,单个提示词竟能占用高达31%的Claude额度。

即便是每月200美元的最高级套餐,用户也在3.5小时内达到了限额。

一位订阅Claude Pro(年费200美元)的用户在Discord上抱怨:
每周一基本就耗尽了额度,直到周六才重置……一个月里真正能用的时间只有12天左右。
据此消耗速率评估,近期的Claude对于重度用户而言,几乎处于“功能不可用”状态。
对于已将AI深度集成到工作流程中的开发者,服务的中断比直接的经济损失更为棘手。
而这类问题,似乎并非Anthropic独有的困扰。
有用户反馈,主流AI服务商的套餐普遍存在“前三周耗尽月度额度”的现象,且是在非重度使用的场景下。

但此次Claude的问题因其明显的技术漏洞和迅速发酵的社区舆论而显得尤为突出——
Reddit平台涌现了大量集中讨论此事件的帖子。

因此,“不耐用”已从个体体验问题,演变为一个需要厂商系统性审视的服务可靠性议题。
这也是Anthropic官方不得不迅速出面表态的背景。
综合各方分析,此次事件可能由多重因素叠加导致。
首先,Anthropic上周曾宣布将在高峰时段调低用户配额。
这意味着在高峰期,相同的交互行为将消耗更多比例额度,用户的直观感受便是“额度蒸发得更快了”。
(注:高峰时段定义为美国东部时间(ET):工作日08:00–14:00;美国太平洋时间(PT):工作日05:00–11:00)
其次,3月28日是Claude一项促销活动的截止日。该活动曾在非高峰的6小时窗口外,为用户提供双倍额度。

促销结束后,用户额度从“加倍状态”回归常态,主观上会感到可用资源“陡然缩水”。
最关键的,则是Reddit用户披露的两个核心bug:
- 独立二进制中的sentinel替换机制,在对话涉及计费内部逻辑时会破坏缓存。
- resume参数会始终导致缓存失效(自v2.1.69版本起)。
这两个缺陷导致prompt缓存无法正常工作,相同请求被重复、高成本地处理,最终使token消耗被动放大,潜在成本膨胀可达十倍。
值得留意的是,部分用户报告称,降级到更旧的客户端版本(如2.1.34)后,消耗情况有明显改善。
降级到2.1.34后,额度消耗速度恢复正常。
这似乎印证了问题主要源于近期版本的特定缺陷。
本质上,Claude此次风波揭示了一个超越模型能力的竞争维度:服务的稳定性与透明度。
模型性能越强大,用户粘性越高,对其在工作流中的依赖就越深。
尽管价格上涨会引发不满,但用户与企业仍愿意为高质量的AI产出支付溢价,Anthropic的模型能力也确实赢得了市场认可。
矛盾在于,消耗在增加,但稳定体验并未同步跟上;成本在上升,但用户反馈的响应速度和问题修复的节奏却显迟缓。
用户尖锐地指出,Anthropic甚至在最基础的token使用统计与管理功能上都存在缺失。

更值得关注的是时间线:用户反馈持续数日,技术漏洞被公开剖析两天后,官方才发出“正在调查”的声明。


相比之下,行业内的其他主要竞争者,其更新与迭代的频率更为密集。

对于已确认的问题,修复行动往往更为迅速。

这引出一个产业层面的思考:在AI服务走向普及的当下,模型的技术优势可能已不再是唯一的决胜点。
更稀缺的竞争力或许是:能否持续提供稳定可靠的服务,能否快速响应并解决用户问题,能否真正将社区反馈纳入产品改进循环。
一个略带讽刺的观察是:如果Claude的部分代码真由AI生成,那么其客户服务与运维团队,或许更需要“人类智能”的加强。

分析延伸:当AI成为生产工具,可靠性即是生产力
此次事件并非简单的技术故障,它折射出AI服务提供商从“技术演示”走向“生产级服务”过程中必须面对的挑战。对于开发者而言,Claude等工具已从“玩具”升级为“生产资料”,其稳定性与计费透明度直接关系到开发进度与项目成本。
当消耗计量出现模糊甚至错误时,用户不仅承受经济损失,更面临工作流中断的风险。这迫使业界重新审视AI服务的SLA(服务等级协议)标准。未来,除模型性能榜单外,“服务可靠性榜单”或许将成为用户选择的另一关键依据。
同时,社区驱动的漏洞排查(如本次逆向工程分析)凸显了用户群体在技术监督中的重要作用。厂商如何建立更开放、敏捷的沟通机制,将社区反馈转化为快速的修复行动,将成为构建信任的核心。
最后,这也提醒所有AI服务的消费者:在享受AI带来的效率飞跃时,需对其依赖成本(包括经济成本与稳定性风险)保持清醒评估,并考虑适当的备份或替代方案,以维持自身工作流的韧性。