过去两个月,互联网上关于 Anthropic 新旗舰的传闻就没断过,代号“Mythos”的神秘感吊足了胃口。如今,这只“神话”终于落地——Claude 家族迎来迄今为止最强成员,分两个版本登场:Claude Fable 5 和 Claude Mythos 5。

Fable 5 相当于加了安全护栏的 Mythos,面向全体用户开放。一旦触发风险分类器(比如试图生成恶意软件),系统自动降级到上一代 Opus 4.8 来回答。
而 Mythos 5 是原汁原味的满血版,解锁了网络安全、生物科研等高风险领域的能力,但仅限少数受信任的用户使用。
官方特别强调,这两款模型的自主运行时长都超过了以往任何 Claude 模型。

一个值得注意的信号是:前沿 AI 正在进入权限时代。 能力强弱不再是唯一评判标准,谁能用、怎么用、用到什么级别,成了产品设计的新维度。
更有意思的是,就在 Anthropic 呼吁全球 AI 研究暂停两天之后,Dario 也走上了给自家新品提前造势的老路——阵仗还不小。
不过开发者们看到了更实在的利好:两款新旗舰的 API 定价直接砍掉了预览版一半以上——每百万输入 Token 10 美元,每百万输出 Token 50 美元。

好了,硬核环节立刻进入——
先说明一点:官方日志和第三方评测中,Mythos 5 没有像 Fable 5 那样开列完整 Benchmark 成绩(比如 MMLU、GSM8K)。但两者实质上是同一底层模型,基础技术指标一致。因此我们主要来看 Fable 5 的公开表现。

用 Anthropic 自己的话说,Claude Fable 5 是目前最强的公开 Claude,也是 Fable 系列第一次跨入 Mythos 级能力。优势集中在软件工程、复杂知识工作、视觉、长上下文、记忆以及生命科学研究。关键差异在于:任务越长越复杂,Fable 5 相对前代的优势越明显——它不单强在单轮问答,更擅长接住长周期任务。
我们直接拆数据与 Demo:
软件工程: 在 SWE-bench Pro 评测中,Fable 5 拿到 80.3%,而竞品 GPT-5.5 只有 58.6%。

在 Cognition 的 Frontier Code 评测(聚焦困难编程任务与高质量生产代码)中,Fable 5 在中等推理强度下就拿到了前沿模型最高分。该基准极难饱和,但 Fable 5 的“中努力模式”已碾压全场。

典型案例:Stripe 一个 5000 万行 Ruby 代码库的全库迁移,工程团队手动做需要两个多月,Fable 5 只用了一天。
前端开发方面,ViBench(Vibe-coding benchmark)上,Fable 5 几乎把基础开发用例直接打到饱和,实现真正的“一枪流”生成应用。
视觉推理: 在 GDPpdf 基准上,Fable 5 和 Mythos 5 不借助外部工具拿到 29.8%,Opus 4.8 为 22.5%,GPT-5.5 为 24.9%,Gemini 3.1 Pro 为 16.7%。
官方还放了一个直观 Demo:玩 RPG 游戏《宝可梦·火红版》。过去 Claude 需要外部“脚手架”(地图导航、内存读取等)才能操作,现在 Fable 5 用原生视觉盲打——仅凭原始游戏截图,没有任何外挂,自主推演并通关了整部游戏。
在卡牌游戏《杀戮尖塔》中,配上持久化文件级内存后,Fable 5 的表现直接提升 3 倍,到达最终星体的概率同样暴涨 3 倍。
长上下文与记忆: Fable 5 能在百万 Token 级长任务中保持专注,并利用自己的笔记改进输出。Anthropic 特别强调 Token 效率——模型能力越强,消耗 Token 越多,如果“废话连篇”,企业成本会迅速失控。Fable 5 把效率提升作为 Agent 落地的关键账本能力。

金融与高级分析: 在 Hebbia 金融基准测试中,Fable 5 拿到行业最高分,长篇文档推理、复杂图表解读、多步骤根因分析均实现双位数增长。量化机构 IMC 和 Optiver 的实测中,Fable 5 几乎拿满全部权重,且多次运行结果完全一致。数据分析平台 Hex 评价:“Fable 5 是行业内第一个在核心分析基准中突破 90% 的模型,比 Opus 提升了 10 个百分点……最刁钻的提问中表现出人类专家级别的微观评判力。”
科学研究: 初创公司 VibeCAD 测试显示,Fable 5 仅用 1/3 的推理 Token,36 小时内产出的物理研究成果就逼近 GPT-5.5 四天的成绩。
而满血版 Mythos 5 在生物医药领域更为惊人:在没有人类协助的情况下,它独立执行生物学家的完整工作流——选择蛋白质结合位点、调度生物信息学工具、遇到失败自行 Debug。设计出的 14 个蛋白质靶向复合物中,有 9 个已进入真实药物研发管线。

Anthropic 强调,Mythos 5“是首个能持续产生新颖且引人注目的科学假设的模型”。在与 Opus 系列的盲法对比中,80% 的科学家更青睐 Mythos 的分子生物学假设,其中几个已进入实验验证。更夸张的是:Mythos 5 自主工作一周多,拼凑了 138 个物种的单细胞数据,设计并训练了一个微型机器学习模型,体积比常规模型小 100 倍,表现却击败了《Science》上刚发表的最新成果。
安全架构的革新: 这次发布最具讨论度的地方,可能是 Fable 5 背后的防护网。它挂了一组独立分类器,检测用户请求是否涉及网络安全攻击、生化风险以及模型蒸馏。一旦触发,Fable 5 不会简单拒绝,而是自动将请求路由到 Claude Opus 4.8 处理,并告知用户发生了降级。
Anthropic 认为,Opus 4.8 本身也是强模型,降级回答的体验总比直接拒之门外要好。这套机制把能力与安全拆开了:日常使用时享受 Mythos 级能力,敏感问题时丝滑切换到老版本。超过 95% 的会话不会触发降级,但不到 5% 的高风险请求(网络安全、生化、蒸馏)会进入更严格的安全路径。

代价也很明显:分类器调得比较保守,正常请求也可能被误伤,比如生物学家研究病毒、安全工程师做攻防演练。Anthropic 承认当前护栏比理想状态更严格,后续会降低误伤率。另一个代价是数据留存:Mythos 级模型的所有流量保留 30 天,用于安全监控,不用于训练。对企业客户而言,这就是实实在在的数据治理问题——想用最强能力,就要接受更高等级的安全审查和数据留存。前沿模型的成本,不止停留在 API 账单上。
定价与窗口期: Fable 5 和 Mythos 5 统一定价为每百万输入 Token 10 美元、每百万输出 Token 50 美元。相比预览版确实便宜不少,但依然是高价模型,不会便宜到可以随便烧。这也解释了 Anthropic 为什么同时强调能力、安全和 Token 效率。
教授 Ethan Mollick 的深度体验: 著名 AI 学者、沃顿商学院教授 Ethan Mollick 在优先拿到测试权限后,撰写长文直击这场技术革命的核心——人类与模型的协作范式发生了根本性、不可逆的逆转。
他让 Fable 5 做一个等时圈地图,模型自动启动多个代理去查航班、铁路时刻、道路速度,拿到 2200 多个航班信息,抓取 TGV、新干线等数据,最终整合为可用的地图项目。整个过程 Fable 5 把一个模糊目标拆解并自动推进。

Mollick 提出深刻洞察:过去人类使用大模型像“巫师”,需要手把手念咒;现在面对 Mythos 级别的模型,人类正沦为“赞助人”或“甲方”。他尝试将 15 页复杂的项目设计文档交给 Fable 5,只留下宏观需求,模型在后台自主运行 9 个多小时,自动生成工作流、调度多个子 Agent 调研、撰写、校对、纠错,最终交付极高品质的成品,人类完全不需要介入。

这就是“工作室”隐喻:以前用大模型是雇佣需要反复沟通的自由职业者;现在等于用几美元 Token 瞬间雇佣一整家顶尖设计院或科研所。AI 越像承包方,人类越像需要具备验收能力的甲方。

Mollick 还让 Fable 5 生成了一系列游戏,所有美术和 3D 对象完全通过数学运算生成,不依赖外部资源。

他最后总结:使用这个工具既令人愉悦又令人不安——愉悦在于只需提要求就能实现,不安也在于只需提要求就能实现。
回到 Anthropic 的这次发布:重要的事情有两件。一是 Mythos 半公开化,能力天花板被大幅度拉高;二是前沿 AI 的产品形态正在进入权限时代,安全不再只是模型回答前的免责声明,而是分类器、模型路由、权限分级、数据留存和红队测试共同构成的系统架构。
一个更强的模型已经上桌,但人类先给它系上安全带,才把钥匙交给所有人。有人欢呼,有人焦虑,有人在彻夜调试代码,只为追上那条不断向前狂奔、甚至已经开始脱离人类微观视线的智能曲线。
最后,有两个实践信息值得关注:
1. 窗口期:从今天到 6 月 22 日,Pro、Max、Team 和企业版用户可以免费使用 Fable 5。6 月 23 日起需要额外购买 usage credits。
2. Anthropic 表示,产能跟上后会重新把 Fable 5 做成订阅标配。API 和按量付费的企业客户不受此节奏影响,即日起照常调用。
参考资料:
[1]https://www.anthropic.com/news/claude-fable-5-mythos-5
[2]https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos
[3]https://www.biorxiv.org/content/10.64898/2026.03.12.711259v1