刚刚，Claude Mythos 5发布！5000万行代码1天搞定

过去两个月，互联网上关于 Anthropic 新旗舰的传闻就没断过，代号“Mythos”的神秘感吊足了胃口。如今，这只“神话”终于落地——Claude 家族迎来迄今为止最强成员，分两个版本登场：Claude Fable 5 和 Claude Mythos 5。

Fable 5 相当于加了安全护栏的 Mythos，面向全体用户开放。一旦触发风险分类器（比如试图生成恶意软件），系统自动降级到上一代 Opus 4.8 来回答。

而 Mythos 5 是原汁原味的满血版，解锁了网络安全、生物科研等高风险领域的能力，但仅限少数受信任的用户使用。

官方特别强调，这两款模型的自主运行时长都超过了以往任何 Claude 模型。

一个值得注意的信号是：前沿 AI 正在进入权限时代。 能力强弱不再是唯一评判标准，谁能用、怎么用、用到什么级别，成了产品设计的新维度。

更有意思的是，就在 Anthropic 呼吁全球 AI 研究暂停两天之后，Dario 也走上了给自家新品提前造势的老路——阵仗还不小。

不过开发者们看到了更实在的利好：两款新旗舰的 API 定价直接砍掉了预览版一半以上——每百万输入 Token 10 美元，每百万输出 Token 50 美元。

好了，硬核环节立刻进入——

先说明一点：官方日志和第三方评测中，Mythos 5 没有像 Fable 5 那样开列完整 Benchmark 成绩（比如 MMLU、GSM8K）。但两者实质上是同一底层模型，基础技术指标一致。因此我们主要来看 Fable 5 的公开表现。

用 Anthropic 自己的话说，Claude Fable 5 是目前最强的公开 Claude，也是 Fable 系列第一次跨入 Mythos 级能力。优势集中在软件工程、复杂知识工作、视觉、长上下文、记忆以及生命科学研究。关键差异在于：任务越长越复杂，Fable 5 相对前代的优势越明显——它不单强在单轮问答，更擅长接住长周期任务。

我们直接拆数据与 Demo：

软件工程： 在 SWE-bench Pro 评测中，Fable 5 拿到 80.3%，而竞品 GPT-5.5 只有 58.6%。

在 Cognition 的 Frontier Code 评测（聚焦困难编程任务与高质量生产代码）中，Fable 5 在中等推理强度下就拿到了前沿模型最高分。该基准极难饱和，但 Fable 5 的“中努力模式”已碾压全场。

典型案例：Stripe 一个 5000 万行 Ruby 代码库的全库迁移，工程团队手动做需要两个多月，Fable 5 只用了一天。

前端开发方面，ViBench（Vibe-coding benchmark）上，Fable 5 几乎把基础开发用例直接打到饱和，实现真正的“一枪流”生成应用。

视觉推理： 在 GDPpdf 基准上，Fable 5 和 Mythos 5 不借助外部工具拿到 29.8%，Opus 4.8 为 22.5%，GPT-5.5 为 24.9%，Gemini 3.1 Pro 为 16.7%。

官方还放了一个直观 Demo：玩 RPG 游戏《宝可梦·火红版》。过去 Claude 需要外部“脚手架”（地图导航、内存读取等）才能操作，现在 Fable 5 用原生视觉盲打——仅凭原始游戏截图，没有任何外挂，自主推演并通关了整部游戏。

在卡牌游戏《杀戮尖塔》中，配上持久化文件级内存后，Fable 5 的表现直接提升 3 倍，到达最终星体的概率同样暴涨 3 倍。

长上下文与记忆： Fable 5 能在百万 Token 级长任务中保持专注，并利用自己的笔记改进输出。Anthropic 特别强调 Token 效率——模型能力越强，消耗 Token 越多，如果“废话连篇”，企业成本会迅速失控。Fable 5 把效率提升作为 Agent 落地的关键账本能力。

金融与高级分析： 在 Hebbia 金融基准测试中，Fable 5 拿到行业最高分，长篇文档推理、复杂图表解读、多步骤根因分析均实现双位数增长。量化机构 IMC 和 Optiver 的实测中，Fable 5 几乎拿满全部权重，且多次运行结果完全一致。数据分析平台 Hex 评价：“Fable 5 是行业内第一个在核心分析基准中突破 90% 的模型，比 Opus 提升了 10 个百分点……最刁钻的提问中表现出人类专家级别的微观评判力。”

科学研究： 初创公司 VibeCAD 测试显示，Fable 5 仅用 1/3 的推理 Token，36 小时内产出的物理研究成果就逼近 GPT-5.5 四天的成绩。

而满血版 Mythos 5 在生物医药领域更为惊人：在没有人类协助的情况下，它独立执行生物学家的完整工作流——选择蛋白质结合位点、调度生物信息学工具、遇到失败自行 Debug。设计出的 14 个蛋白质靶向复合物中，有 9 个已进入真实药物研发管线。

Anthropic 强调，Mythos 5“是首个能持续产生新颖且引人注目的科学假设的模型”。在与 Opus 系列的盲法对比中，80% 的科学家更青睐 Mythos 的分子生物学假设，其中几个已进入实验验证。更夸张的是：Mythos 5 自主工作一周多，拼凑了 138 个物种的单细胞数据，设计并训练了一个微型机器学习模型，体积比常规模型小 100 倍，表现却击败了《Science》上刚发表的最新成果。

安全架构的革新： 这次发布最具讨论度的地方，可能是 Fable 5 背后的防护网。它挂了一组独立分类器，检测用户请求是否涉及网络安全攻击、生化风险以及模型蒸馏。一旦触发，Fable 5 不会简单拒绝，而是自动将请求路由到 Claude Opus 4.8 处理，并告知用户发生了降级。

Anthropic 认为，Opus 4.8 本身也是强模型，降级回答的体验总比直接拒之门外要好。这套机制把能力与安全拆开了：日常使用时享受 Mythos 级能力，敏感问题时丝滑切换到老版本。超过 95% 的会话不会触发降级，但不到 5% 的高风险请求（网络安全、生化、蒸馏）会进入更严格的安全路径。

代价也很明显：分类器调得比较保守，正常请求也可能被误伤，比如生物学家研究病毒、安全工程师做攻防演练。Anthropic 承认当前护栏比理想状态更严格，后续会降低误伤率。另一个代价是数据留存：Mythos 级模型的所有流量保留 30 天，用于安全监控，不用于训练。对企业客户而言，这就是实实在在的数据治理问题——想用最强能力，就要接受更高等级的安全审查和数据留存。前沿模型的成本，不止停留在 API 账单上。

定价与窗口期： Fable 5 和 Mythos 5 统一定价为每百万输入 Token 10 美元、每百万输出 Token 50 美元。相比预览版确实便宜不少，但依然是高价模型，不会便宜到可以随便烧。这也解释了 Anthropic 为什么同时强调能力、安全和 Token 效率。

教授 Ethan Mollick 的深度体验： 著名 AI 学者、沃顿商学院教授 Ethan Mollick 在优先拿到测试权限后，撰写长文直击这场技术革命的核心——人类与模型的协作范式发生了根本性、不可逆的逆转。

他让 Fable 5 做一个等时圈地图，模型自动启动多个代理去查航班、铁路时刻、道路速度，拿到 2200 多个航班信息，抓取 TGV、新干线等数据，最终整合为可用的地图项目。整个过程 Fable 5 把一个模糊目标拆解并自动推进。

Mollick 提出深刻洞察：过去人类使用大模型像“巫师”，需要手把手念咒；现在面对 Mythos 级别的模型，人类正沦为“赞助人”或“甲方”。他尝试将 15 页复杂的项目设计文档交给 Fable 5，只留下宏观需求，模型在后台自主运行 9 个多小时，自动生成工作流、调度多个子 Agent 调研、撰写、校对、纠错，最终交付极高品质的成品，人类完全不需要介入。

这就是“工作室”隐喻：以前用大模型是雇佣需要反复沟通的自由职业者；现在等于用几美元 Token 瞬间雇佣一整家顶尖设计院或科研所。AI 越像承包方，人类越像需要具备验收能力的甲方。

Mollick 还让 Fable 5 生成了一系列游戏，所有美术和 3D 对象完全通过数学运算生成，不依赖外部资源。

他最后总结：使用这个工具既令人愉悦又令人不安——愉悦在于只需提要求就能实现，不安也在于只需提要求就能实现。

回到 Anthropic 的这次发布：重要的事情有两件。一是 Mythos 半公开化，能力天花板被大幅度拉高；二是前沿 AI 的产品形态正在进入权限时代，安全不再只是模型回答前的免责声明，而是分类器、模型路由、权限分级、数据留存和红队测试共同构成的系统架构。

一个更强的模型已经上桌，但人类先给它系上安全带，才把钥匙交给所有人。有人欢呼，有人焦虑，有人在彻夜调试代码，只为追上那条不断向前狂奔、甚至已经开始脱离人类微观视线的智能曲线。

最后，有两个实践信息值得关注：

1. 窗口期：从今天到 6 月 22 日，Pro、Max、Team 和企业版用户可以免费使用 Fable 5。6 月 23 日起需要额外购买 usage credits。

2. Anthropic 表示，产能跟上后会重新把 Fable 5 做成订阅标配。API 和按量付费的企业客户不受此节奏影响，即日起照常调用。

参考资料：
[1]https://www.anthropic.com/news/claude-fable-5-mythos-5
[2]https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos
[3]https://www.biorxiv.org/content/10.64898/2026.03.12.711259v1

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

2026 年 6 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

刚刚，Claude Mythos 5发布！5000万行代码1天搞定

相关推荐

发表回复