当前人工智能领域正处于能力跃迁的关键节点,各大模型厂商在追求性能极限的同时,安全边界的问题逐渐浮出水面。此次发布的最新模型不仅代表了技术的高峰,也揭示了伴生风险的另一面。
重磅消息 发自 硅谷前沿
前所未有的挑战迫在眉睫。
就在日前,Anthropic 备受瞩目的旗舰级模型——
Claude Mythos,正式推出了预览版本。

此前业界的推测得到了验证,这确实是一款具有里程碑意义的产品。
在多项权威基准测试中,性能表现实现了跨越式突破,显著优于 Opus 4.6。
并非微小的迭代,而是实质性的超越……
- SWE-bench Pro:代码修复能力,大幅提升 24%
- SWE-bench Verified:经严格版本复测,仍有 13% 的增长。
- Terminal-Bench 2.0:终端操作类 Agent 能力,提升 17%。


超越 Opus 4.6 的模型?且优势如此明显??
这般实力究竟意味着什么,恐怕超出了许多人的预设。
继之前的版本之后,Anthropic 如今迎来了其最具威慑力的作品——
Mythos,意为神话。

然而这一次,官方并未过多强调测试数据。
相比于喜悦,公告内容中反而流露出一丝难以隐藏的「忧虑」。
甚至,是深深的警惕。
原因在于这款神话模型,存在潜在的致命「隐患」。
Mythos 预览版已识别出数千个高危漏洞,主流操作系统与浏览器均被发现存在弱点。
的确,在 AI 编程能力日益精进,逐渐媲美专业工程师的同时,与之共生的另一项能力,也在不可避免地快速演进。
此刻,Mythos 挖掘并利用安全漏洞的能力,已超越绝大多数传统黑客。
AI 在代码层面的造诣已足够深厚,在漏洞查找与利用方面,能够胜过大部分人类工程师,仅少数顶尖专家尚可抗衡。
硬币的另一面,终究摆在了台面之上。
官方表示,依照当前的发展态势,这种能力若扩散,可能会被不当势力所掌握。
一旦失控,对于经济体系与公共安全而言,都将构成巨大威胁。
为给行业预留应对窗口,在首次公布该模型时,团队采取了一项极为罕见的措施。
暂不向公众开放。
是的,Mythos 将作为玻璃翼计划(Project Glasswing)的一部分,优先向合作伙伴开放。

他们的使命,是在这头猛兽完全释放前,尽全力构建安全防线。
这是一次规模空前的「联合防御」。
为了驾驭 Mythos,Anthropic 几乎联合了所有互联网巨头。
参与方涵盖:Amazon、Apple、Google、Linux Foundation、Microsoft、NVIDIA……
在此项目中,无人置身事外。所有合作方均会将 Mythos 预览版应用于自身的防御性安全工作。
他们将提前解锁模型的真实潜能,将其从限制中释放。
这是一次预先演练。在遭受正式版冲击之前,各方将尽可能利用预览版能力,加固自身防御体系。
安全事务,此次,是动真格的。
官方称会将积累的经验共享,惠及整个行业。
项目还额外开放给 40 多家关键软件基础设施的构建者,让他们利用该模型扫描并加固自研及开源系统。
更为引人注目的是,官方承诺提供最高 1 亿美元的使用额度支持此项工作,甚至直接向开源安全组织捐赠了400 万美元。

如此大手笔,看来是决心已定。
许久未见这般举措。
此前虽有实验室提及限制内部模型能力,但常被视作公关策略。
而这次的玻璃翼计划,首次让人切实感受到紧迫性。
一款如此强大的模型,却严格控制发布,搞出这么大动静,只为推进一项安全计划。
重视程度完全不在一个量级,谁会为了宣传,专门投入这么多资金?
原来资源都倾斜到了安全事业上是吧。

也好。
毕竟,若 Mythos 的能力真如公布那般,这款模型的问世,无疑将彻底重塑网络安全格局。
AI 安全,真的不再是部分科学家的「远虑」,这只猛兽,已隔着笼子发出了第一声嘶吼。
玻璃翼计划只是个起点。
官方表示,网络安全没有任何一家机构可以单独解决,前沿 AI 公司、软件厂商、安全研究员、开源社区、各国政府都得一起参与。
防御全球网络基础设施可能是一个持续数年的工程,而 AI 的能力在接下来几个月就可能发生明显跃迁。
如果想不被突破防线,现在,立刻,马上就得动起来。
资源消耗迅速,部分用户权益调整,开源项目变动……
一切,似乎都有了理由。
团队可能真忙晕头了。
Mythos 的安全问题,已经严重到让团队内部无心关注其他项目,只得押上手中所有的算力,全部押注到安全上来。
因为——
猛兽,要出笼了。
这一事件标志着 AI 治理进入了深水区。单纯的技术迭代已不足以应对潜在风险,产业协同与防御性基础设施的建设将成为下一阶段的核心竞争点。对于开发者而言,这意味着需要重新评估安全策略,以适应新的攻防格局。未来,模型能力的释放将更加注重与安全边界的平衡,这或许是人工智能走向成熟应用的必经之路。