报告：Anthropic将发布新模型Mythos，引发安全担忧

Anthropic最新动向引发业界高度关注：其下一代大模型Claude Mythos的预览版本似乎已进入内部测试阶段。据多方信息显示，有用户曾在Claude公开版及Claude Security中短暂发现名为“claude-mythos-1-preview”的选项，但随后该选项被迅速移除。这一细节通常意味着模型已进入上线前的最终打磨期。

关于Mythos的研发时间线，最早可追溯至4月7日。官方将其定位为专注于计算机安全任务的尖端模型，相比现有旗舰Opus 4，在代码理解能力和自主执行方面有显著提升。但正是这种强大的能力，让Anthropic在开放策略上异常谨慎——公司此前明确表示，该模型具备自动获取专业级网络攻击手段的能力，一旦全面开放，可能对数字基础设施构成严重威胁。

值得注意的是，除代码平台外，有用户还在Claude Security中观测到同名模型的存在。不过截至目前，Anthropic并未公布任何正式发布日期。这种“欲说还休”的节奏，与其一贯强调安全对齐的风格高度吻合。

与此同时，Anthropic确认正在推进一项名为“Glass”的新合作项目。该项目旨在联合多家企业共同保护全球关键软件系统，防范AI驱动的漏洞攻击。值得注意的是，Glass项目并未使用Claude Mythos预览版本，而是通过一个开源的漏洞仪表盘，汇总并展示Mythos预览版中发现的各等级漏洞。目前已有数家机构参与其中。

从行业视角来看，Mythos的“难产”折射出大模型安全与能力之间越来越尖锐的矛盾。一方面，顶尖模型的代码理解和自主能力是开发者渴望的生产力工具；另一方面，其被滥用于网络攻击的潜在风险让所有负责任的公司不得不三思。Anthropic这种“内测但不上线”的折中策略，或许将成为未来超强模型发布的新常态——先让安全社区摸清风险边界，再决定是否逐步放量。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

报告：Anthropic将发布新模型Mythos，引发安全担忧

相关推荐

发表回复