Anthropic最新动向引发业界高度关注:其下一代大模型Claude Mythos的预览版本似乎已进入内部测试阶段。据多方信息显示,有用户曾在Claude公开版及Claude Security中短暂发现名为“claude-mythos-1-preview”的选项,但随后该选项被迅速移除。这一细节通常意味着模型已进入上线前的最终打磨期。
关于Mythos的研发时间线,最早可追溯至4月7日。官方将其定位为专注于计算机安全任务的尖端模型,相比现有旗舰Opus 4,在代码理解能力和自主执行方面有显著提升。但正是这种强大的能力,让Anthropic在开放策略上异常谨慎——公司此前明确表示,该模型具备自动获取专业级网络攻击手段的能力,一旦全面开放,可能对数字基础设施构成严重威胁。
值得注意的是,除代码平台外,有用户还在Claude Security中观测到同名模型的存在。不过截至目前,Anthropic并未公布任何正式发布日期。这种“欲说还休”的节奏,与其一贯强调安全对齐的风格高度吻合。
与此同时,Anthropic确认正在推进一项名为“Glass”的新合作项目。该项目旨在联合多家企业共同保护全球关键软件系统,防范AI驱动的漏洞攻击。值得注意的是,Glass项目并未使用Claude Mythos预览版本,而是通过一个开源的漏洞仪表盘,汇总并展示Mythos预览版中发现的各等级漏洞。目前已有数家机构参与其中。
从行业视角来看,Mythos的“难产”折射出大模型安全与能力之间越来越尖锐的矛盾。一方面,顶尖模型的代码理解和自主能力是开发者渴望的生产力工具;另一方面,其被滥用于网络攻击的潜在风险让所有负责任的公司不得不三思。Anthropic这种“内测但不上线”的折中策略,或许将成为未来超强模型发布的新常态——先让安全社区摸清风险边界,再决定是否逐步放量。