你会掏钱吗?
就在不久前,Sam Altman 宣布即将开源两个推理模型,却意外地在发布的前半小时被 Anthropic 抢了风头。Anthropic 公司抢先发布了新模型 Claude Opus 4.1。这一事件不仅让人感叹,以往总是 OpenAI 抢先发布,这次轮到了 OpenAI 自己被“截胡”。历史的确充满了戏剧性。
两者的发布时间如此接近,不禁令人猜测其中是否存在某些信息泄露或是事先的安排。有几种可能性:Anthropic 或许提前得知了 OpenAI 的消息,也可能恰好赶上了发布时间,甚至有可能 Anthropic 认为 OpenAI 即将发布 GPT-5,因此选择在相近的时间发布自己的新模型。无论如何,这种巧合并非偶然,反映了当前 AI 领域的竞争激烈程度。


总的来看,国外几大 AI 公司在推出新模型时,往往呈现出一种你追我赶的竞争态势。每一次的新发布都伴随着技术创新和市场争夺,这种竞争推动了行业的发展。

Claude Opus 4.1 登场
最新发布的 Claude Opus 4.1 模型是在今年 5 月末推出的 Claude Opus 4 的基础上构建的,展示了 Anthropic 非常快速的模型迭代速度。Claude Opus 4.1 在智能体任务、真实世界编程和推理能力方面有了显著提升,并具备 200K 的上下文窗口。
对于商业用户和个人用户,Claude Opus 4.1 已在 Claude Pro、Max、Team 和 Enterprise(企业)版本中上线,可供使用。
开发者可以通过以下几个平台使用 Claude Opus 4.1:
- Anthropic API
- Amazon Bedrock
- Google Cloud 的 Vertex AI
此外,Claude Opus 4.1 也已集成至 Claude Code 中。
在 API 价格方面,Claude Opus 4.1 的定价如下:
- 每百万输入 token 15 美元
- 每百万输出 token 75 美元
用户可以通过启用提示缓存(prompt caching)最多节省 90% 的成本,使用批处理则可节省多达 50% 的成本。

定价:https://www.anthropic.com/pricing#api
在性能方面,Claude Opus 4.1 在 SWE-bench Verified 基准上达到了 74.5% 的成绩,同时在深度研究和数据分析等多个领域也有显著提升,特别是在细节追踪和智能体搜索任务中。这一系列改进使 Claude Opus 4.1 成为了一个更为强大的工具。

根据 GitHub 的评估,Claude Opus 4.1 在大多数能力上相对于 Opus 4 都有明显的提升,尤其是在多文件代码重构方面表现出色。Rakuten Group 发现,Opus 4.1 在处理大型代码库时能够精确定位需要修改的部分,而不会进行不必要的更改或引入新的 bug。这种精确性和可靠性使得他们的开发团队更倾向于在日常调试任务中使用它。
另一些企业用户表示,在初级开发者的评估基准测试中,Opus 4.1 表现优异,其性能提升幅度类似于从 Sonnet 3.7 升级到 Sonnet 4 的效果。

Anthropic 建议所有用户将 Opus 4 升级至 Opus 4.1。在 API 中,开发者只需使用 claude-opus-4-1-20250805 即可无缝接入新版模型。
使用场景
Claude Opus 4.1 引入了混合推理模式,既支持即时响应,又能展示推理过程。API 用户还可以对思维预算进行精细化控制,从而在成本与性能之间找到最佳平衡点。
其主要应用场景包括:
高级编程能力: Claude Opus 4.1 在 SWE-bench 基准测试中遥遥领先,能够在短时间内完成复杂的工程任务。它的 32K 输出 token 支持和优化后的代码品味使其能够适应特定的编程风格,并在大规模代码生成与重构项目中保持高质量的输出。
智能体搜索与研究: 新模型能够高效地检索外部和内部数据源,综合多种信息来源提供全面的洞见。它可以在连续数小时内自主进行研究,分析专利数据库、学术论文和市场报告等多种类型的数据,为决策者提供战略性洞察。
Anthropic 还随新模型一起发布了系统卡,详细介绍了模型的各项功能和性能指标,读者可以点击链接查看。

地址:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf
尽管新模型带来了许多技术上的突破,但高昂的订阅费用让不少用户感到望而却步。尤其是在实际应用中,大量的 token 消耗进一步增加了使用成本。

一些用户的反馈相当直接:“太费 token 了。” 这表明虽然Claude Opus 4.1 性能强大,但其高成本仍然是一个重要的考虑因素。


值得一提的是,在谷歌主办的 AI 国际象棋比赛中,Claude Opus 4 在第一天被 Gemini 2.5 Pro 击败。如果 Claude Opus 4.1 参加这场比赛,是否会改变这一结果值得关注。