蚂蚁百灵Ring-2.6-1T开源，Agent执行能力全面增强

开源大模型赛道在2025年进入了新的竞争阶段：不再单纯比拼参数量或单点跑分，而是转向“真实场景下的工程效率”。5月15日，蚂蚁百灵正式将旗舰级推理模型Ring-2.6-1T开源，权重文件同步上线Hugging Face与ModelScope。此前该模型已在OpenRouter开放限时免费API，开发者可以零成本体验。

Ring-2.6-1T最核心的设计理念是“按需思考”——引入可调节的Reasoning Effort机制，支持high与xhigh两种推理强度。开发者能根据任务特性动态分配算力资源：high模式针对高频Agent工作流，适合多轮对话、工具协作与任务拆解，跑得更快；xhigh模式则面向数学竞赛、科研分析等高难度场景，释放模型能力天花板。有开发者评价，这是“工程实用性”的显著进步，而非堆参数式的军备竞赛。

从评测数据看，两档模式确实各有所长。在high模式下，Ring-2.6-1T的PinchBench得分87.60，超过GPT-5.4 xHigh和Gemini-3.1-Pro high；Tau2-Bench Telecom更是达到95.32，Agent场景执行能力突出。xhigh模式下，AIME 26得分95.83，逼近多家头部模型；GPQA Diamond得分88.27，科学知识理解与复杂推理表现稳健。客观来说，这些成绩没有碾压对手，但实现了“双模式均属第一梯队”的均衡表现。

训练架构层面，Ring-2.6-1T采用异步（Async）强化学习训练架构，将策略采样与参数更新解耦为独立流水线，解决了传统同步训练中GPU资源闲置、吞吐不足的老问题，并支持更长时间的持续训练。百灵还将此前在Ring-1T上验证过的“棒冰算法”引入异步RL训练，用于稳定训练过程。相关技术细节将在后续技术报告中公开，值得持续关注。

近一个月内，百灵密集发布并开源了多款模型，涵盖Ling语言模型和Ring推理模型系列。值得注意的变化是：相较于追求更大参数量或更高单点分数，百灵更强调“真实生产环境使用”，整个系列集体切入“Token Efficiency”赛道，核心目标是用更少的token完成高质量输出。市场已给出明确反馈——Ling-2.6-flash的匿名测试版本“Elephant Alpha”上线OpenRouter后，连续多日位居Trending榜首，日均token调用量达到100B级别。这一数据说明，在AI应用落地加速的当下，开发者对“省算力、干实事”的模型需求正在急速放大。

客观来看，Ring-2.6-1T的开源策略与近期行业趋势高度吻合：API调用成本下降、开源权重开放、双模式灵活配置，让中小团队也能低成本接入高性能推理。但也要看到，1T参数的规模在本地部署上仍有门槛，百灵如何平衡模型容量与可部署性，将是下一阶段值得观察的方向。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

蚂蚁百灵Ring-2.6-1T开源，Agent执行能力全面增强

相关推荐

发表回复