腾讯混元T1正式版发布,推理能力媲美DeepSeek-R1,价格更亲民

腾讯近日正式宣布,其自主研发的混元大模型系列中的强推理模型——混元-T1,已完成升级并发布正式版本。这不仅标志着腾讯在人工智能领域取得的又一项重大技术进展,也预示着国产大模型在深度思考和推理能力上迈入新阶段。

腾讯混元T1正式版发布,推理能力媲美DeepSeek-R1,价格更亲民

据了解,混元-T1是腾讯自研的强推理模型,其文本生成速度惊人,可达每秒60至80个token,实际生成效果超越了此前的DeepSeek-R1等知名模型。事实上,今年2月中旬在腾讯元宝APP上线试用的混元T1-Preview推理模型,就已初露锋芒。而本次正式版的发布,则是在混元团队于3月初发布的业界首个超大规模Hybrid-Transformer-Mamba MoE大模型TurboS快思考基座的基础上,通过大规模的后训练,进一步扩展了推理能力,并更贴近人类的使用习惯和偏好。

腾讯混元T1正式版发布,推理能力媲美DeepSeek-R1,价格更亲民

为了客观评估混元-T1的性能,腾讯团队在多个公开数据集上进行了评测。结果显示,在MMLU-pro、Ceval、AIME、Zebra Logic等涵盖中英文知识、竞赛级数学以及逻辑推理等多个维度的指标中,混元-T1均表现出与R1旗鼓相当,甚至略胜一筹的水平。值得注意的是,在腾讯内部的人工体验评估中,该模型在文创指令遵循、文本摘要、Agent能力等方面也获得了略微的优势。这些数据表明,混元-T1在实际应用场景中具备很强的竞争力。

在知识问答方面,腾讯混元研究团队通过对比T1与DeepSeek的生成效果,展示了T1的强大实力。无论是面对“醋酸乙酯能与水混合吗”这类基础问题,还是更为复杂的理科数学推理挑战,T1都能迅速给出准确答案,并且在速度上明显优于DeepSeek-R1。此外,T1还展现出了卓越的复杂指令跟随能力,例如,根据上联“深深浅浅溪流水”对出下联“洋洋洒洒波涛涌”,以及生成符合要求的个性化朋友圈文案等等。这些都体现了其强大的理解和生成能力。

腾讯混元T1正式版发布,推理能力媲美DeepSeek-R1,价格更亲民

混元-T1在长文总结摘要方面的能力同样令人印象深刻。例如,在对一篇关于微软收购暴雪的新闻报道进行摘要时,T1不仅精准地概括了文章的主要内容,还高效地提取出了多个关键数字,充分展现了其作为生产力工具的巨大潜力。其角色扮演能力也十分出色,如模拟李白猜字谜并赋诗一首,充分体现了其深厚的文化底蕴和创造力。

腾讯混元T1正式版发布,推理能力媲美DeepSeek-R1,价格更亲民

从技术层面来看,混元-T1正式版延续了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这种架构是业界首次将混合Mamba架构成功应用于超大型推理模型,具有重要的创新意义。该架构不仅有效降低了传统Transformer架构的计算复杂度,显著减少了KV-Cache内存占用,还有效降低了训练和推理成本。在处理长文本推理任务时,TurboS的长文捕捉能力能够有效解决上下文信息丢失和长距离依赖等问题,从而在相同的部署条件下实现更快的解码速度。

腾讯混元T1正式版发布,推理能力媲美DeepSeek-R1,价格更亲民

在模型后训练阶段,腾讯混元研究团队将大部分算力投入到强化学习训练中,着重提升模型的纯推理能力和对齐人类偏好。他们通过收集多样化且难度分级的复杂指令数据,并采用课程学习的方式循序渐进地提升数据难度,同时逐步扩展模型上下文长度,从而使模型在提升推理能力的同时,能够更高效地利用token进行推理。此外,研究团队还采用了经典强化学习的数据回放、阶段性策略重置等策略,进一步提升了模型训练的长期稳定性。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2025年 3月 22日 上午1:50
下一篇 2025年 3月 22日 上午4:19

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!