DeepSeek R1小版本大升级,深度思考与工具调用能力全面飞跃!

人工智能领域持续迎来突破,近日,国产大模型DeepSeek(深度求索)R1模型于5月28日完成了一次重要的迭代升级,新版本命名为DeepSeek-R1-0528。这一升级并非简单的bug修复,而是全方位能力的提升。用户现在可以通过DeepSeek官方渠道,包括网站、App以及小程序,开启“深度思考”功能,第一时间体验这最新一代的智能服务。为了保证用户体验的平滑过渡,API接口也已同步更新,并维持原有调用方式不变,最大程度减少迁移成本。

紧随其后,5月29日晚间,深度求索官方公布了DeepSeek-R1-0528版本的详细升级亮点,揭示了本次升级背后的核心驱动力。本次升级的关键在于显著增强的“深度思考”能力。值得注意的是,虽然该版本仍然基于2024年12月发布的DeepSeek V3 Base模型,但通过在后训练阶段投入了巨大的算力资源,促使模型在思维深度和逻辑推理能力上实现了质的飞跃。在数学、编程以及通用逻辑等多个关键测评中,DeepSeek-R1-0528的表现已经跻身国内顶尖水平,部分性能甚至可以和国际领先模型,如o3(推测为OpenAI模型)与Gemini-2.5-Pro相提并论。这一进步表明国产大模型在追赶国际先进水平的道路上迈出了坚实的一步。

具体来看,新版R1模型在复杂推理型任务上的性能提升尤为显著。例如,在难度极高的AIME 2025测试中,其准确率从旧版的70%大幅跃升至87.5%。导致这一显著进步的关键因素在于模型推理过程中的“思维深度”得到了实质性的加强。数据显示,新版模型在解决问题时平均会使用高达23K tokens,远高于旧版的12K tokens,这表明它能够进行更为细致和深入的思考和推理,从而构建更完善的解题策略。更多tokens的使用也暗示了模型在解决问题时能够考虑更多上下文信息,减少片面性。

此外,深度求索官方还巧妙地利用DeepSeek-R1-0528的“思维链”进行蒸馏学习,并成功训练出DeepSeek-R1-0528-Qwen3-8B模型。在数学测试AIME 2024中,这个8B模型紧随DeepSeek-R1-0528之后,且表现优于原生的Qwen3-8B模型高达10%,甚至可以与参数量更大的Qwen3-235B模型相媲美。这项成果不仅对学术界研究推理模型具有重要的启示意义,也为工业界开发小型模型提供了全新的思路和方法,验证了通过蒸馏学习可以有效提升小模型的性能。

除了深度思考能力的提升,新版DeepSeek R1在降低“幻觉”(即模型生成不真实信息)方面也进行了卓有成效的优化。官方数据显示,在改写润色、总结摘要以及阅读理解等常见应用场景中,新版模型生成“幻觉”的概率降低了约45%至50%,从而提供了更为准确和可靠的结果。在创意写作方面,新版R1也能够生成篇幅更长、结构更完整、风格更接近人类偏好的作品。其创作范围涵盖了议论文、小说、散文等多种文体,展现了其在内容生成方面的广泛适应性。虽然目前DeepSeek-R1-0528还不支持在“深度思考”过程中直接调用外部工具,但在Tau-Bench测评中的表现已经与OpenAI的o1-high模型相当,进一步佐证了其技术实力。

DeepSeek R1小版本大升级,深度思考与工具调用能力全面飞跃!

值得关注的是,国内互联网巨头腾讯也迅速响应了这一技术升级,并宣布旗下核心产品,如元宝、ima、搜狗输入法以及QQ浏览器等,已经全面接入了DeepSeek R1-0528最新版。这一举措意味着上述产品的推理能力、代码生成能力、写作表现以及思考逻辑等方面都将得到显著提升。用户只需要打开相应的App,并选择DeepSeek模型R1的“深度思考”模式,即可免费、不限量地体验这一智能升级带来的便利。腾讯方面表示,从模型开源到产品正式上线,整个过程仅仅花费了不到一天的时间,充分展示了其在人工智能领域的快速反应和高效部署能力。这次合作也体现了国产大模型生态的蓬勃发展,以及大型企业对国产技术的积极拥抱。

DeepSeek R1小版本大升级,深度思考与工具调用能力全面飞跃!

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 6天前
下一篇 6天前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!