昆仑万维Skywork o1:强推理与自我反思,AI新里程碑?

昆仑万维在人工智能领域持续深耕,近期重磅推出“天工大模型4.0”o1版——Skywork o1,标志着其在中文逻辑推理领域取得重大突破。Skywork o1并非简单复现OpenAI o1模型,而是融入了更高级的思考、计划和反思能力,实现了通过内在认知过程提升推理能力的目标。其在标准评测集上的表现显著优于普通模型,成功将初始推理能力较弱的基座模型提升至行业领先水平。

Skywork o1系列包含三款模型,以满足不同用户需求:

Skywork o1 Open:基于Llama 3.1 8B开源模型,在同生态位模型中取得了SOTA水平,其评测指标大幅提升,甚至成功完成许多轻量级模型无法胜任的复杂数学任务,例如24点计算。其开源发布将有力推动国内开源社区o1模型的复现进程,并为轻量级设备部署推理模型提供了新的可能性。此外,昆仑万维还开源了两个推理任务的Process Reward Model(PRM):Skywork o1 Open-PRM-1.5B和Skywork o1 Open-PRM-7B。 这两个PRM能够对模型回答的每个步骤进行评分,而非仅对最终答案评分,其性能在大部分基准测试中都显著优于之前的开源PRM。

昆仑万维Skywork o1:强推理与自我反思,AI新里程碑?

Skywork o1 Lite:具备完整的思考能力,中文支持和推理速度尤为出色。在数学、中文逻辑和推理类问题上展现了强大的性能,为用户提供高效的推理服务。

Skywork o1 Preview:作为完整版推理模型,配备自研的线上推理算法,拥有更深入细致的思考过程和更完善的推理能力,相比Lite版本,其推理能力和思考深度都有显著提升。例如,在解决复杂的考研数学题时,它能够逐步推导出正确答案。

Skywork o1 在逻辑推理能力的显著提升,源于昆仑万维自研的三阶段训练方案:首先,利用自研的多智能体系统构建高质量的分步思考、反思和验证数据,对基座模型进行持续预训练和监督微调;其次,研发了适配分步推理的Skywork o1 PRM,有效捕捉到复杂推理任务中间步骤和思考步骤对最终答案的影响;最后,基于自研的Q*线上推理算法,配合模型在线思考,寻找最佳推理路径。 这三阶段方案的有效结合,使得Skywork o1能够在复杂场景下进行更精准、高效的推理。

Skywork o1 展现了模型思考、规划、自我反思和自我验证等多项亮点功能。在复杂问题分析、思考反思过程以及输出答案质量上,Lite和Preview线上版本均有明显提升。例如,在“算24点”游戏中,Skywork o1不仅给出正确答案,还会进行自我验证,确保过程和答案符合题目要求。在竞赛数学、密码解密和智力问答等复杂场景中,Skywork o1也展现出优异性能,甚至能够识别并纠正错误的读音,并给出后续对话建议。

昆仑万维Skywork o1:强推理与自我反思,AI新里程碑? 昆仑万维Skywork o1:强推理与自我反思,AI新里程碑? 昆仑万维Skywork o1:强推理与自我反思,AI新里程碑?

从2024年以来,昆仑万维持续加大在人工智能领域的投入,陆续发布了“天工2.0”、“天工3.0”、“天工大模型4.0”4o版(Skywork 4o)以及Skywork o1。这些举措体现了公司“All in AGI 与 AIGC”的战略决心,并为其构建AI技术栈奠定了坚实基础。未来,昆仑万维将继续秉持“实现通用人工智能,让每个人更好地塑造和表达自我”的使命,从模型层、应用层等多维度构建公司的技术竞争力和生态矩阵。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2024年 11月 27日 下午12:51
下一篇 2024年 11月 27日 下午2:18

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!