昆仑万维在人工智能领域持续深耕,近期重磅推出“天工大模型4.0”o1版——Skywork o1,标志着其在中文逻辑推理领域取得重大突破。Skywork o1并非简单复现OpenAI o1模型,而是融入了更高级的思考、计划和反思能力,实现了通过内在认知过程提升推理能力的目标。其在标准评测集上的表现显著优于普通模型,成功将初始推理能力较弱的基座模型提升至行业领先水平。
Skywork o1系列包含三款模型,以满足不同用户需求:
Skywork o1 Open:基于Llama 3.1 8B开源模型,在同生态位模型中取得了SOTA水平,其评测指标大幅提升,甚至成功完成许多轻量级模型无法胜任的复杂数学任务,例如24点计算。其开源发布将有力推动国内开源社区o1模型的复现进程,并为轻量级设备部署推理模型提供了新的可能性。此外,昆仑万维还开源了两个推理任务的Process Reward Model(PRM):Skywork o1 Open-PRM-1.5B和Skywork o1 Open-PRM-7B。 这两个PRM能够对模型回答的每个步骤进行评分,而非仅对最终答案评分,其性能在大部分基准测试中都显著优于之前的开源PRM。

Skywork o1 Lite:具备完整的思考能力,中文支持和推理速度尤为出色。在数学、中文逻辑和推理类问题上展现了强大的性能,为用户提供高效的推理服务。
Skywork o1 Preview:作为完整版推理模型,配备自研的线上推理算法,拥有更深入细致的思考过程和更完善的推理能力,相比Lite版本,其推理能力和思考深度都有显著提升。例如,在解决复杂的考研数学题时,它能够逐步推导出正确答案。
Skywork o1 在逻辑推理能力的显著提升,源于昆仑万维自研的三阶段训练方案:首先,利用自研的多智能体系统构建高质量的分步思考、反思和验证数据,对基座模型进行持续预训练和监督微调;其次,研发了适配分步推理的Skywork o1 PRM,有效捕捉到复杂推理任务中间步骤和思考步骤对最终答案的影响;最后,基于自研的Q*线上推理算法,配合模型在线思考,寻找最佳推理路径。 这三阶段方案的有效结合,使得Skywork o1能够在复杂场景下进行更精准、高效的推理。
Skywork o1 展现了模型思考、规划、自我反思和自我验证等多项亮点功能。在复杂问题分析、思考反思过程以及输出答案质量上,Lite和Preview线上版本均有明显提升。例如,在“算24点”游戏中,Skywork o1不仅给出正确答案,还会进行自我验证,确保过程和答案符合题目要求。在竞赛数学、密码解密和智力问答等复杂场景中,Skywork o1也展现出优异性能,甚至能够识别并纠正错误的读音,并给出后续对话建议。

从2024年以来,昆仑万维持续加大在人工智能领域的投入,陆续发布了“天工2.0”、“天工3.0”、“天工大模型4.0”4o版(Skywork 4o)以及Skywork o1。这些举措体现了公司“All in AGI 与 AIGC”的战略决心,并为其构建AI技术栈奠定了坚实基础。未来,昆仑万维将继续秉持“实现通用人工智能,让每个人更好地塑造和表达自我”的使命,从模型层、应用层等多维度构建公司的技术竞争力和生态矩阵。