360自研AI大模型GPT2-O1亮相,数学逻辑推理能力达国际水平?

近日,360智脑在其官方公众号上宣布推出自主研发的AI大模型——360gpt2-o1,并强调其在推理能力,特别是数学和逻辑推理方面的显著提升。这一消息引发了业界广泛关注。

360gpt2-o1的优异表现并非偶然,其核心在于三大技术突破:合成数据优化、模型后训练以及“慢思考”范式。这三项技术的有效结合,使得360gpt2-o1在多项权威评测中超越了前代模型360gpt2-pro,并在与GPT-4o等国际领先模型的对比中表现出色。 这表明国内AI大模型技术正在快速发展,并逐渐缩小与国际先进水平的差距。

在具体的数学评测中,360gpt2-o1展现了强大的实力。它不仅在基础数学评测(如MATH和高考数学)中表现优异,还在AIME24和AMC23等权威数学竞赛中取得了令人瞩目的成绩,甚至超越了阿里巴巴最新开源的o1系列模型QWQ-32B-preview。这充分证明了360gpt2-o1在复杂数学问题推理方面的能力,为AI在科学研究和教育领域的应用提供了新的可能性。

360自研AI大模型GPT2-O1亮相,数学逻辑推理能力达国际水平?

为了克服高质量数学与逻辑推理数据稀缺的难题,360智脑团队在合成数据优化方面进行了大量工作。他们采用了指令合成和质量/多样性筛选等方法,构建了规模庞大且高质量的训练数据集,为模型的出色表现奠定了坚实的基础。这体现了数据在AI模型训练中的关键作用,以及360智脑团队在数据处理方面的技术实力。

360自研AI大模型GPT2-O1亮相,数学逻辑推理能力达国际水平?

在模型后训练阶段,360智脑团队采用了巧妙的两阶段训练策略:先利用小模型生成多样化的推理路径,再利用大模型进行RFT训练和强化学习训练。这种方法有效提升了模型的推理能力和反思纠错能力,使得模型能够更精准地解决复杂问题。这种分阶段训练方法值得其他AI模型研发团队借鉴和学习。

360自研AI大模型GPT2-O1亮相,数学逻辑推理能力达国际水平?

此外,“慢思考”范式是360gpt2-o1的另一大亮点。该范式模拟人类的思维过程,利用蒙特卡洛树搜索探索多种解决方案,并结合LLM进行错误验证和纠错,最终生成包含反思、验证、纠错和回溯的长思维链。这使得模型的推理过程更加透明和可解释,也为未来AI模型的可解释性研究提供了新的方向。

360自研AI大模型GPT2-O1亮相,数学逻辑推理能力达国际水平?

360智脑官方还公开了360gpt2-o1的整体架构图,进一步增强了模型的透明度,也为学术界和工业界提供了宝贵的参考。 公开架构图有助于促进技术交流和共同进步,推动AI领域更快发展。

360自研AI大模型GPT2-O1亮相,数学逻辑推理能力达国际水平?

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2024年 12月 14日 上午10:28
下一篇 2024年 12月 14日 下午12:20

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!