智元机器人发布GO-1通用具身基座大模型，赋能具身智能发展

近日，中国机器人公司智元正式发布了其首个通用具身基座模型——智元启元大模型（Genie Operator-1，简称GO-1），标志着具身智能领域迈出了关键一步。在人工智能日新月异的背景下，GO-1的推出无疑为机器人从“特定任务执行者”向“通用型智能助手”转型提供了强劲动力。

GO-1的核心架构是独创的Vision-Language-Latent-Action (ViLLA) 架构，它巧妙地融合了VLM（多模态大模型）与MoE（混合专家）两大组件。VLM通过海量互联网图文数据的学习，赋予模型卓越的场景感知和语言理解能力。而MoE则由Latent Planner（隐式规划器）和Action Expert（动作专家）两部分构成。

为了训练出这一高性能模型，智元在2024年底推出了AgiBot World，这是一个包含超过100万条轨迹、涵盖217个任务、涉及五大场景的大规模高质量真机数据集。可以说，GO-1的成功，离不开AgiBot World提供的坚实数据支撑。高质量数据集的投入，往往是AI模型性能提升的关键因素。

ViLLA架构最重要的创新在于引入了Latent Action Tokens（隐式动作标记）。与之前的Vision-Language-Action (VLA)架构直接将图像-文本输入映射到机器人动作不同，ViLLA架构通过预测Latent Action Tokens，有效弥补了输入与动作之间的语义鸿沟，提升了模型的泛化能力。

具体来说，在推理过程中，VLM、Latent Planner和Action Expert三者协同工作。VLM基于InternVL-2B模型，接收多视角视觉图片、力觉信号和语言指令等多种模态信息，进行场景感知和意图理解。Latent Planner则根据VLM的中间层输出，预测Latent Action Tokens，形成规划链（Chain of Planning），进行动作理解和规划。最后，Action Expert结合VLM的中间层输出和Latent Action Tokens，生成精细的动作序列，驱动机器人执行。

智元机器人发布GO-1通用具身基座大模型，赋能具身智能发展

Latent Planner和Action Expert在MoE中扮演着至关重要的角色。Latent Planner通过预测离散的Latent Action Tokens，将异构数据源（例如互联网视频和人类操作视频）中的真实世界动作知识迁移到通用操作任务中。Action Expert则采用Diffusion Model作为目标函数，建模低层级动作的连续分布，从而实现高频且灵活的操控。

实验结果表明，ViLLA架构展现出强大的性能。在五种不同复杂度的任务测试中，GO-1相比已有的最优模型，平均成功率提升了32%，尤其在“倒水”、“清理桌面”和“补充饮料”等需要复杂操作的任务中表现突出。单独验证Latent Planner的作用也显示，其能够提升12%的成功率。这些数据充分证明了ViLLA架构和Latent Planner的有效性。

智元机器人发布GO-1通用具身基座大模型，赋能具身智能发展

除了卓越的性能，GO-1大模型还具备强大的学习能力，能够结合互联网视频和真实人类示范进行学习，增强对人类行为的理解。更重要的是，它具备小样本快速泛化的能力，能够在极少数据甚至零样本的情况下，泛化到新场景和新任务，这大大降低了具身模型的使用门槛，加速了其在实际应用中的落地。此外，GO-1还支持部署到不同的机器人本体，实现快速适配和群体智能。

为了进一步推动具身智能的发展，智元还推出了自主研发的大型仿真框架AgiBot Digital World。该框架提供了灵活的仿真数据生成方案、预训练的大规模仿真数据和统一的模型评测标准，为机器人操作提供了强大的研发工具和环境。

智元机器人发布GO-1通用具身基座大模型，赋能具身智能发展

智元公司表示，GO-1大模型的推出将加速具身智能的普及，推动机器人从“工具”向“自主体”发展。展望未来，我们有理由相信，具备通用智能的机器人将在商业、工业、家庭等多个领域发挥越来越重要的作用，为人类创造更加便捷、智能的生活。然而，如何在伦理和安全层面保障具身智能健康发展，仍是行业需要共同思考的问题。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

智元机器人发布GO-1通用具身基座大模型，赋能具身智能发展

相关推荐

发表回复