智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

近日，智元机器人公司发布了其通用具身基座模型——智元启元大模型Genie Operator-1 (GO-1)。这款模型以其创新的Vision-Language-Latent-Action (ViLLA)框架，预示着机器人技术在智能化和通用化方面取得了显著进展。GO-1的发布不仅是智元机器人在具身智能领域的一次重要突破，也为整个机器人行业的未来发展方向提供了一个新的视角。

GO-1模型的核心在于其ViLLA框架，该框架巧妙地结合了VLM（多模态大模型）和MoE（混合专家）技术。VLM作为模型的主干网络，借鉴了开源多模态大模型的优势，并通过海量的互联网数据进行训练，从而赋予了GO-1强大的环境感知和语义理解能力。这种能力是机器人执行复杂任务的基础，使其能够“看懂”并“理解”周围的世界。

MoE（混合专家）架构则进一步提升了模型在复杂任务下的规划和执行能力。隐动作专家模型和动作专家模型的协同工作，使得GO-1能够从理解高层指令到执行精细化动作之间实现无缝衔接。这种模块化的设计思路使得模型更具灵活性和可扩展性，可以更容易地适应不同的任务需求，并持续优化其性能。

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

GO-1的一项关键特性是其小样本快速泛化能力。这意味着它只需极少量的训练数据，甚至在零样本条件下，就能快速适应新的场景和任务。这对于降低机器人部署和维护成本至关重要，因为无需针对每个特定应用场景进行大规模的数据采集和训练，从而大大缩短了机器人的部署周期。同时，“一脑多形”的跨本体应用能力也进一步增强了GO-1的通用性，使其能够在不同形态的机器人平台上灵活迁移和应用。这种通用性为机器人技术的更广泛应用打开了新的大门。

在知识学习方面，GO-1采用了一种基于具身领域数字金字塔的知识体系构建方法。从底层的大规模纯文本和图文数据，到顶层的高质量真机示教数据，该体系构建了一套完整的知识图谱。通过这种结构化的学习方式，GO-1不仅能够理解通用知识和场景，还能通过学习人类操作视频和仿真数据，掌握各种动作操作模式，从而实现精准的动作执行。这表明智元在数据处理和模型训练方面采取了高效且有效的方法。

在实际应用场景中，GO-1展现出了极高的实用价值。无论是在家庭场景中，协助完成准备餐食、收拾桌面等日常任务，还是在办公和商业场景中，进行访客接待、物品发放等工作，GO-1都能轻松应对。用户只需通过简单的自然语言指令，GO-1就能迅速理解并执行相应的任务。例如，“挂衣服”这样简单的口头指令，GO-1就能根据其已学习的知识和经验，自动完成从识别衣物到将衣物挂起的整个过程。这种便捷性和易用性将大大提升人们与机器人的互动体验。

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

更值得一提的是，GO-1具备持续进化的能力。通过智元公司提供的数据回流系统，GO-1能够不断从实际执行过程中遇到的问题数据中学习，从而不断优化自身的性能。例如，当机器人在制作咖啡时不小心将杯子放歪时，GO-1可以通过数据回流系统记录并学习这一错误，从而在后续任务中避免类似问题的发生。这种持续学习和自我改进的能力是未来机器人发展的关键趋势，也是实现真正智能化的重要保障。

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

智元启元大模型GO-1的成功发布，不仅是机器人技术智能化道路上的一个重要里程碑，更重要的是，它为具身智能的通用化、开放化与智能化发展奠定了坚实的基础。随着技术的不断进步和应用场景的持续拓展，我们有理由相信，未来的机器人将更加智能、更加灵活，能够更好地服务于人类社会的各个领域，甚至改变我们与世界的互动方式。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

相关推荐

发表回复