智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

近日,智元机器人公司发布了其首款通用具身基座模型——智元启元大模型Genie Operator-1(简称GO-1),在人工智能领域引发高度关注。 该模型引入了Vision-Language-Latent-Action(ViLLA)框架,展现出强大的通用性和环境适应性,标志着机器人技术正在迈向一个全新的发展阶段。

智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

GO-1 的核心在于其创新的 ViLLA 框架。这一框架巧妙地融合了VLM (多模态大模型) 与 MoE (混合专家) 技术,相互协同,实现了更加智能化的动作感知与执行。 具体而言,VLM 作为模型的主干网络,凭借着海量的互联网纯文本和图文数据训练,赋予了 GO-1 卓越的场景理解和认知能力,使其能够更好地理解周围环境,为后续的动作执行奠定基础。MoE 则通过隐动作专家模型和动作专家模型,增强了模型对动作的理解和执行能力。 尤其值得一提的是隐动作专家模型,它通过分析大量互联网上的人类操作和跨本体操作视频,使得 GO-1 能够快速理解并执行各种复杂的动作意图,极大地提升了机器人的灵活性和通用性 。

在模型构建的过程中,智元机器人还采用了具身领域的数字金字塔理念。 金字塔的底层是由互联网上的大规模纯文本和图文数据构成的基础知识库,为机器人提供基础知识和场景理解能力;上一层则是人类操作和跨本体视频数据,帮助机器人学习各种动作模式;再上一层是仿真数据,增强了机器人的泛化性,使其能够适应不同场景和物体;而金字塔的顶端则是高质量的真机示教数据,确保机器人动作的精准执行。这种分层递进的模型训练方式,保证了 GO-1 能够从海量数据中有效学习,并最终实现精准的动作控制。

智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

ViLLA 框架的引入是 GO-1 的另一大亮点。 与传统的Vision-Language-Action (VLA) 模型相比,ViLLA 通过预测隐式动作标记 (Latent Action Tokens) ,有效弥合了图像-文本输入与机器人执行动作之间的鸿沟。 例如,当用户使用自然语言向 GO-1 发出“挂衣服”的指令时,该模型能够迅速理解指令含义,并根据其学习到的知识和视频数据,将挂衣服这一复杂动作分解成一系列具体的步骤并依次执行。 这种处理方式更贴近人类的思维模式,使得人机交互更加自然高效。

智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

GO-1 不仅拥有先进的技术架构,更具备多项显著优势。其采训推一体化设计,简化了数据采集、模型训练和模型推理的流程,保证了整体效率。特别值得关注的是其小样本快速泛化能力,意味着 GO-1 即使在极少数据甚至缺乏数据的情况下,也能够迅速适应新场景和新任务。 此外,“一脑多形”的特性使得 GO-1 可以轻松地迁移至不同形态的机器人上使用,从而实现跨平台应用,有效降低了部署成本。 同时,通过智元自身的数据回流系统,GO-1 还能持续从实际执行中汲取经验,不断提升自身性能,实现自我进化。

智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

GO-1 的应用前景十分广阔,它能够快速适应并高效完成各种任务。无论是家庭场景中的准备餐食、收拾桌面,还是办公和商业场景中的接待访客、发放物品,亦或是工业等更复杂领域的各项操作,GO-1 都具备胜任的能力。 例如,如果机器人在制作咖啡的过程中不小心放歪了杯子,GO-1 就能从这次经历中学习并避免未来犯同样的错误。 这种持续学习和改进的能力,确保了 GO-1 能够随着使用时间的推移变得越来越智能和高效。

智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

GO-1 的发布标志着具身智能正加速走向通用化、开放化和智能化。 这一创新成果不仅为机器人技术注入了新的活力,也为机器人更广泛地应用于人类生活各领域提供了可能性。当然,通用机器人模型的研发依然面临诸多挑战,例如如何提升模型在复杂环境下的鲁棒性和安全性,以及如何降低模型的计算成本和能源消耗。 尽管如此,我们有理由相信,随着 GO-1 的不断优化和推广,未来的机器人将更加智能、灵活且适应性强,真正成为人类工作和生活中的得力助手。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2025年 3月 11日 上午1:28
下一篇 2025年 3月 11日 上午2:25

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!