谷歌DeepMind新AI模型：让机器人无训练执行现实任务？

谷歌DeepMind在人工智能领域再次展现了其领先地位，推出了两款新型AI模型——Gemini Robotics 和 Gemini Robotics-ER。这两款模型旨在显著提升机器人在真实世界中的应用能力，这一举动无疑在AI与机器人领域引发了广泛的关注和讨论。

核心突破在于，Gemini Robotics 模型通过融合视觉、语言和行动能力，赋予了机器人一种前所未有的适应性。这意味着，机器人无需进行特定的预先训练，就能够理解并适应新的环境，并执行相应的任务。这一突破性的进展要归功于谷歌最新的AI旗舰模型 Gemini 2.0 的强大支持。根据DeepMind机器人部门高级总监 Carolina Parada 的介绍，Gemini Robotics 将 Gemini 2.0 本身就具备的多模态世界理解能力，巧妙地引入了物理行动这一全新的模态，从而实现了机器人在现实场景中的智能操作。

更具体地说，Gemini Robotics 在构建高效机器人所需的三大核心领域——通用性、互动性和灵活性上都取得了显著的进展。它不仅能够应对各种复杂且动态的情境，还在与人类及周围环境的互动中表现出色，并且能够执行更加精细的物理操作，例如精确地折叠纸张，或者轻松开启瓶盖等等。这些能力表明，Gemini Robotics 正在缩小机器智能与人类智能之间的差距。

谷歌DeepMind新AI模型：让机器人无训练执行现实任务？

另一款模型，Gemini Robotics-ER（具象推理），则专注于提升机器人对复杂且动态世界的理解能力。Parada 解释说，日常生活中看似简单的活动，比如装便当盒，实际上需要机器人充分理解物品的位置关系、操作的先后步骤等复杂的空间和逻辑信息。而这正是 Gemini Robotics-ER 的优势所在。通过与现有的低级控制系统对接，机器人专家可以利用 Gemini Robotics-ER 驱动机器人完成更为智能的任务，从而拓展机器人的应用边界。

谷歌DeepMind新AI模型：让机器人无训练执行现实任务？

考虑到机器人应用的安全问题，DeepMind 也高度重视。研究员 Vikas Sindhwani 透露，公司正在开发一种“分层安全策略”，并且 Gemini Robotics-ER 模型已经接受了专门的训练，用于评估特定情境下动作的安全性。此外，DeepMind 还发布了新的基准和框架，以推动 AI 领域的安全研究。事实上，早在去年 DeepMind 就推出了“机器人宪法”，这是一套受到科幻作家艾萨克·阿西莫夫的机器人三定律启发的行为规范，旨在规范机器人的行为，确保其安全可靠。

为了进一步推动机器人的发展和应用，DeepMind 也在积极寻求合作。目前，DeepMind 已经与 Apptronik 携手，共同致力于“打造下一代人形机器人”。与此同时，DeepMind 还向包括 Agile Robots、Agility Robotics、波士顿动力和 Enchanted Tools 在内的多家“受信任的测试者”开放了 Gemini Robotics-ER 模型。Parada 表示：“我们专注于开发能够理解物理世界并在其中行动的智能，我们非常期待将这一技术应用于多个领域和多种表现形式。” 这一表态预示着 DeepMind 将持续深耕机器人领域，并有望在未来为各行各业带来革命性的变革。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

谷歌DeepMind新AI模型：让机器人无训练执行现实任务？

相关推荐

发表回复