具身智能与大模型的融合已成为科技界关注的焦点,行业正逐步从单纯的硬件创新转向“大脑”与“身体”的协同进化。在这一背景下,机器人如何具备更高级的认知与决策能力,成为衡量技术落地价值的关键指标。
波士顿动力近日宣布,其标志性的机器狗”Spot”已成功集成谷歌 DeepMind 开发的高级 AI 模型——Gemini Robotics-ER1.6。这一重磅升级显著提升了 Spot 在工业巡检场景中的性能,特别是在识别泄漏风险和读取仪表数据方面表现出色。
这一技术突破源于波士顿动力与谷歌 DeepMind 的紧密协作,双方重点攻关如何提升机器人在工业环境中的自主决策能力。集成 Gemini 模型后,Spot 不仅能在巡逻过程中有效识别潜在的爆炸风险,还能自主定位危险碎片或泄漏点。这种能力的跃升,极大增强了 Spot 在复杂工业场景中的实际应用价值。
具体而言,Spot 现在能够读取复杂的仪器表盘和镜面反射数据,这对于监控工业设施的安全至关重要。当遇到需要进一步理解的环境时,它可以智能调用视觉 – 语言 – 动作模型(VLA)等其他 AI 工具辅助完成任务。这一功能使 Spot 不再仅仅是一个“执行者”,而是转变为真正的“协作者”。
波士顿动力同时在 YouTube 发布了视频,展示 Spot 的新能力。视频中,Spot 在模拟工业环境中工作,演示了自主识别和处理问题的流程。此类演示引发了业界对工业自动化未来的极大兴奋与期待。
随着 AI 技术的持续演进,像 Spot 这样的机器人将在各个行业中扮演愈发重要的角色。波士顿动力与谷歌的合作标志着机器人技术与人工智能的深度整合,这也预示着工业安全巡检将迎来更智能、更高效的未来。
从行业视角分析,此次合作不仅是单一产品的升级,更是具身智能规模化落地的信号。然而,如何将实验室能力稳定移植到高噪、动态的真实工厂环境,以及成本控制与数据隐私问题,仍是后续需要克服的挑战。