机器人进工厂,比学人类跳舞更难
当聚光灯都打在双足机器人跑马拉松、翻跟头甚至登上春晚舞台时,一个更本质的问题被有意无意地忽略了。制造业工厂里,老板们关注的不是机器人能完成多惊艳的动作,而是一个直击灵魂的质问:这玩意到底什么时候能替我干活?
跑完21公里是一回事,连续几个月在汽车焊接产线上零失误、不掉链子,完全是另一回事。这种从“表演价值”到“生产价值”的切换,正成为具身智能行业下一阶段的核心分水岭。最近,一家由清华大学直接持股的具身智能公司——光象科技,给出了一个颇具现实感的答案。他们正式发布了工业级自进化具身智能机器人 Phi-Bot X1。在2026 ATC展会蔚来汽车的焊接上下料场景中,X1完成了一次硬核“入职测试”:连续3天、累计21.5小时的上下料作业,零失误、零中断。 更关键的是,从模型导入到真实产线部署,整个过程仅需 一周时间。这种工程落地速度,确实很“清华系”。
值得深思的是,当整个行业还在为“人形”的形态之争争吵不休时,光象选择了一条更务实的路径:不从“像人”出发,而从“干活”出发。 他们试图打造的是一种全新的“智能生产力”——不纠结于机器人能否像人一样生活,而是聚焦于它能否像熟练工人一样创造价值。
工厂需要的不是演员,是“打工人”
如果把具身智能行业比作考场,很多公司提交的答案是一段“展示视频”。而光象科技的选择,是直接交出一份“生产成本报表”。这两种做法的本质差异在于:前者关注动作的完成度,后者关注价值的确定性。在深度调研了制造业工厂的真实痛点后,光象发现答案高度集中在四个关键词上:高精度、高节拍、高可靠、高安全。
为此,Phi-Bot X1从设计之初就彻底抛弃了“先造机器人再找场景”的常规思路,而是反推工程需求。
在移动能力上,X1采用 四舵轮全向底盘。这并非炫技,而是因为汽车工厂的工位空间极为狭窄,传统的差速驱动需要预留巨大的转向空间。全向底盘能在有限空间内实现横向蟹行、斜向移动甚至原地回转,像一位“老司机”在侧方停车一样精准。同时,它配备的 工业级升降腰结构,工作范围覆盖0至2.5米,这意味着同一台机器人可以同时完成低位抓取和高位操作,大大提升了产线灵活性。
操作层面,X1拥有 27个自由度,以及全关节 力控 双臂。基于1kHz的协同控制和实时力反馈,机器人不仅知道自己“在哪”,还知道“碰到了什么”以及“该用多大力”。拿扳手、插线束、搬零件,无论是精密装配还是重物搬运,都需要这种工业世界里的“分寸感”。它搭载了3D激光雷达、RGBD深度相机、双目相机和超声波雷达,几乎把能装的“眼睛”都装上了,实现了10mm的全局定位精度和0.05mm的末端重复定位精度。更重要的是,所有这些能力都集成在机器人本体上,不依赖复杂的工厂外部改造。光象的思路很清晰:让机器人去适应工厂,而不是强迫工厂为机器人改造产线,这直接降低了智能化升级的门槛。
至于实战成绩,X1在移动质检场景中实现了车身表面100%检测覆盖率,效率相比非协同方案 提升51%;在焊接上下料场景中,动态位置精度达到毫米级。连续21.5小时零故障运行的成绩,证明它已经具备了从测试场走入生产线的资格。
水面下的核心:自进化的“物理智能”
如果说Phi-Bot X1是浮出水面的“冰山”,那么支撑它的底层竞争力,是光象围绕强化学习、世界模型、数据飞轮和开发平台构建的一整套体系。因为机器人行业真正难复制的,从来不是硬件——机械结构可以买,供应链可以追,参数能被刷新。机器人如何学习,才是真正的护城河。
当前行业主流路线是基于VLA(视觉-语言-动作)的模仿学习,本质上是让机器人通过大量示范数据“照猫画虎”。看过、练过的动作可以完成,但一旦遇到没见过的任务或环境变化,就容易失效。光象选择押注一条更艰难但也更本质的路线:让机器人理解物理世界的规律。这就像小孩第一次拿杯子会失败,但随着不断尝试,他会慢慢理解重力、摩擦力和惯性,之后下次换一个陌生杯子,依然知道如何操作。这就是举一反三的能力。
为此,光象打造了强化学习 算法矩阵“Phi-RL Matrix” ,构建了覆盖仿真强化学习、真机强化学习和世界模型强化学习的技术体系。其中,DSAC负责精度,DACER负责环境适配与成功率,MVP负责动作平顺,RACS负责运行安全。但强化学习的核心瓶颈一直是“大规模真机试错成本过高”。为了突破这一点,光象提出了 数据“Phi-Space”——一个基于高保真场景建模和生成式扩增的机器人训练营。在这里,机器人可以在虚拟环境中无休止地重复训练,跌倒再爬起,直到把技能练成“肌肉记忆”,从而在进入真实工厂前就具备强大的“物理直觉”。
算法和数据之外,工业客户最关心的是部署周期。Phi-Bot X1目前能做到一周部署,这背后是 全链路开发平台“Phi-Arch” 的支撑。该平台贯通了从数据生成、模型训练、参数优化到部署上线的全过程,并计划将部署时间进一步缩短到 以天为单位。由此,一个持续运转的数据飞轮形成:机器人工作产生数据,数据训练模型,模型反馈机器人继续学习和进化。这也是光象所定义的“自进化机器人”的核心意义。
先工业,再服务,后家庭:一场高难度的资格赛
光象科技选择汽车工厂作为“第一站”,并非偶然。创始人张涛认为,汽车制造是具身智能最适合成长的训练场。因为它足够复杂:冲压、焊装、涂装、总装等环节包含大量不同任务;又足够标准:工艺流程明确,质量要求统一,易于形成规模复制。对机器人来说,这是一场高难度考试,但通过之后,它获得的不是单一技能,而是一整套工业世界里的通用能力。
从行业趋势来看,关注点正在从“机器人能不能完成一个动作”,转向更现实的问题:机器人能不能在100个工位成功100次?能不能从1家工厂复制到10家工厂?能不能从一个任务扩展成一类任务?汽车产业恰好提供了这样的验证环境。未来,这套能力可以进一步迁移到汽车零部件、工程机械、轨道交通、3C电子等更多制造领域,因为这些行业背后都有大量相似的工业任务需要解决。
在长远路径规划上,光象非常务实:先工业,再商业服务,最后进入家庭。 不过张涛也坦言,进入家庭场景的产品形态目前还没有标准答案,最终取决于机器人能为家庭提供什么样的价值。
团队与背后的“迁移价值”
聊完产品,也得聊聊团队。光象科技的背景中有一个显著标签:“含华量” 极高。它是清华大学车辆与运载学院和人工智能学院联合孵化的企业。这并非简单的履历加分,因为具身智能正在从“拼模型”进入“拼工程”的阶段,而清华系团队在自动驾驶和AI落地方面的经验,恰好能产生关键性的 “迁移价值”。
创始人张涛是清华大学博士,曾担任阿里巴巴高德地图技术总监,长期从事空间感知与多传感器融合研究。其带领团队研发的定位感知技术曾连续三年获得国际定位大赛冠军,并落地长城汽车等量产自动驾驶系统。联合创始人李升波是清华大学人工智能学院教授,其主导研发的iDrive系统被认为是国内最早的全神经网络端到端自动驾驶系统之一。这种扎实的工程落地能力,是光象区别于许多“PPT机器人公司”的核心优势。此外,其股东阵容中的埃夫特、L2F、东方富海等产业资本,也从侧面印证了其技术与产业方向的认可度。
回到开篇的问题: 过去两年,具身智能行业最热的关键词是人形机器人。但未来几年,更重要的关键词或许会变成另一件事:智能生产力。光象科技正在用Phi-Bot X1回答一个比“机器人长什么样”更重要的问题,即“机器人如何成为真正的生产工具”。当然,进入产线只是第一步。对于工业机器人来说,短暂的成功运行不是难点,长期、可靠、经济地运行才是。如何将数据飞轮持续转动,如何从单一场景泛化到更广泛的工业领域,甚至最终走向商业和家庭服务,这场“智能生产力”的竞赛,才刚刚拉开序幕。