Rain科技6月19日消息,今日,银河通用机器人正式发布全球首个人形机器人通用小脑GPT基础模型——AstraBrain-WBC 0.5。
在人形机器人领域,运动控制一直是核心挑战。传统方法依赖手动调参和规则设计,难以应对复杂动态场景。AstraBrain-WBC 0.5的推出,本质上将运动控制转化为数据驱动的序列预测问题,类似于大语言模型处理文本的方式。这种“小脑”模型并不直接规划高层任务(属于“大脑”功能),而是负责实时协调全身关节、保持平衡并执行精细动作,正是机器人从实验室走向实用化的关键一步。
据官方介绍,该模型基于2万小时人类动作数据训练,打造行业最大规模人形机器人运动语料库,参数规模达8040万。
值得注意的是,这也是全球首个达到GPT-1量级的人形机器人全身实时运控大模型。
所谓“GPT-1量级”,并非指模型参数量与GPT-1完全一致,而是强调其采用了类似GPT的因果Transformer架构,并首次将运动控制任务重新定义为连续序列预测问题。这与传统强化学习或模型预测控制(MPC)的路线截然不同,意味着模型可以通过扩大数据量和计算规模来持续提升性能,展现出类似大语言模型的“规模定律”效应。
据悉,AstraBrain-WBC 0.5首次采用GPT风格的因果Transformer架构,将全身控制重新定义为连续序列预测问题。
实验表明,随着训练数据从200万帧扩展至20亿帧,模型零样本追踪成功率从83.26%提升至92.58%。
这一数据增长带来的提升十分显著:从200万帧到20亿帧,数据量扩大了1000倍,而成功率仅提升了约9个百分点,说明模型已进入性能饱和区间。但值得注意的是,零样本场景下能够达到92.58%的追踪成功率,意味着模型已具备较强的泛化能力,能够处理训练集中未出现的动作模式。例如,篮球、拳击、舞蹈、翻身起立、协作搬运等高动态复杂任务均可以零样本执行,这在实际部署中具有重要价值——机器人无需针对每种新动作重新训练,即可快速适应。
银河通用表示,AstraBrain-WBC 0.5实现了大量训练集中从未出现过的高动态动作零样本执行,包括篮球、拳击、舞蹈、翻身起立、协作搬运等复杂任务。
目前,AstraBrain-WBC 0.5相关论文、代码与技术成果已经全面开源,向生态开放。
从行业视角来看,开源策略有望加速人形机器人运动控制领域的技术迭代,吸引更多研究者和开发者参与。同时,该模型将全身控制与GPT风格的架构结合,为人形机器人的“小脑”提供了可规模化训练的新范式。未来,随着数据量和计算资源的进一步增长,其性能还有望持续突破,推动人形机器人在物流、制造、服务等场景中的实际落地。


