智元机器人携手上海AI Lab、国家地方共建人形机器人创新中心及上海库帕思,于12月30日正式发布了全球首个基于真实全域场景、全能硬件平台及严格质量管控的大规模机器人数据集——AgiBot World。该项目标志着机器人领域数据集规模和质量的重大突破。

AgiBot World数据集的规模远超现有同类数据集。与Google的Open X-Embodiment数据集相比,其长程数据规模提升了10倍,场景覆盖范围扩大了100倍,数据质量也从实验室级别跃升至工业级标准。这一显著提升,主要源于智元机器人自建的大规模数据采集工厂与应用实验基地。
该基地模拟了家居、餐饮、工业、商超和办公五大核心场景,涵盖超过100种真实场景,其中家居场景占比40%,其余场景各占20%或10%。 值得注意的是,超过80%的数据来自时长在60秒到150秒之间的长程任务,这些任务的复杂度是DROID和Open X-Embodiment工作的5倍,通常包含多个原子技能。 目前数据集已包含3000多种物品,且仍在不断扩展中。

数据的采集工作由一台先进的轮式双臂机器人完成。该机器人配备了8个摄像头环绕式布局,6个主动自由度的灵巧手,标配末端六维力传感器,并可配备高精度视触觉传感器,全身最高可达32个自由度。这使得机器人能够精细感知力和完成复杂操作,例如:将碗碟放入洗碗机,使用挂烫机熨烫衣物,清扫地面,甚至清洁马桶等日常生活场景中的任务。在商业和工业场景中,机器人也能精准地完成搬运、扫码、打包等任务。


AgiBot World数据集展现了机器人完成复杂任务的能力,例如毫米级的精细控制(如插内存条)以及机器人间的协作(如共同搬运大型物体)。这些都体现了该数据集在推动机器人技术发展方面的巨大潜力。

未来,智元机器人计划陆续开源千万级仿真数据,并发布具身基座大模型,支持模型微调,同时提供全套工具链,涵盖数据采集、模型训练和评估,形成闭环,从而进一步促进机器人技术的研发和应用。