首个为具身智能而生的大规模强化学习框架RLinf重磅开源

AI快讯网 9月1日消息，清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf，其为首个面向具身智能的“渲训推一体化”大规模强化学习框架。RLinf的系统可以抽象为用户层（统一编程接口）、任务层（多后端集成方案）、执行层（灵活执行模式）、调度层（自动化调度）、通信层（自适应通信）和硬件层（异构硬件）6大层级。相比其他框架的分离式执行模式，RLinf提出的混合式执行模式，在具身智能训练场景下实现了超120%的系统提速，VLA模型涨幅40%-60%。同时，RLinf高度灵活、可扩展的设计使其可快速应用于其他任务，所训练的1.5B和7B数学推理大模型在AIME24、AIME25和GPQA-diamond数据集上取得SOTA。（广角观察）

首个为具身智能而生的大规模强化学习框架RLinf重磅开源

发表回复