全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

具身智能的“房地产开发商”来了?还真有点那个意思。

大晓机器人联合港中文MMLab,最近放出了一个新项目——Kairos-Homeworld,号称全球首个能实现全屋三维生成与物体级全交互的统一框架。这波操作最直接的效果,就是把30万套中国真实住宅户型统统搬进了数字世界。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

别误会,这可不是给找房APP做VR看房,而是给具身智能机器人造训练场。从30平米一居室到200平米大平层,从南北通透到封闭式厨房,从干湿分离卫生间到独立生活阳台,全部变成了机器人可用的3D仿真环境。

更有意思的是,Kairos-Homeworld不只是一个静态数据集,它还是个能自动“盖房子”的模拟器。一句话指令,系统就自动生成完整的中国家庭仿真环境,支持机器人做导航、多房间整理和各种家务训练。而且场景里每件物体都不只是摆设——材质、密度、摩擦系数这些物理属性都完整建模,机器人可以直接抓取、移动、操作,体验更接近真实世界。

事实上,这还不是大晓最近唯一一项跟具身智能相关的工作。前不久他们刚开源了4B参数的世界模型Kairos 3.0-4B

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

如果说Kairos-Homeworld是在给机器人造训练场,那么Kairos 3.0-4B就是给机器人装上理解世界的大脑。一前一后,恰好对应了具身智能最核心的两块拼图:环境和模型,训练场和大脑。我们就一件件来看。

先说这个给机器人造“家”的事。

大模型的训练数据躺在互联网上,但机器人的数据藏在现实世界里。开门、拉抽屉、整理物品、做家务——机器人想学会这些,需要海量真实交互。可现实世界太贵了。此前美国机器人公司Figure AI就跟房地产巨头Brookfield合作,想借其管理的10万套住宅训练机器人。思路没错,但真实场景有限,家具维修、场景维护都是问题。

大晓选了另一条路:把这些住宅直接搬进数字世界。数字化的好处在于新增场景的边际成本趋近于零,不受真实房源总量限制,而且生成器还能让训练环境规模持续扩展。他们一口气开源了两个关键资源:30万套中国真实住宅户型数据集;5000个完整可交互的3D家庭场景。

前者提供真实世界的空间分布基础,后者让机器人真正能“住进去”、动起来、练起来。更关键的是,这些数据都来自中国家庭。此前大多数开源室内场景数据集基于欧美家庭——开放式厨房、没有阳台、没有玄关。机器人长期在这种环境训练,到中国家庭难免“水土不服”。Kairos-Homeworld第一次系统性地把中国家庭的空间结构纳入具身智能训练体系。规模上,30万套户型图相当于RPLAN数据集的近4倍,是ResPlan的17倍。对整个领域来说,这是一块相当稀缺的数据底座。

不过仅有数据还不够。30万套住宅再大,本质上仍是静态数据集。每新增一个训练环境都要人工建模,规模总会触顶。因此Kairos-Homeworld做了另一件事:让AI学会自动生成新的家庭环境。他们设计了一套分层生成框架,分成四个阶段。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

第一步,生成户型图。将传统住宅结构转为层级化表示,让大语言模型先规划房间布局,再确定门窗位置和连通关系,从源头避免重叠和拓扑断裂。第二步,布置家具。先俯视放床、沙发、餐桌等大件,再以第一人称视角补充厨房、浴室细节。第三步,自动纠错。用视觉语言模型闭环检查,自动发现并修正“沙发挡门”“柜子穿墙”等问题,场景碰撞率从0.20降至0.05。第四步,补充可交互物体。生成桌面摆件、厨房用具、收纳物件等细粒度元素,赋予材质、密度、摩擦系数等物理属性,让机器人能直接抓取和操作。

相比直接端到端生成3D世界,这种分层方案更可控,也更容易保证空间合理性和物理一致性。在30人用户评测中,Kairos-Homeworld在合理性、美观度和复杂度三个维度均超过Holodeck、LayoutGPT和LayoutVLM,综合偏好率达到81.1%。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

这套系统已经开始进入真实训练流程。机器人接收全屋整理任务后,自动拆解成多个子任务,按客厅、餐厅、厨房的空间动线依次执行,完成礼盒归柜、牛奶入冰箱等具体操作。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

相较于过去主要服务导航训练的仿真环境,Kairos-Homeworld生成的场景拥有完整一致的空间结构,支持机器人跨房间连续行动;场景中的物体都带有真实物理属性,机器人能与十余种不同类别的物品自然交互。换句话说,它生成的不是一套房子,而是一个机器人可以不断练习、不断犯错、不断成长的数字训练场。

训练场有了,还得有能在里面学习的大脑。大晓的路线图里也包含了这一点。

前不久他们开源了4B参数的世界模型Kairos 3.0-4B。在THOR平台上,实现了1:1.5的实时生成速度,推理速度比NVIDIA Cosmos 2.5快了72倍。机器人每1秒都能生成未来1.5秒的动作视频。这种预测不是简单的视频生成,作为一个世界模型,它最核心的能力是对物理规律的理解。比如倒水或倒牛奶时,液体流速、水柱收窄等细节都符合真实流体运动规律。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”
全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

在高难度的叠石头任务中,模型同样遵循重力与摩擦等物理法则,能维持合理的支撑结构和平衡关系。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”
全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

即便面对洗衣服这类涉及柔性物体的任务,衣物也会随着抓取、掉落自然变形。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

此前在外网刷屏的一段7分钟连续家务Demo,进一步展示了它长程任务的能力。机器人先整理茶几杂物,再进洗衣房收拾衣物,随后到厨房准备早餐,一镜到底,没有任务切换,也没有人工干预。

一个只有4B参数的世界模型,为什么能做到实时预测,还能在复杂场景里保持物理一致性?答案来自三个方面。

首先是架构。Kairos 3.0-4B采用「理解-生成-预测」一体化设计。传统世界模型通常先生成未来视频,再从视频反推出动作指令;Kairos则直接将视觉表征映射为动作输出,把世界模拟器和动作执行器合二为一,大幅缩短推理链路。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

其次是数据。Kairos 3.0-4B融合了物理规律(CoT文本)、人类行为数据以及真机交互数据三类来源。物理规律负责回答“为什么这么做”,人类行为提供“应该做什么”的范例,真机数据补齐“具体怎么做”的执行细节。这种组合让模型学到的不仅是动作本身,还有背后的因果逻辑。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

最后是效率。Kairos 3.0-4B引入了首个专为世界模型设计的混合线性注意力算子,将时间复杂度从O(n²)降至O(n),既保留了长时序建模能力,又显著降低了计算和显存开销。生成10秒任务仅需9.5秒,显存占用23.5GB,而14B参数的Cosmos 2.5需要70.2GB显存。这意味着世界模型第一次真正具备了部署到机器人端侧实时运行的能力。它不仅能在英伟达平台运行,也兼容沐曦、海光、壁仞等国产GPU;同时支持单臂、双臂以及灵巧手等不同机器人形态。世界模型不再只是实验室里的演示视频,而是真正开始成为机器人的“大脑”。

如果把大晓这两项工作放进英伟达具身负责人Jim Fan提出的路线图里看,会发现一件有意思的事。Jim Fan最近在红杉的一场分享中提到,机器人想要像大语言模型那样实现规模化发展,需要同时具备三样东西:世界模型、数据和环境。世界模型负责理解物理规律,相当于预训练;特定数据负责让机器人学习具体任务,相当于微调;环境决定了机器人能经历多少场景、犯多少次错误,以及最终泛化能力。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

按照这个路线图,Kairos 3.0对应世界模型,而Kairos-Homeworld同时提供了另外两块关键拼图:一方面开源30万套中国住宅户型和5000个完整家庭场景作为训练数据;另一方面又能持续生成新的可交互家庭环境,提供近乎无限扩展的数字训练场。单独看每个项目,Kairos 3.0是一篇世界模型工作,Kairos-Homeworld是一篇环境生成工作。但放在一起看,大晓最近交出的两份答卷,恰好对应了具身智能规模化发展最核心的三项基础设施。

最后简单介绍一下Kairos系列背后的团队——大晓机器人。去年12月初正式对外亮相,由商汤科技联合创始人王晓刚担任董事长,澳大利亚科学院院士陶大程出任首席科学家。团队来自南洋理工、港大、港中文,研究方向覆盖环境智能、世界模型与具身基础模型。

全球首个机器人训练楼盘开售:30万套中国住宅,机器人“拎包入住”

作为商汤在具身智能领域的自然延伸,大晓承担着将“数字大脑”装入“实体机器人”的使命,技术路线围绕“以人为中心”的具身智能研究范式展开。公司近期完成了由蚂蚁集团领投的天使轮融资,资金将主要投入世界模型和具身研发范式的迭代与落地。

Kairos 3.0-4B:https://github.com/kairos-agi/kairos-sensenova
HomeWorld:https://kairos-homeworld.github.io/

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 11小时前
下一篇 10小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!