空间智能的时代,才刚刚开始。
当大语言模型(LLM)的竞争逐渐进入存量博弈,全球科技界的目光开始转向一个更具挑战性也更具想象力的领域——让 AI 真正理解并交互于物理世界。这不仅是技术路线的演进,更是人工智能从“数字原生”迈向“物理原生”的关键跨越。
在这一背景下,资本市场的风向标也随之跳动。今日,群核科技(00068.HK)正式挂牌上市,报 20.70 港元,较发行价上涨171.65%。作为「空间智能第一股」,其表现或许预示着基础设施层的新变局。
昨天的暗盘也是热闹非凡,一度涨超 195%。
对,也是「杭州六小龙」里率先冲线的那一家。
群核科技董事长黄晓煌在致辞中提到:
15 年前,群核科技以 GPU 上云为起点,秉持着「让每一个空间,都成为可计算的世界」的愿景发展至今。
未来,我们会继续做强空间智能底座,服务人类的三维创作,也服务机器的智能进化。
在他看来,如果说 LLM(大语言模型)教会了 AI「说话」,那要让 AI 真正走进物理世界,则需要一架全新的桥梁——
空间智能。
因此,市场用真金白银在群核身上押注的这一票,指向的不是又一个大模型故事,而是 AI 航线上一颗全新的北极星。
这个被李飞飞称为「世界模型基石」的方向,已然成为全球 AI 竞赛的下一个主战场。
而群核科技,正是这条赛道上第一个跑通商业化闭环的公司。
最新的财报相当亮眼:2025 年全年营收8.20 亿元,经调整净利润转正达5712.7 万元,毛利率82.2%。
所以,空间智能到底哪来的这么大魅力?
为什么李飞飞、英伟达、Google,腾讯、阿里,还有群核科技……都在拼了命地押注这条路线?
要回答这个问题,或许得先搞清楚一个更本质的东西:AI 到底该怎么理解世界?
LLM 并不理解世界,它本质上是鹦鹉学舌。
你问它「杯子放在桌边会不会掉」,它回答「会」。
但事实上,当 LLM 看见你家猫在桌子上把玩水杯时,它不会感到一丝紧张。
因为它并不明白「杯子会掉」到底意味着什么,它没感受过重力,也不知道杯子下一秒就要碎了。
之所以回答「会」,仅仅是因为互联网上有无数人说过类似的话。
这正是世界模型爆火的原因——拒绝让 AI 当一个对现实世界毫无认知能力的天才。
但怎么让 AI 认知世界?目前主要分两大流派。
第一派:视频生成路线。
以 Sora(可惜已经要没了)、Genie 为代表,这派不追求物理细节,旨在让 AI 生成一个「能动起来的世界」。
但这派有个致命的阿喀琉斯之踵:
它画出了世界的「皮囊」,却缺少有血有肉的「骨架」。
你让 Sora 生成一个客厅的视频,装修和光影可能极其逼真。
它答不上来。
因为它只是学到了像素组合的概率分布,从未真正理解:究竟什么是三维空间?
而这,正是第二派——空间智能想做的事。
未来必将是属于具身智能的。
而 AI 想要从虚拟走向物理,就必须能认知真实世界的空间关系。
物体在哪里?空间几何关系是什么?物体之间如何相互影响?
这些都不是虚拟画面能表述的,必须要对物理世界进行刻画后重建。
举个例子,一个机器人要开门,一般分两步:
- 大脑思考:根据现有输入推演未来,然后规划动作;
- 小脑执行:走到门前,抓住把手,推门而入。
但这有一个前提——
你得先知道那是门,门上有把手,把手是用来开门的。
这也是为什么,李飞飞选择将空间智能作为继ImageNet后的下一个方向:
如果没有空间智能,AGI 是不完整的。
空间智能要做的,正是为 AI 填补上这部分智能板块的空缺。
以李飞飞 World Labs 为例,旗下世界模型 Marble,能做到仅凭一张照片,重建出完整的 3D 场景结构。
你问它图里沙发的长宽高,它能回答长 1.9 米×宽 0.9 米×高 0.85 米,还能输出 3D 网格文件。
这些不是像素,而是真正的空间信息。
短短一年半,World Labs 估值飙升 5 倍至 50 亿美元。
市场的火热,正在印证一项共识:
真正的世界模型,必须建立在物理正确的三维空间之上。
而在这项地基上,有一家公司,已经盖了 15 年的楼——
群核科技。
事实上,从创业第一天起,他们就在用 GPU 模拟物理世界。
渲染,本质上是把三维结构化信息变成图像;
而空间智能,恰好是这个过程的逆运算,即把真实的图片和视频变回三维世界的结构化数据。
这意味着什么?
意味着群核 15 年来积累的一项项技术,突然得到了一个集中爆发的机会。
空间智能,间接决定着 AI 的下一代形态。
而群核,恰好占据了这条新赛道最有利的出发位置。
认定空间智能是正确方向的公司不少,但真正跑通商业闭环的,凤毛麟角。
「首个登陆港股的杭州六小龙」,这个头衔能花落群核科技,或许也来自下面这份成绩单:
2025 年,全年营收 8.20 亿元,毛利率高达 82.2%。
在普遍烧钱的 AI 赛道,群核凭什么能交出这样一份财报?
归根结底,群核科技的护城河,建立在三个极难复制的维度上:数据、模型、飞轮。
先说数据。这是空间智能领域最大的卡脖子问题。
如果说坐拥海量文本数据的 LLM,是被互联网「祝福」的天选之子;那么世界模型,简直就是天崩开局。
毕竟,互联网上的空间数据,基本是一片荒漠。
即便 AR 眼镜等穿戴设备普及,也未必能填平这道鸿沟。采集三维数据只是第一步,想要用于训练,还得经过极其复杂的标注过程。
更令人绝望的是,空间智能所需的数据太复杂了。
质量、摩擦力这些只是最低要求。现实世界的变量太多了:线束会变形,塑料遇热会变软、气候潮湿木材会膨胀……
这是个无底洞,几乎穷尽不了。
所以空间智能这个游戏,不是谁都玩得起。纯靠冷启动,非常难。
最好的情况,是你本来就拥有一个足够庞大、精确的三维数据基座。
群核的优势,恰恰就在这里。
公司成立之初并没有想到要为空间智能沉淀资产,却在业务探索过程中,不经意间做成了这件事。
2013 年,群核推出了酷家乐,从用户侧来看是个设计软件工具,但它的意义远不止产品功能本身。
它本质上是一套将物理世界数字化的强大工具,包括在家居、商业、工业场景的空间进行模拟。
在这个过程中,它沉淀下了海量「物理正确」的三维数据——
这些,并非互联网上的像素。
每一面墙都有厚度、每一束光都会正确反射、每一种材质都标注了物理参数的结构化三维数据。
十余年过去,围绕酷家乐这一平台,群核已经沉淀了超过 5 亿个 3D 场景、4.8 亿个 3D 模型及空间设计元素。
这,是群核在现实世界中,花了 15 年的时间,一点点堆出来的壁垒。
这些高质量数据,也正是 AI 理解并走进物理世界的坚实基础。
因此,随着 AI 时代的浪潮席卷而来,这些沉淀已久的数据资产,自然而然化作了群核科技坚实的两大模型底座:
1、空间语言模型 SpatialLM。
致力于推动 AI 从「理解文本」向「理解空间」的进化,赋予 AI 读懂三维世界的「空间语言」能力。
一经推出,便与 DeepSeek-V3、Qwen2.5-Omni 共同登上 HuggingFace 榜单前三。
2、空间生成模型 SpatialGen。
与李飞飞团队的 Marble 颇为相似,同样是一个 3D 世界生成模型。可根据文字描述、参考图像和 3D 空间布局,生成具有时空一致性的多视角图像。
但值得注意的是,关于空间生成这件事,群核与 World Labs 其实分野还挺大。
相比于 LeCun 的JEPA(一种隐式世界模型),Marble 最大的优势在于其可视化,其世界是看得到、摸得着的。这极大地拓宽了应用场景,因此深受游戏开发从业者的青睐。
但 AI 是一个智能水平如竹林般参差不齐的「天才国度」,而游戏、动漫这些完全虚拟的「像素游戏」,恰好是 LLM 最擅长的领域。
这片大陆的水位线正在汹涌上涨,纯虚拟世界的内容,很快会被吞没。
只有物理世界,是 AI 洪水之中,最坚固的那条诺亚方舟。
而群核在进行空间智能研发时,更侧重于现实世界的重建与模拟,而非执着于虚拟环境的生成。
相比于赏心悦目的虚拟表象,他们更看重结构参数等物理信息的精准与正确。
一张照片,一句 Prompt,就能得到一个可漫游的高保真 3D 小世界。开发者和企业可以通过 API 和 SDK 自由调取这些能力,用在具身智能训练、影视制作、电商棚拍等各种场景中。
这一过程的核心,是群核科技所构建的四大空间能力:空间重建、空间生成、空间编辑与空间理解。
这四大能力,正是群核科技得以成为连接物理世界与数字世界的关键桥梁。它们共同构成了群核打造物理世界数字底座的坚实基石。让 AI 不仅能理解世界,更能重建、生成乃至编辑重构世界。
过程中,这些丰富的应用场景,又会帮助群核摄取到更前沿、更多元的真实世界数据,最终再次推动商业化。
这也是群核能够继大模型厂商之后,再次作为一项热门 AI 标的,在港股受到追捧的重要原因。
市场对其的估值,早已不是简单 SaaS 软件的逻辑。
从长远来看,空间智能这项业务,会从简单的「铲子」,成为下一代 AI 的全新基础设施。
实话说,这条路径,不禁让人联想到英伟达。
事实上,深度学习的火种早在 2012 年就已点燃,但彼时的英伟达并未因此立刻腾飞。
是游戏玩家对极致画质的追求,为 GPU 带来了第一批订单;2017 年突如其来的算力需求,又意外输入了一笔现金。
正是这些看似「不务正业」的业务,让英伟达在动荡的技术周期中,还能一路 All in AI。
直到 ChatGPT 发布,多年的坚守与投入终于得到回报,铲子提供商蜕变为全球 AI 的基础设施,市值扶摇直上万亿美元。
今天的群核,某种程度上,正如 2012 年的英伟达。
耕耘十余年后,他们也终于找到了,那个与自己技术基因完美契合的终局——
空间智能。
终局归终局,日子还得一天天过。
当下的空间智能,究竟能干什么?答案是:可能比你想象中丰富得多。
最直观的一层,是对现实世界的重建和改造。
空间设计的应用已经很成熟了。
一张照片丢进去,便能生成完整 3D 场景,而且支持实时修改。
与此同时,这种能力正在迅速溢出到其他行业。
今年年初,李飞飞曾写过一篇长文,为我们描绘了空间智能时代下的两个兴奋未来。
其一,是创造力的彻底解放。
创作门槛被进一步拉低。不光是剪辑、特效这些后期能自动化,很多以前必须在现实里干的活儿,技术也能覆盖了。
不管是拍电影的、做短剧的,还是做游戏的,都能用空间智能把自己脑子里的世界观搭出来。
随心所欲去创作,再也不用担心预算。
只要故事足够好,人人都能做出像《星际穿越》这样的大作。至少内容的质量,不会再因「资源不够」这种非创作变量受影响。
其二,则是当下炙手可热的具身智能。
当 Sim2Real 的鸿沟足够小,空间智能赋能世界模型,成为最完美的机器人「训练场」。
届时,被「祝福」的将不再只有 LLM,空间智能会为机器人创造出独属于它们的「互联网」,数据量大管饱。
当数据不再成为瓶颈,具身智能便会正式进入 Scaling。激烈的竞争,会让机器人以最快速度落地千行百业。
它们将真正代替人类,去完成那些无聊、危险的工作,而不再仅仅是跳舞翻跟头。
除此之外,在科研探索、医疗诊断等更多领域,空间智能无疑也将大显身手。
听起来零散,但李飞飞所描绘的这些未来,其实都在指向同一件事:
空间智能,正在把物理世界变成可以被计算、被编辑、被复用的对象。
而物理世界,一直是中国的优势战场。
群核科技董事长黄晓煌曾说:
硅谷更贴近虚拟世界,中国更贴近物理世界。
中国有庞大的制造业基础、海量应用场景,工程师文化相当浓厚。
很多能力,是从真实需求里长出来的,不是先讲故事再找落地。
群核本身,便是一个鲜活的注脚——
不用世界模型做虚拟内容生成,始终扎根于现实,始终与物理世界站在一起。
物理世界中的真实体验,各种细节至微的 context,是 AIGC 无法直接替代的,只能通过数字化手段去尽可能复刻。
而只要物理世界还存在,只要它仍需被数字化,空间智能会发挥巨大价值。
眼镜、汽车、手表……空间智能正在让所有终端变成感知入口,人和机器的交互不再局限于屏幕。
试想,如果摄像头也拥有智能,当发现人群中有人身体不适,它或许便能自动发送求助。
听起来或许有点扯,但回想十多年前,用 GPU 做云端渲染,不也被当成天方夜谭吗?
空间智能的时代,才刚刚开始。
而在这条赛道上,深耕物理世界模拟 15 年的群核科技,已经提前跑出了一段距离。
不过,客观来看,空间智能的普及之路仍充满挑战。从高精度的三维重建到实时的物理引擎模拟,对算力提出了极高要求。此外,如何将仿真环境中的训练成果无缝迁移至真实机器人(Sim2Real),依然是学术界与产业界共同攻克的难点。群核科技的上市只是一个里程碑,真正的考验在于能否持续降低空间智能的使用门槛,让这项技术从“高端定制”走向“大众基础设施”。
无论如何,当比特与原子的界限逐渐模糊,能够架起这座桥梁的企业,无疑将掌握通往下一轮智能革命的钥匙。