

英伟达又出手了。
AI怪盗团12月25日消息,AI芯片巨头英伟达(Nvidia)日前以200亿美元现金收购高性能AI加速芯片设计公司Groq的核心资产。这是英伟达历史上金额最大的一次并购,远超2019年以70亿美元收购Mellanox的纪录。
不过,这笔交易有些微妙。严格意义上说,英伟达并非“收购Groq公司”,而是拿下其全部关键资产,包括知识产权、专利、低时延推理芯片架构、以及Groq创始团队的核心成员。Groq仍将“独立存在”,但创始人兼CEO Jonathan Ross(曾为Google TPU的架构师)及公司多位高管将加入英伟达。
01.Groq的芯片哲学,从“TPU叛逆者”到“推理引擎之王”
Groq的故事始于2016年,一群来自Google TPU团队的工程师离开母舰,决心打造一款“能跑得比GPU更高效、更快更准”的AI加速器。创始人Jonathan Ross曾主导Google第一代TPU设计,用他的话说,Groq的目标是“让AI推理像流水线一样精准”。
Groq的代表产品是GroqChip,采用TSP(Tensor Streaming Processor)架构,与GPU的多线程、并行策略完全不同。GPU依赖数以千计的计算核心并行处理,而Groq采用“流式确定路径”模式,所有计算流在芯片内部严格控制,不存在线程调度的不确定延迟。这一点对实时AI服务(如语音助手、自动驾驶推理、AI视频生成)至关重要。

Groq的技术优势原本让它有机会成为一个在推理环节可与英伟达抗衡的独立阵营。今年,公司计划实现5亿美元营收,并获得黑石、三星、思科等投资巨头支持,估值接近70亿美元。然而,在AI推理加速芯片的商业化战场上,生态比芯片本身更关键。当英伟达凭借CUDA、TensorRT和大量模型开发工具将整个推理生态封锁时,Groq始终处在“研发强但生态弱”的境地。
英伟达的出手,对Groq来说既像救赎,也像宿命。Ross和团队选择加入英伟达,某种意义上,是技术理想主义者回归工业现实的瞬间。
02.英伟达的AI硬件野心,从GPU扩张到“推理帝国”
过去两年,英伟达已经从“GPU公司”变成了AI时代的“计算基础设施供应商”。其AI Factory战略不仅涵盖GPU、InfiniBand互联、Grace CPU、NVLink、高速内存,还逐步向AI推理与实时计算场景延伸。
Groq的技术将帮助英伟达在AI推理侧建立第二增长曲线。当前,生成式AI的模型训练市场接近饱和,而推理市场正处于爆发前夜:大型模型需要从“训练完毕”走向“被数亿终端设备实时调用”。这一阶段比训练更依赖低延迟与能效。

事实上,英伟达早已在推理硬件领域布局。Hopper架构GPU(H100/H200)在FP8精度下优化推理性能,而Blackwell架构(预计2026上半年量产)更强调高能效推理。而Groq低延迟核心设计的引入可以补足英伟达在ASIC级推理芯片的不足。这意味着:
- 英伟达可能很快推出“Groq Inside”的混合推理模块,用于AI Factory场景;
- 英伟达在为Meta、微软、OpenAI等提供端到端推理平台时,将减少GPU能源浪费与延迟;
- 在AI边缘计算和实时云推理领域,NVIDIA或将与AMD、Cerebras、Tenstorrent拉开代际差距。
值得注意的是,这笔交易的200亿美元完全以现金形式支付。英伟达截至2025年10月拥有606亿美元现金储备,较2023年初翻了四倍。AI浪潮带来的超额利润,正在反哺其战略扩张。黄仁勋不再只是“卖芯片的”,他正在重塑AI硬件版图。
03.AI芯片的未来战局,推理时代的核心之争
英伟达吞下Groq资产,不仅是一笔商业交易,更是AI计算未来的信号。
自2023年以来,AI芯片战场正在从“训练主导”转向“推理驱动”。OpenAI、Anthropic、Meta等模型公司每日的推理调用量已成为资源消耗大户。相比训练阶段的集中需求,推理是持续且实时的“流水式计算”。
在这一趋势下,传统GPU方案正面临两大挑战:延迟与能耗。Groq、Cerebras、SambaNova等初创公司正围绕这两个痛点设计新架构。英伟达的选择明确了:要在后GPU时代继续统治AI计算,必须掌控推理算力。
更关键的是,Groq的“非独占授权”条款,为英伟达保留了技术开放的灵活性。理论上,Groq仍将作为一家独立公司维持GroqCloud推理业务,对外提供API和算力服务,但核心技术升级将首先在英伟达体系中体现。这种模式让英伟达能一边整合创新,一边避免监管层面对“垄断收购”的批评。
从市场信号看,这笔交易进一步强化了英伟达对AI上下游的资源控制。到2026年,AI算力版图或将分为三大阵营:
- 英伟达生态(GPU+Groq推理+AI Factory);
- 谷歌自研体系(TPU+AI服务闭环);
- 微软/Meta/亚马逊的多源AI加速阵列。
英伟达试图打造的,则是AI世界的“通用算力标准”——从大模型训练到实时推理的所有环节,都跑在它定义的架构之上。
英伟达与Groq的联手,标志着AI硬件竞争的下一幕开启。过去几年AI的焦点在模型,如今算力架构再次成为主角。Groq的命运转折,也预示着AI芯片创业公司的困境:当生态封锁、资本集中、系统整合加速,单点技术的创新将越来越难独自突围。
未来的AI算力,不仅是“越快越好”的问题,而是“谁定义计算规则”的问题。而黄仁勋,显然已经给出了他的答案。