红杉资本(美国)在8月5日发布了对AI产业发展的新判断,文章内容涵盖了“算力集群”、“数据中心”、“房地产”等核心领域,并对微软、亚马逊、谷歌等头部公司的AI竞争进行了分析和预测。文章大胆指出,**“基建效率”可能比“研究突破”更重要**,这一观点值得我们深思。
与国内大厂和模型公司的竞争相比,海外大公司在算力、电力等基础设施建设方面的投入,或许能为我们带来一些启示。
文章作者David Cahn,是红杉美国合伙人,曾担任Coatue COO和合伙人,并主导投资了Runway、HuggingFace、Notion等明星AI项目。他热衷于与那些快速迭代、勇于尝试的创业者合作,并对那些敢于失败的创业者充满共鸣。
以下是David Cahn在文章中提到的两段金句:
“甘愿失败可能显得愚蠢,但这是创始人的必备素质。当我第一次开始投资人工智能时,它并不是一个受欢迎的类别。许多投资者认为市场太小。公司陷入困境,因为可供销售的客户太少。”
“伟大的创始人拥有别人还不相信的洞察力。我的工作就是理解他们的观点,并在别人不相信的时候相信他们。”
以下是文章正文:
过去一年,AI领域的主流方向是“模型奇偶性”竞赛,主要特点是寻找新的研究技术、更优质的训练数据和更大规模的算力集群。
然而,AI军备竞赛的下一阶段将有所不同,它将更多地由“物理设施”而非“科学发现”来定义。
目前,我们可以通过主机托管或改造,将算力集群安装到现有的数据中心。如果需要将集群规模从15k GPU 扩展到 25k GPU,只要找到方法增加 GPU 数量即可。
然而,这种情况正在发生变化。大多数 AI 市场参与者已经深刻认识到,模型大小是性能的关键驱动因素。
因此,下一代模型的目标是将模型规模扩大10倍,达到300k GPU。为了容纳如此庞大的模型,需要建造全新的数据中心。
人工智能的最新发展带来了两方面的重大改变:
首先,它改变了模型的交付周期。之前可以在 6 到 12 个月内完成模型训练,现在需要增加 18 到 24 个月的建设时间才能真正开始训练。
其次,它改变了最大竞争优势的来源。**在新时代,“基建效率”可能比“研究突破”更重要。**
AI 工作方式的巨大变化,是近期科技巨头财报中的重要议题。
大型科技公司的年化资本支出从 1380 亿美元同比增长到 2290 亿美元。
这 910 亿美元的增量运营支出,大多用于建设新的“人工智能数据中心”,这是一个巨大的投资。
这些资本投入预计将在 2025 年底到 2026 年初产生成果,届时我们将能够判断,这些更大的模型是否足够智能,是否能够创造新的价值来源,并产生投资回报。
微软、亚马逊、谷歌、Meta 的“增量资本支出”
那么,未来一到两年到底会发生什么?
在人工智能产业建设的新阶段,我们个人如何“获胜”呢?
“建设数据中心”是一项混乱而复杂的业务。我们认为,日常的运营执行将对最终 AI 的发展结果产生最大的影响。以下是数据中心建设的运作方式:
-
房地产开发商——QTS、Vantage 和 CyrusOne 是三家受欢迎的开发商——会购买他们认为可以建造数据中心的土地和电力。
-
开发商会与大型科技公司接洽,为他们提供数据中心 15 年或 20 年的租约,总成本在 200 亿到 100 亿美元之间。
-
一旦开发商签订了协议,他们就会进入资本市场,根据协议筹集债务,通常来自银行或房地产投资者。
-
债务投资者并没有为数据中心未来的 AI 需求提供担保,他们是在为微软或亚马逊等客户的信用提供担保,并期望收益率略高于公司债务。
-
开发商会雇佣一家总承包商,例如最受欢迎的数据中心建筑商之一 DPR。
-
总承包商会雇佣分包商,分包商再招募劳动力。劳动力是数据中心建设成本的重要组成部分。
-
劳动力转移到数据中心的建设地点——例如,一个小镇或城市——他们被安置在该地区的酒店或其他住宿场所。
-
在两年的时间里,一个大型建筑项目开始了,从整体结构的钢和混凝土开始,到安装工业部件和 GPU 结束。
-
在整个过程中,数据中心的最终用户(例如微软或亚马逊)正在与自己的供应链就柴油发电机、液体冷却系统和其他必要设备进行谈判。
目前,五家公司已经到达了这场新的数据中心扩展竞赛的起点:微软/OpenAI、亚马逊/Anthropic、谷歌、Meta 和 xAI。
每家大公司背后,都有一个符合严格基准的模型,以及继续进行所需的资本。
随着市场结构的明朗化,我们可以开始观察每个参与者将如何采取独特的策略——从自身的业务基础出发来赢得胜利:
-
Meta 和 xAI 都是消费类公司,他们将进行垂直整合,希望从各自拥有一个单一的创始人决策者中受益,该决策者可以简化模型构建工作,并将其与数据中心的设计和建设紧密结合。两家公司都将寻求在更智能的模型的基础上推出杀手级的消费者应用程序。
-
微软和亚马逊拥有庞大的数据中心团队和雄厚的财力,他们利用这些资产与顶级研究实验室建立了合作关系。他们希望通过:一是向其他公司提供销售培训,二是销售模型推理来获利。他们将需要管理其前沿模型(GPT 5 和 Claude 4)与为企业客户使用而构建的其他数据中心之间的资源分配。
-
谷歌既有消费者业务,也有云业务,还有自己的内部研究团队。周五,该公司宣布将把 Noam Shazeer 重新纳入公司。谷歌还与 TPU 进行了垂直整合,一直到芯片层。这些因素应该提供长期的结构性优势。
随着资本支出计划的稳固实施和竞争格局的形成,人工智能新时代开始了。
在人工智能的这个新阶段,钢铁、服务器和电力将取代模型、计算和数据,成为任何希望领先的人势在必得。