据科技媒体 The Information 报道,知情人士透露,字节跳动正与英伟达高端芯片的重要代工厂台积电合作,计划到 2026 年联合推出两款基于 5 纳米工艺的自研 AI 芯片。目前,该项目处于设计阶段,未来计划可能会有所调整。
报道称,5 纳米工艺仅比台积电最先进的 3 纳米工艺落后一代,与英伟达即将推出的旗舰 AI 芯片——Blackwell 架构芯片采用的是同一代工艺。自研芯片的推出,或将减少字节跳动在 AI 模型开发和运营方面对高价英伟达芯片的依赖。
在国内竞争激烈且美国加强芯片出口限制的背景下,降低芯片成本对于字节跳动等推出 LLM 的中国科技企业至关重要。报道指出,字节跳动今年已经订购了价值超过 20 亿美元的 20 余万块英伟达 H20 芯片,目前尚未全部到货。字节计划让台积电代工生产数十万块自研的训练和推理芯片,预计成本将比从英伟达购买低数十亿美元。
报道分析了字节跳动可能降低成本的原因。H20 的性能仅为英伟达热销的先进芯片 H100 的四分之一。美国目前的出口限制针对的是单个芯片的性能,而非芯片集群。国内厂商需要购买更多 H20 才能达到与单个 H100 相同的算力。字节跳动希望,在成本大致相同的情况下,自有芯片驱动的集群能够实现四倍于单个 H100 芯片的计算性能。
字节跳动和英伟达均未对上述报道做出回应。据此前消息,包括字节在内的中国互联网公司今年都在大量订购英伟达芯片,同时积极开发自研 AI 芯片。
上个月,金融时报报道称,百度、字节跳动、腾讯和阿里巴巴已向英伟达订购了价值 10 亿美元的 A800 处理器,这些公司还购买了价值 40 亿美元的 GPU,预计今年交付。有评论援引该报道指出,今年英伟达将向中国出售 100 万块 AI 芯片,字节是其中一大客户。按照每块 H20 芯片 1.2 万美元的单价计算,仅中国市场就将为英伟达贡献 120 亿美元的 AI 产品收入。而英伟达 2020 年的年收入也不过 110 亿美元。
字节跳动发言人对此报道未作详细评论,仅表示:“消费互联网公司和云供应商每年在数据中心组件上的投资额达数十亿美元,通常提前数月下订单。”
今年 6 月,路透社报道称,字节跳动正在与博通合作开发 5 纳米先进 AI 芯片,这款 ASIC 芯片由台积电代工生产,符合美国的出口限制。路透社当时报道称,博通至少自 2022 年以来一直是字节的商业合作伙伴,并公开表示字节购买其 5 纳米高性能交换机芯片以及用于 AI 计算机集群的 Bailly 交换机。字节与博通的芯片开发合作将有助于降低采购成本,并保证高端芯片的稳定供应。
本周的 The Information 报道还提到,百度正在开发的新一代 AI 芯片昆仑芯 3 代目前处于设计阶段的最后阶段,即将在台积电开始生产。