中国人工智能(AI)初创公司 DeepSeek 正面临一个关键的战略抉择:是否进行首次外部融资,以应对其日益增长的免费 AI 服务需求。自 2023 年成立以来,DeepSeek 一直凭借自有资金运营,但在用户数量快速增长以及对 AI 芯片和服务器需求激增的背景下,外部融资似乎成为一个越来越现实的选择。DeepSeek 正在积极评估这一选项,旨在引入更多资源,以支持未来的模型开发,并满足不断增长的用户需求。
据相关消息透露,DeepSeek 背后的中国量化对冲基金 High-Flyer 旗下研究团队也在积极探索利用东南亚地区的数据中心,以期获取更多的 Nvidia AI 芯片。这一举措反映了在算力资源日益紧张的背景下,DeepSeek 寻求突破性解决方案的决心。此举也暗示着 DeepSeek 在 AI 领域的迅速崛起,及其对美国主导 AI 产业格局构成的潜在挑战。考虑到美国对先进 AI 芯片的出口限制,东南亚数据中心可能成为一个重要的替代方案。
值得关注的是,包括阿里巴巴集团和中国国家基金(如中国投资公司和全国社会保障基金)在内的多家投资机构都对 DeepSeek 表达了浓厚的兴趣。这些投资者普遍认为,DeepSeek 在 AI 模型的高性价比方面具有显著优势,尤其是在降低 AI 应用成本方面潜力巨大。这不仅符合当前 AI 产业的发展趋势,也与中国积极推动 AI 技术普及和广泛应用的目标相契合。这种优势使得 DeepSeek 在竞争激烈的 AI 市场中脱颖而出,吸引了众多投资者的目光。
然而,DeepSeek 及其母公司 High-Flyer 的高层管理人员正在就公司的未来发展方向进行深入的内部讨论。核心问题在于:DeepSeek 是否应该从一家以研究为核心的公司,转变为一个更加注重盈利的商业实体?据报道,DeepSeek 对外部融资一直持谨慎态度,部分原因是不希望过早地受到投资者对商业化收益的压力所影响。创始人兼 CEO 梁文峰对于引入外部资金,依旧持有相对保留的意见。这种谨慎的态度表明,DeepSeek 更加重视技术创新和长期发展,而非短期的商业利益。
尽管市场传闻阿里巴巴计划投资 10 亿美元获得 DeepSeek 10% 的股份,但阿里巴巴内部人士迅速否认了这一消息,并斥之为“虚假新闻”。然而,业内分析人士普遍认为,在计算能力持续短缺的背景下,DeepSeek 寻求外部融资已是势在必行。DeepSeek 是为数不多的尚未进行首轮融资,却能够提供与 OpenAI 相媲美的领先 AI 模型的大型模型开发商之一,这使其面临着前所未有的发展机遇。资金的注入将有助于 DeepSeek 加速模型训练,扩大研究团队,并进一步提升其在 AI 领域的竞争力。
DeepSeek 在 AI 领域取得的成就已经引起了华尔街、硅谷和华盛顿等全球重要科技中心的广泛关注。其基于 AI 模型开发的热门聊天机器人服务应用,在 1 月底迅速攀升至应用商店榜首,超越了 OpenAI 的 ChatGPT,成为苹果应用商店美国地区最受欢迎的免费应用,并持续保持领先地位。Appfigures 的数据显示(不包括中国的第三方应用商店),DeepSeek 应用在其上线的前 18 天内获得了 1600 万次的下载量,超过了 ChatGPT 在同一时间段的 900 万次下载量。同时,DeepSeek 的 AI 助手也长期位于谷歌应用商店免费下载榜的榜首。这些数据充分证明了 DeepSeek 在用户端的强大吸引力,以及其 AI 技术的市场认可度。
DeepSeek 在 AI 训练方面表现出的高效率,也引发了市场对资本支出的关注。经纪公司 Jefferies 在一份报告中评论称,鉴于 DeepSeek 以极低的计算能力实现了与 GPT-4o 相当的性能,这对其他 AI 建设者来说可能意味着潜在的 “负面影响”。这意味着,如果 DeepSeek 的技术能够广泛应用,AI 行业的整体资本支出可能会降低,进而对数据中心收入和利润增长的预期产生影响。这反映出 DeepSeek 的技术创新可能对整个 AI 产业的商业模式带来颠覆性的变革。
然而,花旗集团对 DeepSeek 的成就提出了不同看法,认为其技术突破并非完全依赖于使用先进的图形处理器(GPU)进行微调或构建底层大型语言模型(LLM)。花旗认为,领先的 AI 公司不会放弃使用更先进的 GPU,因为它们在规模上提供了更具吸引力的性价比。这种观点指出,虽然 DeepSeek 在效率方面表现出色,但在大规模商业应用中,更先进的 GPU 仍然具有其不可替代的优势。最终,DeepSeek 是否需要大量的 GPU 资源,以及未来的融资策略,将取决于其在 AI 商业化路径上的选择。