近日,科技媒体The Information的一篇报道引发广泛关注,揭示了meta Platforms在人工智能(AI)领域所面临的巨大成本压力。为了持续推进其旗舰大语言模型Llama的研发和部署,meta reportedly 在2024年主动寻求来自包括微软、亚马逊在内的多家竞争对手的资金支持。这一举动引发业界对于AI研发高昂成本的深度思考。
据称,meta内部对Llama项目所需的巨额资源颇感忧虑,因此提出了建立“Llama Consortium”的设想,计划让潜在投资者参与Llama未来功能的开发,以吸引更多合作伙伴共同承担成本。然而,消息人士指出,该提议的初期反响并未达到预期,目前尚未有公开信息显示已达成正式的资金协议。这意味着,即使是拥有雄厚财力的科技巨头,在生成式AI这场高风险游戏中,也难以完全依靠自身力量。
Llama模型在meta业务中的重要性不言而喻。自Llama 4发布以来,它迅速被集成到WhatsApp、Instagram和Facebook的meta AI功能中,承担着驱动这些平台AI体验的核心角色。此外,meta也在积极推动Llama的商业化,通过亚马逊SageMaker JumpStart和微软Azure AI Foundry等云平台提供商用许可,试图将AI能力转化为实际的收益。
值得注意的是,meta近期推出的Llama 4系列模型,在技术层面展现了其强大的研发实力,同时也进一步加剧了其成本压力。Llama 4 Scout模型,拥有109亿总参数和17亿活跃参数,专为单GPU使用设计,其超大的1000万token上下文窗口,使其能够一次性处理约750万字的内容,适合对长文本分析需求高的应用场景。而Llama 4 Maverick则针对更大规模的任务,总参数高达400亿,同样拥有17亿活跃参数,并创新性地配备了128个专家系统,从而更高效地处理复杂问题。

据悉,这两个模型都采用了先进的 Mixture-of-Experts(MoE)架构,通过激活特定的子网络来显著提升效率,降低计算成本。更令人惊讶的是,meta内部还在秘密研发一款参数高达2万亿的超级模型——Llama 4 Behemoth。这款模型主要用于训练小型模型,其庞大的计算需求甚至需要动用多达3.2万块GPU,这无疑是一笔巨大的开销。
在激烈的市场竞争中,meta为了保护其在AI领域的优势,采取了相对强硬的姿态。有报道称,meta正试图阻止苹果的Apple Intelligence功能在其iOS应用中使用,以此来推动用户更多地使用基于Llama的AI工具。这一举措不仅体现了meta对于自身AI技术的信心,也反映了其在AI商业化道路上的决心。
总而言之,meta寻求资金支持的事件,折射出AI领域激烈的竞争以及高昂的研发成本。未来,meta能否成功构建“Llama Consortium”,并有效平衡技术创新与成本控制,将直接影响其在AI领域的竞争力和长期发展。