meta公司近期发布了备受瞩目的Llama 4系列人工智能模型,包含了Llama 4 Scout、Llama 4 Maverick以及尚未正式发布的Llama 4 Behemoth。这一系列的推出,无疑是AI领域发展的一个重要里程碑,预示着通用人工智能(AGI)探索的又一次深入。
Llama 4系列最显著的创新在于其首次采用了混合专家(MoE)架构。与传统的单一模型结构不同,MoE架构将复杂的任务分解,分配给多个专门化的子模型(即“专家”)并行处理。 这种架构在提升训练效率、降低计算成本的同时,还能够显著提高模型的推理速度和处理复杂任务的能力。 不同“专家”之间的协同工作,使得Llama 4系列在面对 разнообразные задания时更加得心应手。
Llama 4系列之所以拥有强大的多模态处理能力,得益于其在训练阶段使用了海量的多模态数据,涵盖文本、图像、视频、音频等多种格式。 这种全面的数据训练,赋予了模型卓越的视觉理解和跨格式内容转换能力。这使得Llama 4系列在多媒体内容创作、编辑和理解等方面具备了显著的优势,例如自动生成视频字幕、根据文字描述生成图像等应用场景。
在上下文处理能力方面,Llama 4系列同样表现出色。Llama 4 Scout的上下文窗口达到了惊人的1000万个token,而Llama 4 Maverick也拥有100万个token的上下文窗口。这意味着它们可以有效处理超长文本输入,例如分析长达7500页的文档。 如此强大的长文本处理能力,为需要处理大量信息的科研、工程、文学等领域提供了前所未有的可能性。 这将极大地提升信息检索、知识挖掘和智能文档处理的效率。
目前,用户可以通过Llama.com网站以及meta旗下的WhatsApp、Messenger、Instagram Direct等平台,体验Llama 4 Scout和Llama 4 Maverick的各项功能。 meta官方表示,Llama 4 Behemoth仍在紧张的训练和优化中,预计将在未来某个时间发布。 从已公布的参数来看,Llama 4 Behemoth的性能值得期待。

具体而言,Llama 4 Scout拥有170亿活跃参数和16个“专家”模型(总参数达1090亿),在文档总结和代码推理方面表现突出。值得一提的是,Llama 4 Scout只需单个NVIDIA H100 GPU即可运行,这使其成为了进行高效信息提取和复杂逻辑推理任务的理想选择,降低了部署成本和硬件门槛。 相比之下,Llama 4 Maverick则拥有更庞大的170亿活跃参数和128个“专家”模型(总参数量高达4000亿),在创意写作、翻译和图像处理等方面表现卓越,其性能指标已经超越了许多同类竞争产品。 这也显示了meta在AI模型领域的强大实力。
Llama 4 Behemoth作为该系列的旗舰模型,拥有令人印象深刻的2880亿活跃参数和近2万亿的总参数。从目前已知的信息来看,这款模型在多个STEM(科学、技术、工程和数学)基准测试中都名列前茅,充分证明了其强大的问题解决能力和潜在的科研价值。 Llama 4 Behemoth的发布,预计将进一步推动人工智能在各个领域的应用和发展,并为科研人员提供更强大的工具。