在人工智能领域竞争日趋激烈的当下,美国科技巨头Meta于近日发布了其最新开源AI模型系列Llama 4。值得注意的是,此次发布恰逢Llama 3模型发布一周年,这似乎也暗示着Meta在AI研发上的加速步伐。Llama 4的推出,无疑再次引发了科技界的广泛关注。
Llama 4系列的核心亮点在于其采用了先进的混合专家架构 (Mixture of Experts, MoE)。这种架构并非将所有任务都交给一个庞大的模型处理,而是将模型分解为多个“专家”子模型,每个子模型专注于特定领域的任务。在训练和推理过程中,根据输入数据的特性,动态地选择最合适的“专家”子模型进行处理。这种设计理念能够显著提升模型的处理效率和精准度,在保证性能的同时,也有效降低了计算成本。与传统的单体模型相比,MoE架构在处理复杂任务时更具优势,也更易于扩展。
此次推出的Llama 4系列包含Scout和Maverick两个版本,Meta官方宣称这两个版本都是目前最先进的模型,尤其在多模态领域拥有卓越表现。具体来说,Scout版本拥有170亿活跃参数,并配备了16个“专家”模型,总参数量达到1090亿;而Maverick版本虽然同样拥有170亿活跃参数,但“专家”模型数量增加至128个,总参数量更是惊人地达到了4000亿。这种参数规模的差异,预示着两个版本在性能侧重点上可能存在不同,Scout可能更侧重于运行效率,而Maverick则可能更侧重于处理复杂任务的能力。 未来用户可以根据自身的需求,选择最适合的版本。
不仅如此,Meta还在积极训练一个更为强大的模型——Behemoth,旨在将其打造成为全球范围内最智能的大型模型之一。虽然目前关于Behemoth的详细信息还相对有限,但可以预见的是,该模型将会在参数规模、训练数据以及算法优化等方面进行全面升级,以满足更加严苛的应用场景需求。Behemoth的未来表现,值得我们拭目以待。
Meta首席执行官马克·扎克伯格强调,公司的目标是构建世界领先的人工智能技术,并将其开源,使这项技术能够广泛普及,让全球用户都能从中受益。这一表态,体现了Meta在AI领域的战略布局,也表现了其拥抱开放合作的态度。开源不仅可以加速AI技术的创新和发展,也有助于降低AI的应用门槛,让更多人能够参与到AI的建设和应用中来。