Meta推出Llama 4：最新开源AI模型全解析

摘要：Meta Platforms, Inc.最近推出了其开放源代码人工智能套件Llama 4的初始模型，以增强在生成性人工智能领域的影响力。首席执行官马克·扎克伯格强调了公司对开放源代码人工智能的愿景，认为这将引领潮流。Llama 4包括两个模型：Llama 4

Meta Platforms, Inc.最近推出了其开放源代码人工智能套件Llama 4的初始模型，以增强在生成性人工智能领域的影响力。首席执行官马克·扎克伯格强调了公司对开放源代码人工智能的愿景，认为这将引领潮流。Llama 4包括两个模型：Llama 4 Scout和Llama 4 Maverick，现已可通过Llama网站和Hugging Face下载。此外，Meta还推出了Llama 4 Behemoth，这是迄今为止最智能的大型语言模型之一，采用混合专家（MoE）框架以提高效率。Llama 4 Scout和Maverick均具备170亿个参数，前者拥有16个专家，后者有128个专家，且在多项性能基准测试中超越了竞争对手。未来，Llama 4 Behemoth模型将开发出2880亿个活跃参数，旨在超越现有领先模型的能力。

在一项重要努力中，Meta Platforms, Inc.于周六发布了其新开放源代码人工智能套件Llama 4的初始模型，以增强其在生成性人工智能领域的影响力。在一段Instagram视频中，Meta首席执行官马克·扎克伯格阐述了公司对人工智能的宏伟愿景：“我们的目标是构建世界领先的人工智能，开放源代码，并使其普遍可及……我早就说过，开放源代码的人工智能将引领潮流，而随着Llama 4的发布，我们开始看到这一点的实现。”首两个模型，名为Llama 4 Scout和Llama 4 Maverick，现已可以从Llama网站和Hugging Face下载。这些模型也是Meta AI的基础，后者作为公司的虚拟助手，集成在WhatsApp、Instagram、Messenger和网页等热门平台上。

除了初始模型外，Meta还推出了Llama 4 Behemoth，该模型被描述为迄今为止开发的最智能的大型语言模型之一。这一强大版本旨在协助训练和指导未来的人工智能模型。这次发布还标志着Meta首次实施混合专家（MoE）框架，该框架将模型划分为专业组件。每个组件专注于特定领域，如物理、诗歌、生物学或编程。当任务启动时，仅激活最相关的专家模块，从而提高效率，同时降低训练和推理相关的成本。

Llama 4 Scout构建了170亿个参数和16个专家，提供1000万个标记的上下文窗口。该模型旨在在单个GPU上运行，并与轻量级高性能模型的趋势保持一致，类似于谷歌最近发布的Gemma 3。同时，Llama 4 Maverick也具备170亿个参数，但包括128个专家，使其成为多种助手应用的多功能模型。Meta声称，Maverick在多个性能基准测试中超越了OpenAI的GPT-4o和谷歌的Gemini 2.0 Flash，包括代码生成和多语言理解。展望未来，Llama 4 Behemoth模型正在开发中，预计将拥有2880亿个活跃参数和近2万亿个总参数，旨在超越GPT-4.5及其他领先模型在STEM相关评估中的能力。