Meta推出Llama 4:最新开源AI模型全解析

360影视 日韩动漫 2025-04-06 21:00 1

摘要:Meta Platforms, Inc.最近推出了其开放源代码人工智能套件Llama 4的初始模型,以增强在生成性人工智能领域的影响力。首席执行官马克·扎克伯格强调了公司对开放源代码人工智能的愿景,认为这将引领潮流。Llama 4包括两个模型:Llama 4

Meta Platforms, Inc.最近推出了其开放源代码人工智能套件Llama 4的初始模型,以增强在生成性人工智能领域的影响力。首席执行官马克·扎克伯格强调了公司对开放源代码人工智能的愿景,认为这将引领潮流。Llama 4包括两个模型:Llama 4 Scout和Llama 4 Maverick,现已可通过Llama网站和Hugging Face下载。此外,Meta还推出了Llama 4 Behemoth,这是迄今为止最智能的大型语言模型之一,采用混合专家(MoE)框架以提高效率。Llama 4 Scout和Maverick均具备170亿个参数,前者拥有16个专家,后者有128个专家,且在多项性能基准测试中超越了竞争对手。未来,Llama 4 Behemoth模型将开发出2880亿个活跃参数,旨在超越现有领先模型的能力。

在一项重要努力中,Meta Platforms, Inc.于周六发布了其新开放源代码人工智能套件Llama 4的初始模型,以增强其在生成性人工智能领域的影响力。在一段Instagram视频中,Meta首席执行官马克·扎克伯格阐述了公司对人工智能的宏伟愿景:“我们的目标是构建世界领先的人工智能,开放源代码,并使其普遍可及……我早就说过,开放源代码的人工智能将引领潮流,而随着Llama 4的发布,我们开始看到这一点的实现。”首两个模型,名为Llama 4 Scout和Llama 4 Maverick,现已可以从Llama网站和Hugging Face下载。这些模型也是Meta AI的基础,后者作为公司的虚拟助手,集成在WhatsApp、Instagram、Messenger和网页等热门平台上。

除了初始模型外,Meta还推出了Llama 4 Behemoth,该模型被描述为迄今为止开发的最智能的大型语言模型之一。这一强大版本旨在协助训练和指导未来的人工智能模型。这次发布还标志着Meta首次实施混合专家(MoE)框架,该框架将模型划分为专业组件。每个组件专注于特定领域,如物理、诗歌、生物学或编程。当任务启动时,仅激活最相关的专家模块,从而提高效率,同时降低训练和推理相关的成本。

Llama 4 Scout构建了170亿个参数和16个专家,提供1000万个标记的上下文窗口。该模型旨在在单个GPU上运行,并与轻量级高性能模型的趋势保持一致,类似于谷歌最近发布的Gemma 3。同时,Llama 4 Maverick也具备170亿个参数,但包括128个专家,使其成为多种助手应用的多功能模型。Meta声称,Maverick在多个性能基准测试中超越了OpenAI的GPT-4o和谷歌的Gemini 2.0 Flash,包括代码生成和多语言理解。展望未来,Llama 4 Behemoth模型正在开发中,预计将拥有2880亿个活跃参数和近2万亿个总参数,旨在超越GPT-4.5及其他领先模型在STEM相关评估中的能力。

来源:老孙科技前沿

相关推荐