Llama 系列经过重新设计,采用最先进的专家混合 (MoE) 架构,并通过多模态进行本地训练。我们将放弃 Llama 4 Scout 和 Llama 4 Maverick,并预览 Llama 4 Behemoth。
📌 Llama 4 Scout是性能最高的小型模型,具有 17B 个激活参数和 16 位专家。它速度快得惊人,本身就是多模式的,而且非常智能。它实现了业界领先的10M+ 令牌上下文窗口,并且还可以在单个 GPU上运行!
📌 Llama 4 Maverick是同类中最好的多模态模型,在广泛报道的基准测试中击败了 GPT-4o 和 Gemini 2.0 Flash,同时在推理和编码方面取得了与新的 DeepSeek v3 相当的结果 – 不到一半的活动参数。它提供了一流的性能价格比,实验性聊天版本在 LMArena 上的 ELO 得分为 1417。它也可以在单个主机上运行!
📌预览 Llama 4 Behemoth ,我们迄今为止最强大的模型,也是世界上最聪明的法学硕士之一。 Llama 4 Behemoth 在多个 STEM 基准测试中的表现优于 GPT4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。 Llama 4 Behemoth 仍在训练,即使它仍在飞行中,我们也很高兴能分享更多有关它的细节。
— Ahmed Al-Dahle ,Meta 副总裁兼 GenAI 负责人
标签:元, llm-release ,生成人工智能, llama , ai , llms
原文: https://simonwillison.net/2025/Apr/5/llama-4/#atom-everything