引用艾哈迈德·阿尔-达勒的话 – 搞英语 → 看世界

Llama 系列经过重新设计，采用最先进的专家混合 (MoE) 架构，并通过多模态进行本地训练。我们将放弃 Llama 4 Scout 和 Llama 4 Maverick，并预览 Llama 4 Behemoth。

📌 Llama 4 Scout是性能最高的小型模型，具有 17B 个激活参数和 16 位专家。它速度快得惊人，本身就是多模式的，而且非常智能。它实现了业界领先的10M+ 令牌上下文窗口，并且还可以在单个 GPU上运行！

📌 Llama 4 Maverick是同类中最好的多模态模型，在广泛报道的基准测试中击败了 GPT-4o 和 Gemini 2.0 Flash，同时在推理和编码方面取得了与新的 DeepSeek v3 相当的结果 – 不到一半的活动参数。它提供了一流的性能价格比，实验性聊天版本在 LMArena 上的 ELO 得分为 1417。它也可以在单个主机上运行！

📌预览 Llama 4 Behemoth ，我们迄今为止最强大的模型，也是世界上最聪明的法学硕士之一。 Llama 4 Behemoth 在多个 STEM 基准测试中的表现优于 GPT4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。 Llama 4 Behemoth 仍在训练，即使它仍在飞行中，我们也很高兴能分享更多有关它的细节。

— Ahmed Al-Dahle ，Meta 副总裁兼 GenAI 负责人

标签:元, llm-release ,生成人工智能, llama , ai , llms

原文： https://simonwillison.net/2025/Apr/5/llama-4/#atom-everything