Mistral 全新的以代码为中心的模型。与第一个 Codestral不同的是,这个(目前)还不能作为开放重量使用。该模型有 256k 个令牌上下文——这是 Mistral 的新记录。
新型号在 Copilot Arena 排行榜上与 Claude 3.5 Sonnet 和 Deepseek V2.5 (FIM) 并列第一,令人印象深刻。
Chatbot Arena 于 2024 年 11 月 12 日宣布推出 Copilot Arena。排行榜由通过Copilot Arena VS Code 扩展收集的结果驱动,该扩展为用户提供免费访问模型的机会,以换取记录的使用数据以及他们对两个模型中哪一个返回最优秀的投票。最有用的完成。
到目前为止,我看到的唯一其他独立基准测试结果是Aider Polyglot 测试。这不太令人印象深刻:
Codestral 25.01 在 aider 多语言基准测试中得分为 11%。
62% o1(高)
48% DeepSeek V3
16% Qwen 2.5 编码器 32B 指导
11% 共纹 25.01
4% gpt-4o-迷你
可以使用codestral
别名(映射到La Plateforme上的codestral-latest
)通过我的llm-mistral插件访问新模型:
llm install llm-mistral llm keys set mistral # Paste Mistral API key here llm -m codestral "JavaScript to reverse an array"
标签:米斯特拉尔、法学硕士、人工智能辅助编程、生成式人工智能、人工智能、法学硕士、辅助者、评估
原文: https://simonwillison.net/2025/Jan/13/codestral-2501/#atom-everything