研究和咨询公司 SemiAnalysis 周五报道称,在发布具有突破性成本效率的最新模型 V3 后,DeepSeek 已超越 Meta 的 Llama 和 Mistral,成为领先的开源人工智能模型开发商。这家中国初创公司在对冲基金 High-Flyer 的支持下,通过多头潜在注意力技术的创新实现了这一里程碑,该技术与标准方法相比,推理成本降低了 93.3%。尽管提供低于成本的服务来获得市场份额,但其性能匹配或超过 OpenAI 的 GPT-4。
在 Slashdot 上阅读这个故事的更多内容。