Inception 凭借新型 AI 模型从隐秘状态中脱颖而出

Inception 是一家位于帕洛阿尔托的人工智能公司，由斯坦福大学教授 Stefano Ermon 创立，该公司声称开发了一种新型的基于扩散的大语言模型 (DLM)，在速度和效率上显着优于传统的法学硕士。据 TechCrunch 报道，“Inception 的模型提供了传统法学硕士的功能，包括代码生成和问答，但性能显着提高，计算成本降低。”报告中：Ermon 假设通过扩散模型可以并行生成和修改大块文本。经过多年的尝试，埃尔蒙和他的一名学生取得了重大突破，他们在去年发表的一篇研究论文中详细介绍了这一突破。认识到这一进步的潜力后，埃尔蒙于去年夏天创立了 Inception，并任命两名前学生——加州大学洛杉矶分校教授 Aditya Grover 和康奈尔大学教授 Volodymyr Kuleshov 共同领导该公司。 […]“我们发现我们的模型可以更有效地利用 GPU，”Ermon 说，他指的是生产中通常用于运行模型的计算机芯片。 “我认为这是一件大事。这将改变人们构建语言模型的方式。” Inception 提供 API 以及本地和边缘设备部署选项、模型微调支持以及一套适用于各种用例的开箱即用 DLM。该公司声称其 DLM 的运行速度比传统 LLM 快 10 倍，而成本却低 10 倍。 “我们的‘小型’编码模型与 [OpenAI 的] GPT-4o mini 一样好，而且速度快了 10 倍以上，”公司发言人告诉 TechCrunch。 “我们的‘迷你’模型优于 [Meta 的] Llama 3.1 8B 等小型开源模型，每秒可处理超过 1,000 个代币。”

在 Slashdot 上阅读这个故事的更多内容。

原文： https://slashdot.org/story/25/02/26/2257224/inception-emerges-from-stealth-with-a-new-type-of-ai-model?utm_source=rss1.0mainlinkanon&utm_medium=feed