Inception 是一家位于帕洛阿尔托的人工智能公司,由斯坦福大学教授 Stefano Ermon 创立,该公司声称开发了一种新型的基于扩散的大语言模型 (DLM),在速度和效率上显着优于传统的法学硕士。据 TechCrunch 报道,“Inception 的模型提供了传统法学硕士的功能,包括代码生成和问答,但性能显着提高,计算成本降低。”报告中:Ermon 假设通过扩散模型可以并行生成和修改大块文本。经过多年的尝试,埃尔蒙和他的一名学生取得了重大突破,他们在去年发表的一篇研究论文中详细介绍了这一突破。认识到这一进步的潜力后,埃尔蒙于去年夏天创立了 Inception,并任命两名前学生——加州大学洛杉矶分校教授 Aditya Grover 和康奈尔大学教授 Volodymyr Kuleshov 共同领导该公司。 […]“我们发现我们的模型可以更有效地利用 GPU,”Ermon 说,他指的是生产中通常用于运行模型的计算机芯片。 “我认为这是一件大事。这将改变人们构建语言模型的方式。” Inception 提供 API 以及本地和边缘设备部署选项、模型微调支持以及一套适用于各种用例的开箱即用 DLM。该公司声称其 DLM 的运行速度比传统 LLM 快 10 倍,而成本却低 10 倍。 “我们的‘小型’编码模型与 [OpenAI 的] GPT-4o mini 一样好,而且速度快了 10 倍以上,”公司发言人告诉 TechCrunch。 “我们的‘迷你’模型优于 [Meta 的] Llama 3.1 8B 等小型开源模型,每秒可处理超过 1,000 个代币。”
在 Slashdot 上阅读这个故事的更多内容。