FlexGen – 搞英语 → 看世界

9599?v=4&s=200

这看起来很重要。 FlexGen 是一篇论文和随附的代码，它大大减少了运行一些当前性能最佳的开源 GPT 式大型语言模型所需的资源。 Hacker News 上的人报告说能够使用它在他们自己的硬件上运行像 opt-30b 这样的模型，而且看起来它开辟了在专用研究实验室之外可用的硬件上运行更大模型的可能性。

通过关于 Hacker News 的非常好的讨论

原文： http://simonwillison.net/2023/Feb/21/flexgen/#atom-everything