我见过的第一个在 RedPajama 数据集上训练的公开许可模型。这个初始版本是一个在 200 亿代币上训练的 7B 模型,但其背后的团队承诺在不久的将来会推出一个完整的 1 万亿代币模型。我还没有找到这个在任何地方运行的现场演示。
原文: http://simonwillison.net/2023/May/3/openllama/#atom-everything
翻译英文优质信息和名人推特
我见过的第一个在 RedPajama 数据集上训练的公开许可模型。这个初始版本是一个在 200 亿代币上训练的 7B 模型,但其背后的团队承诺在不久的将来会推出一个完整的 1 万亿代币模型。我还没有找到这个在任何地方运行的现场演示。
原文: http://simonwillison.net/2023/May/3/openllama/#atom-everything