PaLM 2 系列中最大的模型 PaLM 2-L 比最大的 PaLM 模型小得多,但使用更多的训练计算。我们的评估结果表明,PaLM 2 模型在各种任务上明显优于 PaLM,包括自然语言生成、翻译和推理。这些结果表明,模型缩放并不是提高性能的唯一方法。相反,可以通过细致的数据选择和高效的架构/目标来释放性能。此外,更小但质量更高的模型显着提高了推理效率,降低了服务成本,并使模型的下游应用能够为更多的应用程序和用户服务。
原文: http://simonwillison.net/2023/May/10/palm-2/#atom-everything