作为一个策划新闻通讯并涉足人工智能的人,我对XYZ公司发布的另一个人工智能模型的消息感到既不知所措又感到无聊,该模型将“改变游戏规则”并“让其他模型望尘莫及”。很难猜测我应该为什么感到兴奋。模型的尺寸?谁拥有它以及使用费用是多少?它的条款和条件?它有什么好处?虽然我住在欧洲,但我是否可以使用它?
如果我检查 Cursor 的可能模型列表,我不知道每个模型的含义,并且看到每个模型的次要版本感觉很奇怪……
Huggingface 上的模型名称及其描述对我或任何没有深入参与机器学习的人来说没有多大意义,这并没有什么帮助。新闻媒体和公司营销博客不停地用夸张的头条新闻报道我们,而不是通过案例研究来推销它们,这也无济于事。
这不是什么新鲜事。我们之前对AJAX库、框架和CSS库也有同样的想法。但如果我们考虑到训练和权衡模型所需的能量和计算能力,这似乎更加浪费。我们需要的是更少的关于模型的新闻,以及更多关于模型各自优点的信息。现在,感觉更像是一场尺寸竞赛,而不是一场更适用的竞赛。我们拥有的少数基准继续受到操纵和扭曲,这也无济于事。这是我们在浏览器大战期间已经拥有的东西,所以谢谢你,但没有。
我更兴奋的是报告和学习使用不同模型并发现其中一种更合适的人们的案例研究。所以,如果你有这些,请不要犹豫发布这些。
原文: https://christianheilmann.com/2025/04/16/the-rise-of-model-fatigue-or-is-it-just-me/