前几天我和一位朋友聊天,我们最终陷入了关于人工智能、新消费应用程序的困境,不知怎的,Sarvam 突然出现了。你知道,那些建造了印度唯一基础模型的人吗?
我的朋友非常熟悉科技领域,他甚至没有意识到这是一个基础模型。他只是认为这是 Llama 或 Qwen 的某种微调版本。老实说,我也不能百分百确定,直到另一位朋友证实,是的,这是真的。显然,他们投入了大量的工作来创建合成印度数据来训练它。
这让我们开始讨论市场规模。我的意思是,对于任何产品的腾飞,它实际上归结为以下之一(或理想情况下全部三个):
- 更好的
- 快点
- 更便宜
现在我们只关注印度的用例。以银行打来的有关贷款的电话为例。 Sarvam 能否为人工智能代理提供动力,呼叫客户提供消费贷款?
现在,Sarvam(至少根据他们的博客文章)在理解印度语言的细微差别方面似乎比其他小模型要好得多。因此,如果他们能够比实际的呼叫中心代理更便宜地完成这项工作,并且性能也同样好,那么很容易看到许多银行加入其中。
但问题是:这些银行会混合使用法学硕士吗?比如,OpenAI 或 Gemini 可以用于英语,而 Sarvam 可以用于区域语言吗?或者他们会全力投入 Sarvam 吗?或者,这是一件大事,OpenAI 是否会变得如此出色,以至于他们的人工智能代理可以完美地讲奥里亚语、阿萨姆语和所有其他语言,从而使 Sarvam 变得无关紧要?
Sarvam 的全部工作是生成大量合成印度代币,因此它可以超越主要接受英语培训的全球法学硕士。从长远来看,更小、更便宜的型号真的会更好吗?只有时间才能证明一切。
如果这是一个真实的市场,它到底有多大? OpenAI 可以走向全球。 Sarvam 的优势在于地方语言。他们在预算内训练模型方面做得很好(鉴于他们的资金充足,他们必须这样做)。如果这种方法有效,并且他们可以不断微调,他们实际上可能在区域用例中具有优势。
但话又说回来,这个市场有多大?如果您谈论的是贷款,那么讲英语的客户可能比想要与奥里亚语人工智能代理聊天的客户价值更高。
推理是难题的另一部分。 Sarvam 声称他们的推理速度比大型模型快 4-6 倍,同时在印度语任务上的表现与他们相当甚至超过。但我们不知道费用。更小、经过微调的 Llama 或 Qwen 模型是否可以更便宜地进行推理?我的意思是,这些大公司可能会在研发上投入大量资金以降低推理成本,并且他们可以将这些成本分摊到更大的客户群上。我们只是还不知道。
那么全球范围内又如何呢?如果 Sarvam 的方法是正确的怎么办?如果大量的综合本地数据确实有助于为区域语言建立更好的模型怎么办?他们能否将自己的技术出售给其他想要自己本土法学硕士学位的国家(也许是出于爱国原因、国家安全或隐私)?当然,OpenAI 可能会支持越来越多的本地语言,但是有很多语言和国家他们可能不会关心,因为规模并不那么令人兴奋。 Sarvam 能否建立一支销售团队,向这些国家销售定制车型?
基本上是这样的问题:
- 他们能否以一种为他们提供真正护城河的方式生成合成印度数据? (不仅仅是技术上的,因为 Facebook 可以对 Llama 做同样的事情,但他们可能不会,因为较小的区域模型不是他们的优先考虑)。
- 该模型在特定任务上实际上会优于较小的模型吗?
- 他们可以将这项技术出口到其他国家吗?
就像我们构建产品一样,在评估公司时提出正确的问题至关重要。
看到这个领域的区域性参与者,我感到非常兴奋。我真的希望他们能够与全球巨头正面交锋。但老实说,Sarvam 似乎在他们的公关上失败了。我必须仔细研究 Hugging Face 和他们的博客才能了解他们的方法。每次我提到 Sarvam 时,人们都会问他们的模型是否已经完成,是否有真正的客户。与此相比,OpenAI、Claude 和其他人每次发布新产品时都会受到热烈的欢迎。他们肯定需要提高比赛水平。