Meta AI 的新功能:大规模多语言语音。 “MMS 支持 1,107 种语言的语音转文本和文本转语音以及 4,000 多种语言的语言识别。[…]其中一些语言,例如 Tatuyo 语言,只有几百人使用,而对于大多数在这些语言中,不存在先前的语音技术。”
虽然它已获得 CC-BY-NC 4.0 许可,因此不可用于商业用途。
“在与 OpenAI 的 Whisper 的同类比较中,我们发现在 Massively Multilingual Speech 数据上训练的模型实现了一半的单词错误率,但 Massively Multilingual Speech 涵盖的语言是其 11 倍。”
通过黑客新闻
原文: http://simonwillison.net/2023/May/22/massively-multilingual-speech/#atom-everything