机器学习模型在过去几个月中展现出的巨大技术飞跃让每个人都对人工智能的未来感到兴奋——但同时也对其令人不安的后果感到紧张。在 Stability AI 和 OpenAI 的文本转图像工具成为热门话题后,ChatGPT 进行智能对话的能力成为各行各业的新宠儿。
在中国,科技界一直密切关注西方的进步,企业家、研究人员和投资者正在寻找在生成人工智能领域取得进展的方法。科技公司正在设计基于开源模型的工具,以吸引消费者和企业客户。个人正在从 AI 生成的内容中获利。监管机构迅速做出反应,定义了文本、图像和视频合成的使用方式。与此同时,美国的技术制裁引发了人们对中国能否跟上人工智能进步的担忧。
随着生成式人工智能在 2022 年底席卷全球,让我们来看看这项爆炸性技术如何在中国掀起波澜。
中国风味
得益于像 Stable Diffusion 和 DALL-E 2 这样的病毒式艺术创作平台,生成式 AI 突然出现在每个人的嘴边。在地球的另一端,中国科技巨头也以其同类产品吸引了公众,为迎合中国的品味和政治气候增添了新意。
百度在搜索引擎中名声大噪,近年来一直在加强其在自动驾驶领域的竞争,运营着ERNIE-ViLG ,这是一个在 1.45 亿个中文图像文本对的数据集上训练的100 亿参数模型。它与美国同行相比如何公平?以下是给 Stable Diffusion 的提示“kids eating shumai in New York Chinatown”的结果,与给 ERNIE-ViLG 的中文提示(纽约唐人街小孩子吃烧卖)的结果。
稳定扩散
厄尼-维尔格
作为在中国和唐人街吃点心长大的人,我会说结果是平手。都没有吃到正确的烧卖,在点心语境中,烧卖是一种用半开的黄色包装包裹着多汁、虾和猪肉的饺子。虽然 Stable Diffusion 营造了唐人街点心餐厅的氛围,但它的烧麦已经关闭(但我知道机器要去哪里)。虽然 ERNIE-ViLG 确实产生了一种烧麦,但它在中国东部比粤语版本更常见。
快速测试反映了当所使用的数据集存在固有偏差时捕捉文化细微差别的困难——假设稳定扩散将有更多关于中国侨民的数据,而 ERNIE-ViLG 可能接受了更多种类的烧麦图像的训练,这些图像在中国以外更为罕见。
另一个引起轰动的中国工具是腾讯的异次元我,它可以将人物照片变成动漫人物。人工智能生成器表现出自己的偏见。它面向中国用户,在南美等其他喜欢动漫的地区出人意料地走红。但用户很快意识到该平台无法识别黑人和大码个体,这些群体在日本动漫中明显缺失,导致人工智能生成的结果令人反感。
当然也很明显没有为深色皮肤的人适当调整模型,叹息
无论如何,不同的维度我是名字,但抱歉他们已经阻止/限制海外用户,因为无法处理流量pic.twitter.com/cYi6rJwTaC
– Rui Ma 马睿 (@ruima) 2022 年 12 月 7 日
除了 ERNIE-ViLG,另一个大型中文文本到图像模型是Taiyi ,它是 IDEA 的心血结晶,IDEA 是一个由著名计算机科学家 Harry Shum 领导的研究实验室,他与他人共同创立了微软在美国以外最大的研究分支 Microsoft Research亚洲。开源 AI 模型在 2000 万个经过过滤的中文图像文本对上进行训练,具有 10 亿个参数。
与百度和其他以利润为导向的科技公司不同,IDEA 是近年来由地方政府支持的少数几个从事尖端技术研究的机构之一。这意味着该中心可能享有更多的研究自由,而没有推动商业成功的压力。总部位于深圳的科技中心,并得到中国最富裕城市之一的支持,这是一家值得关注的崭露头角的公司。
人工智能规则
中国的生成式人工智能工具的特点不仅仅在于它们从国内数据中学习;它们也受当地法律的约束。正如《麻省理工科技评论》指出的那样,百度的文本转图像模型过滤掉了政治敏感关键词。这是预料之中的,因为审查一直是中国互联网的普遍做法。
对这个新兴领域的未来更重要的是针对政府所称的“深度合成技术”的一套新监管措施,它指的是“使用深度学习、虚拟现实和其他合成算法生成文本、图像、音频、视频和虚拟场景。”与中国其他类型的互联网服务一样,从游戏到社交媒体,用户在使用生成的 AI 应用程序之前被要求验证他们的名字。提示可以追溯到一个人的真实身份这一事实不可避免地对用户行为产生限制性影响。
但从好的方面来看,这些规则可能会导致更负责任地使用生成式人工智能,它已经在其他地方被滥用,以制造 NSFW 和性别歧视的内容。例如,中国的法规明确禁止人们生成和传播人工智能制造的假新闻。但是,如何实施取决于服务提供商。
“有趣的是,中国处于试图规范 [生成人工智能] 作为一个国家的最前沿,” 总部位于以色列的 OpenAI 竞争对手 AI21 Labs 的创始人 Yoav Shoham 在接受采访时说。 “有各种各样的公司正在限制人工智能……我所知道的每个国家都在努力规范人工智能或以某种方式确保法律体系或社会体系跟上技术的发展,特别是在规范自动发电方面的内容。”
但是对于应该如何管理这个瞬息万变的领域,目前还没有达成共识。 “我认为这是我们共同学习的一个领域,”Shoham 承认道。 “这必须是一种协作努力。它必须让真正了解该技术及其能做什么和不能做什么的技术专家、公共部门、社会科学家、受技术影响的人以及政府,包括商业和法律部门监管方面。”
人工智能货币化
随着艺术家们担心被强大的人工智能所取代,中国的许多人正在利用机器学习算法以多种方式赚钱。他们不是来自最精通技术的人群。相反,她们是机会主义者或寻找额外收入来源的全职妈妈。他们意识到,通过改进提示,他们可以诱骗 AI 制作富有创意的表情符号或令人惊叹的壁纸,他们可以将其发布在社交媒体上以增加广告收入或直接收取下载费用。真正熟练的人也会向其他想加入赚钱游戏的人出售他们的提示——甚至收费培训他们。
像世界其他地方一样,中国的其他人正在他们的正式工作中使用人工智能。例如,轻小说作家可以廉价地为他们的作品制作插图,这是一种比小说更短且通常以插图为特色的类型。一个可能会颠覆制造业领域的有趣用例是使用 AI 设计 T 恤、美甲和其他消费品的印花。通过快速生成大批量原型,制造商可以节省设计成本并缩短生产周期。
现在了解生成式人工智能在中国和西方的发展有何不同还为时过早。但是企业家们已经根据他们早期的观察做出了决定。一些创始人告诉我,企业和专业人士普遍乐于为 AI 付费,因为他们看到了直接的投资回报,因此初创公司急于开拓行业用例。一个聪明的应用来自红杉中国支持的 Surreal (后来更名为 Movio )和高瓴资本支持的 ZMO.ai ,它们在大流行期间发现,由于中国关闭边境,电子商务卖家正在努力寻找外国模式。解决方案?这两家公司致力于开发生成各种形状、颜色和种族的时装模特的算法。
但一些企业家不相信他们的人工智能 SaaS 会看到他们的西方同行(如Jasper和Stability AI )正在享受的估值飞涨和飞速增长。多年来,无数中国创业公司告诉我他们有同样的担忧:中国的企业客户普遍不如发达经济体的企业客户愿意为SaaS付费,这就是为什么他们中的许多人开始向海外扩张的原因。
中国 SaaS 领域的竞争也是激烈的。 “在美国,你可以通过构建以产品为主导的软件来做得很好,这种软件不依赖人工服务来获取或留住用户。但在中国,即使你有一个伟大的产品,你的竞争对手也可能在一夜之间窃取你的源代码并雇佣数十名客户支持人员来超越你,这些员工的成本并不高,”中国一家生成人工智能初创公司的创始人说,要求匿名。
销售智能初创公司 FlashCloud的创始人兼首席执行官施毅同意中国公司通常将短期回报置于长期创新之上。 “在人才培养方面,中国科技公司往往更注重应用技能和快速赚钱,”他说。一位不愿透露姓名的上海投资者表示,他“对今年生成人工智能领域的重大突破都发生在中国以外感到有点失望。”
前方的路障
即使中国科技公司想要投资训练大型神经网络,他们也可能缺乏最好的工具。 9月,美国政府对中国实施高端人工智能芯片出口管制。一位企业软件投资者表示,虽然许多中国 AI 初创公司专注于应用前端,不需要处理海量数据的高性能半导体,但对于那些从事基础研究的人来说,使用功能较弱的芯片意味着计算时间更长、成本更高在中国一家顶级风险投资公司工作,要求匿名。他认为,好消息是,从长远来看,此类制裁正在推动中国投资先进技术。
该公司执行副总裁兼人工智能云集团负责人表示,作为一家自称为中国人工智能领域领导者的公司,百度认为美国芯片制裁对其人工智能业务的影响在短期和长期内都是“有限的” ,斗神,在其第三季度财报电话会议上。这是因为“很大一部分”百度的 AI 云业务“并没有过多依赖高度先进的芯片”。在它确实需要高端芯片的情况下,它“实际上已经有足够的库存来支持我们在短期内的业务。”
未来呢? “从中长期来看,我们其实有自己研发的AI芯片,所以取名昆仑。”这位高管自信地说。 “通过在大型语言模型中使用我们的昆仑芯片 [听不清],在我们的 AI 平台上执行文本和图像识别任务的效率提高了 40%,总成本降低了 20% 至 30%。”
时间会证明昆仑和其他本土人工智能芯片是否会给中国在生成人工智能竞赛中带来优势。
Rita Liao 中国如何构建平行生成的 AI 宇宙,最初发表于TechCrunch
原文: https://techcrunch.com/2022/12/31/how-china-is-building-a-parallel-generative-ai-universe/