Anima Anandkumar 站在加州理工学院的 CAST 风扇阵列前,该阵列模拟无人机实验的天气。她作为计算机科学家的工作有助于使人工智能更加灵活,使无人机能够在更动荡的条件下飞行。
Quanta 杂志的莫妮卡·阿尔梅达
加州理工学院计算机系布伦教授、英伟达机器学习研究高级主管 Anima Anandkumar 对矩阵有一定的了解。她的疑虑不是科幻电影,而是数学矩阵——整个计算机科学中使用的数字或变量网格。虽然研究人员通常使用矩阵来研究隐藏在大量数据中的关系和模式,但这些工具最适合双向关系。另一方面,像社会动力学这样的复杂过程涉及高阶交互。
幸运的是,Anandkumar 长期以来一直在享受这样的挑战。当她回忆起她小时候在印度迈索尔(现在的迈索尔)庆祝的新年节日 Ugadi 时,有两种口味脱颖而出:粗糖,一种代表生活甜蜜的未精制糖,以及印度苦楝,代表生活的挫折和困难的苦花。 “这是你能想到的最痛苦的事情之一,”她说。
她说,她通常会加载印楝。 “我想要挑战。”
这种对努力的渴望促使她在马德拉斯的印度理工学院学习电气工程。她在康奈尔大学获得博士学位,并在麻省理工学院担任博士后。然后,她在加州大学欧文分校担任助理教授,成立了自己的小组,专注于机器学习,这是人工智能的一个子集,计算机无需显式编程即可获得知识。在欧文,Anandkumar 潜入了“主题建模”的世界,这是一种机器学习,计算机试图从数据中收集重要的主题。一个例子是 Twitter 上的一种算法,它可以识别隐藏的趋势。但是单词之间的联系是一种对于矩阵关系来说过于微妙的高阶交互:单词可以有多种含义,多个单词可以指代同一个主题,而且语言发展得如此之快,以至于没有什么事情可以长期稳定下来。
Anandkumar 四岁左右和她的母亲(也是一名工程师)在印度迈索尔附近的布林达文花园。
这导致 Anandkumar 挑战 AI 对矩阵方法的依赖。她推断,为了让算法保持足够的观察力以在这种混乱中学习,研究人员必须设计它以掌握更高维度的代数。因此,她转向代数中长期以来未被充分利用的工具,称为张量。张量就像矩阵,但它们可以扩展到任何维度,超出矩阵的行和列两个维度。因此,张量是更通用的工具,使得它们不太容易受到“过度拟合”的影响——当模型与训练数据紧密匹配但无法容纳新数据时。例如,如果您喜欢多种音乐类型但只播放爵士歌曲,则您的流媒体平台的 AI 可以学习预测您喜欢哪些爵士歌曲,但它的 R&B 预测将是毫无根据的。 Anandkumar 认为张量使机器学习更具适应性。
这不是她接受的唯一挑战。 Anandkumar 是一位导师,也是一位倡导改变将边缘化群体赶出该领域的系统的倡导者。 2018 年,她组织了一份请愿书,要求将她所在领域的年度神经信息处理系统会议的名称从直接首字母缩写词更改为“NeurIPS”。同年 10 月,会议委员会拒绝了该请愿书。但 Anandkumar 和她的同事们拒绝放松,几周后董事会改变了方向。
Quanta在她位于帕萨迪纳的办公室与 Anandkumar 就她的成长经历、张量以及 AI 面临的道德挑战进行了交谈。为清晰起见,采访经过浓缩和编辑。
你的父母是如何影响你对机器的看法的?
在 1990 年代初期,他们率先将可编程制造机器引入迈索尔。当时这被认为是一件奇怪的事情:“我们可以聘请人工操作员来做这件事,那么自动化需要什么?”我的父母看到可以有巨大的效率,与人工操作的机器相比,他们可以做得更快。
那是你对自动化的介绍吗?
是的。和编程。我会看到我父亲编写程序的绿屏,它会移动炮塔和工具。看到它真的很有趣——理解几何,理解工具应该如何移动。您会看到如此庞大的机器如何做到这一点的工程方面。
你母亲在工程方面的经验是什么?
我妈妈在某种意义上是一个先驱。在她的社区和家庭背景中,她是最早从事工程学的人之一。很多亲戚都劝我爷爷不要送她,说她可能不会轻易结婚。我爷爷犹豫了。就在那时,我妈妈绝食了三天。
因此,我从来没有认为女性对工程学感兴趣是一件奇怪的事情。我母亲很早就向我们灌输了对数学和科学的欣赏。让它成为我从小就很自然的一部分,这对我有很大帮助。如果我妈妈曾经看到过性别歧视,她会指出来并说:“不,不要接受这个。”这真的很有帮助。
Anandkumar 在加州理工学院 CAST 竞技场实验室。
Quanta 杂志的莫妮卡·阿尔梅达
还有什么让你对数学和科学感到兴奋吗?
在高中之前,所有教的数学都是确定性的。加法,乘法,你所做的一切——只有一个答案。在高中时,我开始学习概率以及我们可以用随机性来推理事物。对我来说这更有意义,因为自然还有更多。有随机性,甚至混乱。
在我们自己的生活中,有太多我们无法预测的事情。但是我们不应该“过度适应”以前的经历,这不会让我们适应生活中的新条件。我意识到,有了人工智能,你应该可以灵活地泛化到新事物,学习新技能。
这就是为什么你开始质疑机器学习中的矩阵运算?
在实践中,机器学习中的矩阵方法并不能有效地捕捉高阶关系。本质上,你根本无法学习。所以我们问:如果我们看高阶[操作]会怎样?这让我们进入了张量代数。
凭借其多维度和灵活性,张量似乎很适合 AI 中的高阶问题。为什么以前没有人使用它们?
我确信人们会想到这一点。想好办法后,我们又回去查文献看看。事实上,1927 年有一篇心理测量学论文建议分析不同形式的智力,你应该做这些张量运算。所以人们提出这些想法已经有一段时间了。
但是当时的计算无法处理这些高阶[操作],这意味着通常至少三方之间存在相关性。我们也没有足够的数据。时机很重要。拥有最新的硬件,更多的数据,将帮助我们现在转向更高阶的方法。
Anima 的曾曾祖父 Rudrapatna Shamasastry 重新发现了一部名为 Arthashastra(或 Arthasastra)的古代作品。
如果你成功地让 AI 变得更加灵活,那么会发生什么?
重新思考人工智能本身的基础。
例如,在许多科学领域,我不能强迫我的数据在一个固定的网格上。数值求解器很灵活:如果您使用传统求解器,您可以轻松地在空间中的任何点找到解决方案。但是标准的机器学习模型并不是这样构建的。 ImageNet [用于训练 AI 识别图像的数据库] 具有固定的图像大小或分辨率。您在该分辨率上训练网络,因此您以相同的分辨率对其进行测试。如果您现在使用此网络但更改分辨率,它会完全失败。它在实际应用中没有用。科学家需要灵活性。
我们开发了没有这个缺点的神经算子。这导致在保持准确性的同时显着加速。例如,我们可以实时准确地预测流体动力学,我们计划在加州理工学院的无人机风力测试设施中将其部署在可以在强风条件下飞行的无人机上。
作为一名学生,您曾在 IBM 实习,现在除了在加州理工学院工作之外,您还与 Nvidia 合作。你为什么把学术理论和工业应用混为一谈?
我的父母是企业家。但我父亲身边的曾曾祖父是重新发现这部名为Arthashastra的古代文本的学者。那是公元前 300 年已知的第一本经济学著作。所以长大后,我一直在想:我如何跨越这两个世界?
我认为这就是这个时代如此伟大的地方。我们看到像英伟达这样的公司在开放研究方面的投资非常开放。
Anandkumar 与加州理工学院的学生(左起)Zongyi Li、Sahin Lale 和 Kimia Hassibi 一起工作。
Quanta 杂志的莫妮卡·阿尔梅达
你提到想要一种对人工智能研究的希波克拉底誓言。为什么?
质疑我们的工作将如何影响世界总是很重要的。这可能具有挑战性,尤其是在一家大公司中,因为您正在构建这个庞大系统的一部分。但是我们在大学里的很多教学方式都来自军校。工程来自那个背景,其中一些仍然存在。就像认为科学家和工程师应该专注于技术的东西,让其他人来处理其余的事情。这是错的。我们都需要人性化的思考。
当今僵化的算法如何导致这些伦理问题?
人类已经习惯于认为你可以信任机器。以前,如果您要求机器进行乘法运算,它总是正确的。人类可能是错的,我们的数据也可能是错的。现在,当人工智能的训练数据存在种族偏见时,我们正在拟合训练数据的假设。我们不仅可以得到错误的答案,而且可以非常自信地得到错误的答案。那很危险。
那么我们如何前进呢?
在构建更好的算法方面,我们至少需要问:我们能否给出正确的置信水平?如果另一个人说,“也许我有 60% 的把握这是正确的答案”,那么你就会考虑到这一点。
因此,如果我向窗外望去,看到一只像猫一样的动物,它有建筑物那么大,我会想:“是的,它看起来像一只猫,但我还不确定那东西到底是什么。”
确切地。因为那是这些模型存在过度自信问题的时候。在标准培训中,您正在激励他们非常自信。
您曾为加州理工学院的 WAVE Fellows 项目提供指导,该项目让来自代表性不足的背景的学生进行研究。您认为导师在 AI 中的作用是什么?
该领域的一位资深女性曾经对我感叹,女性觉得我们就像孤岛。我们是如此的脱节。我们不知道其他人的情况。我们不知道薪级表或任何东西。正是这种脱节的感觉——你不是系统的一部分。你不觉得你属于这里。我认为通过展示不仅仅是亲和群体(如 AI 中的WIML和Black)来解决这个问题非常重要。有更广泛的导师和人员投入到这些努力中。
这与您更改 NeurIPS 名称的经历有关吗?为什么那场战斗对你如此重要?
对于很多人来说,这就像,“哦,一个愚蠢的改名。”但它带来了毒性。我没想到会有长长的 Reddit 帖子取笑我们和我们的外表,以及各种威胁,各种企图诋毁他人。其中大部分是地下的。它让人们了解女性在这些会议中将面临的情况。
最终,我会说它使社区团结在一起。它把不知情的温和派人士带入了圈子。这确实有助于增强我们的多样性和包容性。
即使你习惯于挑战别人,我想仍然很难说出来。
这真的很难。我是一个注重隐私的人,但当我开始在社交媒体上发表意见时,即使只是发布我们正在做的工作或一些非常温和的事情,评论都是未经过滤的。 “让我们避免谈论消极的事情”的全部性质。我们把它埋起来吧。”但我的心态是,我们必须公开这一点,我们必须对自己负责。
人们需要吃他们的印楝吗?
正是,正是。你必须接受痛苦的事实。
原文: https://www.quantamagazine.org/the-ai-researcher-giving-her-field-its-bitter-medicine-20220830/