Quanta 杂志的 Señor Salme
数学家在寻找对难题的洞察力时经常一起工作。这是一种随心所欲的协作过程,似乎需要独特的人情味。
但在两个新结果中,人类合作者的角色已部分被机器取代。论文于 11 月底完成,并在最近的Nature文章中进行了总结。
“我喜欢数学的地方在于它的直观性和创造性,”悉尼大学的数学家、其中一篇论文的合著者Geordie Williamson说。 “[机器学习]模型以一种我以前从未从计算机中感受到的方式支持这一点。”
两个独立的数学家小组与谷歌母公司 Alphabet 的一个分支 DeepMind 一起工作,致力于开发先进的人工智能系统。
牛津大学的András Juhász和Marc Lackenby教授 DeepMind 的机器学习模型在称为结的几何对象中寻找模式。这些模型检测到了 Juhász 和 Lackenby 精心设计的联系,以弥合数学家长期以来推测应该相关的两个结理论领域。在另一项工作中,威廉姆森使用机器学习来完善一个连接图和多项式的旧猜想。
多年来,计算机一直在帮助数学研究,作为证明助手确保证明中的逻辑步骤真正有效,作为强力工具,可以咀嚼大量数据以寻找猜想的反例。
新作品代表了一种不同形式的人机协作。它表明,通过选择性地将机器学习纳入研究的生成阶段,数学家可以发现在没有机器帮助的情况下可能很难找到的线索。
悉尼大学的 Geordie Williamson 帮助 DeepMind 识别出非常适合机器学习的数学问题。
北卡罗来纳州立大学的Radmila Sazdanovic说:“这项工作最令人惊奇的地方——它确实是一个重大突破——是所有部分都聚集在一起,而且这些人作为一个团队工作。” “这是一次真正的跨学科合作。”
然而,一些观察家认为,这种合作对数学研究的进行方式并没有太大的改变。虽然计算机将数学家指向一系列可能的关系,但数学家自己需要确定值得探索的关系。
“所有的辛勤工作都是由人类数学家完成的,”纽约大学计算机科学家欧内斯特戴维斯在一封电子邮件中写道。
数据模式
机器学习从输入预测输出:输入模型健康数据,它将输出诊断;给它看一张动物的图片,它会回复这个物种的名字。
这通常是使用一种称为监督学习的机器学习方法来完成的,在这种方法中,研究人员本质上是通过给计算机提供许多示例来教计算机进行预测。
例如,假设您想教一个模型来识别图像中是否包含猫或狗。研究人员首先给模型喂食每种动物的许多例子。基于这些训练数据,计算机构建了一个极其复杂的数学函数,它本质上是一台进行预测的机器。一旦建立了预测功能,研究人员就会向模型展示一张新图像,它会以图像是猫或狗的概率做出响应。
为了让监督学习成为一种有用的研究工具,数学家们必须为 DeepMind 找到正确的问题来解决。他们需要涉及大量可用训练数据的数学对象的问题——这是许多数学研究不符合的标准。
“我们看到了很多已知或已知不真实的模式,”拉肯比说。 “作为数学家,我们淘汰了很多机器学习发送给我们的东西。”
与 Juhász 和 Lackenby 不同,机器学习系统不理解底层的数学理论。输入数据是根据节点不变量计算的,但计算机只能看到数字列表。
“就机器学习系统而言,这些可能是麦当劳各种食品的销售记录,”戴维斯说。
最终,这两位数学家决定尝试教计算机输出一个重要的代数不变量,称为结的“签名”,仅基于有关结的几何不变量的信息。
在 Juhász 和 Lackenby 发现问题后,DeepMind 的研究人员开始构建特定的机器学习算法。他们训练计算机将 30 个结的几何不变量作为输入并输出结的特征。它运行良好,经过几周的工作,DeepMind 可以准确预测大多数结的特征。
接下来,研究人员需要找出模型是如何做出这些预测的。为此,DeepMind 的团队转向了一种称为显着性分析的技术,该技术可用于梳理出众多输入中的哪一个对产生输出负有最大责任。他们稍微改变了每个输入的值,一次一个,并检查了哪个更改对输出的影响最大。
如果设计了一种算法来预测图像是否显示猫,则执行显着性分析的研究人员将模糊图片的微小部分,然后检查计算机是否仍能识别出猫。例如,他们可能会发现图像角落中的像素不如构成猫耳朵的像素重要。
当研究人员对数据应用显着性分析时,他们观察到 30 个几何不变量中的三个对于模型如何进行预测似乎特别重要。所有这三个不变量都测量尖头的特征,尖头是一个包裹着结的空心管,就像电缆周围的橡胶涂层一样。
基于这些信息,Juhász 和 Lackenby 构建了一个公式,将结的特征与这三个几何不变量联系起来。该公式还使用了另一个常见的不变量,即刻有结的球体的体积。当他们在特定的结上测试这个公式时,它似乎有效,但这还不足以建立一个新的数学定理。数学家们正在寻找一个他们可以证明总是有效的精确陈述——这更难。
“它只是不太成功,”拉肯比说。
Juhász 和 Lackenby 通过多年研究类似问题建立起来的直觉告诉他们,这个公式仍然缺少一些东西。他们意识到他们需要引入另一个几何不变量,称为注入半径,它粗略地测量与结相关的某些曲线的长度。这是使用数学家训练有素的直觉的一步,但这是由他们能够从 DeepMind 模型识别的许多未经编辑的连接中收集到的特定见解启用的。
特拉维夫大学的Adam Zsolt Wagner说:“好消息是,[机器学习模型] 的优势和劣势与人类完全不同。”
修改成功。通过将有关注入半径的信息与 DeepMind 挑出的三个几何不变量相结合,Juhász 和 Lackenby 创建了一个用于计算结的签名的防故障公式。最终结果具有真正合作的精神。
“这绝对是一个迭代过程,涉及 DeepMind 和我们的机器学习专家,”Lackenby 说。
将图转换为多项式
基于结理论项目的势头,DeepMind 于 2020 年初回到威廉姆森,看看他是否想在他的领域( 表示论)中测试类似的过程。表示论是数学的一个分支,它寻找将数学的基本元素(如对称性)组合起来以制作更复杂的对象的方法。
在该领域中,Kazhdan-Lusztig 多项式尤为重要。它们基于重新排列对象的方式——例如通过交换列表中两个对象的顺序——称为排列。每个 Kazhdan-Lusztig 多项式由一对排列构成,并编码有关它们关系的信息。它们也很神秘,通常很难计算它们的系数。
数学家和 DeepMind 使用机器学习来搜索将布鲁哈特图转换为多项式的公式。
乔迪·威廉姆森
鉴于此,数学家试图根据更容易使用的对象来理解 Kazhdan-Lusztig 多项式,称为 Bruhat 图。 Bruhat 图上的每个顶点代表特定数量对象的排列。边仅通过交换两个元素来连接排列不同的顶点。
在 1980 年代,George Lusztig 和 Matthew Dyer 独立预测 Bruhat 图和 Kazhdan-Lusztig 多项式之间应该存在关系。该关系将很有用,因为多项式更基本,而图形更易于计算。
而且,就像通过使用另一个来预测一个结不变量的问题一样,这个问题非常适合 DeepMind 的能力。 DeepMind 团队首先在近 20,000 个配对的 Bruhat 图和 Kazhdan-Lusztig 多项式上训练模型。
很快,它就能够频繁地从 Bruhat 图预测正确的 Kazhdan-Lusztig 多项式。但要写下从一个到另一个的秘诀,威廉姆森需要知道计算机是如何做出预测的。
一个公式,如果你能证明它
在这里,DeepMind 研究人员再次转向显着性技术。 Bruhat 图很大,但计算机的预测主要基于少量的边。代表交换遥远数字(如 1 和 9)的边对于预测比连接翻转附近数字(如 4 和 5)的排列的边更重要。这是威廉姆森随后必须发展的领先优势。
“亚历克斯 [戴维斯] 告诉我,无论出于何种原因,这些优势都比其他优势更重要,”威廉姆森说。 “球又回到了我的球场上,我盯着这些看了几个月。”
威廉姆森最终设计了 10 个左右的公式,用于将布鲁哈特图转换为 Kazhdan-Lusztig 多项式。 DeepMind 团队将它们与数百万个 Bruhat 图示例进行了对比。对于威廉姆森的前几个公式,DeepMind 团队很快找到了不起作用的例子——食谱失败的地方。
但最终威廉姆森找到了一个似乎很可能成立的公式。它涉及将 Bruhat 图分解成类似于立方体的部分,并使用该信息来计算相关的多项式。此后,DeepMind 研究人员已经在数百万个示例上验证了该公式。现在由威廉姆森和其他数学家来证明这个方法总是有效的。
使用计算机检查反例是数学研究的标准部分。但是最近的合作使计算机以一种新的方式变得有用。对于数据量大的问题,机器学习可以帮助指导数学家朝着新的方向发展,就像同事随便提出建议一样。