直觉和人工智能是一对奇怪的组合。
直觉很难描述。正是这种直觉在折磨着你,即使你不知道为什么。我们自然地通过经验建立直觉。直觉并不总是正确的。但它们经常潜入我们的潜意识,以补充决策时的逻辑和推理。
相比之下,人工智能通过消化数百万个冷酷的数据点来快速学习,根据其输入产生纯粹的分析结果(如果不总是合理的话)。
现在, 《自然通讯》杂志上的一项新研究将这对奇怪的组合结合起来,产生了一个机器学习系统,可以捕捉化学家对药物开发的直觉。
通过分析瑞士制药公司诺华公司 35 名化学家的反馈,该团队开发了一种人工智能模型,该模型可以在药物开发的一个众所周知的困难阶段学习人类的专业知识:寻找与我们的生物学相容的有前途的化学物质。
首先,化学家利用直觉从 5,000 种化学对中选择哪一种更有可能成为有用的药物。从这个反馈中,一个简单的人工神经网络了解了他们的偏好。当遇到新化学物质的挑战时,人工智能模型会给每一种化学物质打分,根据其是否值得进一步开发为药物进行排名。
在没有化学结构本身的任何细节的情况下,人工智能“直观地”对某些结构成分(现有药物中经常出现的成分)的评分高于其他成分。令人惊讶的是,它还捕获了先前计算机建模尝试中未明确编程的模糊属性。与 DALL-E 等生成式人工智能模型相结合,这位机器人化学家设计了一系列新分子作为潜在的先导化合物。
该团队写道,许多有前途的候选药物都是基于“对照专业知识”。
该研究是诺华公司和微软研究院 AI4Science 之间的合作,后者位于英国。
深入化学兔子洞
我们的大多数日常药物都是由小分子制成的——用于止痛的泰诺、用于治疗糖尿病的二甲双胍、用于抵抗细菌感染的抗生素。
但寻找这些分子是一件痛苦的事。
首先,科学家需要了解这种疾病是如何发生的。例如,他们破译了让你头痛欲裂的生化反应链。然后他们找到链中最薄弱的一环(通常是蛋白质),并对其形状进行建模。他们掌握了手中的结构,精确定位分子可以塞入的角落和缝隙,破坏蛋白质的功能,从而停止生物过程——瞧,不再有头痛了。
得益于蛋白质预测 AI ,例如 AlphaFold、RoseTTAFold 及其分支,现在可以更轻松地对目标蛋白质的结构进行建模。找到适合它的分子是另一回事。该药物不仅仅需要改变目标的活性。它还必须易于吸收、扩散到目标器官或组织,并安全地代谢并从体内消除。
这就是药物化学家发挥作用的地方。这些科学家是采用计算机建模的先驱。二十多年前,该领域开始使用软件筛选庞大的化学品数据库,寻找有希望的线索。然后,在进一步开发之前,化学家团队会对每种潜在的先导化合物进行评估。
通过这个过程,药物化学家建立了一种直觉,使他们能够在审查有前途的候选药物时有效地做出决策。他们的一些训练可以被提炼成计算机学习的规则——例如,这种结构可能不会进入大脑;那可能会损害肝脏。这些专家规则有助于初步筛选。但到目前为止,还没有任何程序能够捕捉到他们决策的微妙性和复杂性,部分原因是化学家自己无法解释。
我有种感觉
这项新研究试图捕捉人工智能模型中无法解释的现象。
该团队在世界各地的诺华中心招募了 35 名化学专家,每位化学家都有不同的专业知识。例如,有些涉及细胞和组织,有些则涉及计算机建模。
直觉很难衡量。它也不完全可靠。作为基线,该团队设计了一款多人游戏来衡量每个化学家的选择是否一致,以及他们的选择是否与其他人一致。向每位化学家展示了 220 个分子对,并故意提出了一个模糊的问题。例如,假设您正在进行早期的虚拟筛选活动,我们需要一种可以作为药丸服用的药物 – 您更喜欢哪种分子?
目标是减少过度思考,促使化学家依靠直觉判断哪些化学物质会留下,哪些会消失。这种设置与通常的评估不同,在通常的评估中,化学家用预测模型(即硬数据)检查特定的分子特性。
化学家们的判断是一致的,但彼此的意见并不总是一致——可能是因为个人经历不同。然而,该团队解释说,有足够的重叠来形成人工智能模型可以学习的基本模式。
接下来,他们建立了包含 5,000 个分子对的数据集。这些分子每个都标记有其结构和其他特征的信息,用于训练一个简单的人工神经网络。通过训练,人工智能网络根据化学家的反馈进一步调整其内部运作,最终给每个分子打分。
作为健全性检查,该团队在不同于训练数据集中的化学对上测试了模型。随着训练样本数量的增加,性能突飞猛进。
虽然早期的计算机程序依赖于基于分子结构的有前途药物的规则,但新模型的分数并没有直接反映任何这些规则。人工智能捕获了对化学物质的更全面的了解——这是一种与经典机器人化学家软件中使用的完全不同的药物发现方法。
然后,该团队利用人工智能从化学数据库中筛选了数百种 FDA 批准的药物和数千种分子。即使没有明确的训练,该模型也可以提取化学结构(称为“片段”),这些化学结构更适合作为药物进一步开发。人工智能的评分偏好与现有类药物分子的评分偏好相匹配,这表明它已经掌握了潜在线索的要点。
化学浪漫
诺华并不是第一家探索人机化学浪漫的公司。
此前,制药公司默克也利用其内部专业知识对化学品的理想特性进行排名。在行业之外,格拉斯哥大学的一个团队探索使用基于直觉的机器人进行无机化学实验。
这仍然是一项小型研究,作者不能排除人类的谬误。一些化学家可能会根据难以完全避免的个人偏见来选择分子。然而,该装置可用于研究药物发现中的其他步骤,这些步骤的实验成本很高。虽然该模型基于直觉,但其结果可以通过基于规则的过滤器来支持,以进一步提高其性能。
该团队解释说,我们正处于一个机器学习可以设计数万个分子的时代。具有直觉的助理人工智能化学家可以帮助在药物发现的关键早期阶段缩小候选范围,从而加速整个过程。
图片来源: Eugenia Kozyr / Unsplash