一排光滑的房间通过弯曲的管道连接起来,人工智能驱动的装置看起来更像是一个未来的啤酒厂,而不是化学实验室。
然而,当人类操作员发出“制造阿司匹林”的提示时,系统就会像一支运转良好的化学家团队一样立即采取行动。一个人工智能接受命令并搜索网络以优化药物的“配方”。另一个人工智能将结果翻译成代码,第三个人工智能指导机械臂进行实验。
该系统名为 Coscientist,是利用大型语言模型推动化学自动化的最新成果。作为流行的 ChatGPT 背后的算法类型,大型语言模型以其理解语言、音频和图像输入的能力席卷了世界,同时给出有用的(如果不总是准确的)响应。
人工智能已经在实验室引起了轰动。从蛋白质结构建模(解决长达五年的难题)到寻找遗传数据模式和“幻觉” 抗生素等新化学药物,该技术必将改变科学。
Coscientist 是同类中的先驱之一。它由卡内基梅隆大学的 Gabe Gomes 博士和同事开发,可以自主学习化学反应的配方,并设计实验室程序,在短短几分钟内完成反应。
作为概念验证,端到端系统完成了复杂的化学反应,因其在药物开发中的关键作用而荣获2010 年诺贝尔化学奖。
戈麦斯说:“这是第一次非有机智能计划、设计和执行人类发明的这种复杂反应。”
该系统的一个特点是它的模块化。通过分解化学任务,Coscientist 的行为就像一个化学家团队协同工作来寻找解决方案,从而加快了整个药物发现过程。
里斯本大学的安娜·劳拉·迪亚斯 (Ana Laura Dias) 和蒂亚戈·罗德里格斯 (Tiago Rodrigues) 博士(未参与这项工作)写道,Coscientist 使“自动驾驶实验室的愿景更接近现实”。
绝命毒师
化学很像完善食谱。
它始于一个目标:制造一种废物最少的化学品。正如厨师在网上寻找食谱创意一样,化学家深入研究已发表的文献并设计方案。
这是一个乏味的过程。面对合成新化学品的挑战,化学家花费数小时搜索类似分子和反应的数据库。他们需要进行多轮研究、实验和修改,才能以最少的浪费获得所需的分子。
“因此,化学家长期以来一直渴望开发自动化系统来促进他们的工作,”迪亚斯和罗德里格斯写道。
一个主要步骤是将不同类型的化学物质以精确的量和完美的时间注入多个“室”中,以便可以发生单独的反应。通常,这是手工完成的,但现在价格实惠的机器人可以轻松编程以建立新的化学相互作用。然而,它们并不完美。大多数只能进行一种反应。
迪亚斯和罗德里格斯写道,“这些限制让自主化学家机器人的梦想破灭了”。
这就是 OpenAI 的 GPT-4(ChatGPT 背后的算法)的用武之地。
你好,化学世界
通过比较一系列大型语言模型,例如 GPT-4、 Claude和Falcon ,该团队发现 Coscientist 可以生成详细的“配方”,以高产率生产化学品。这项新研究分为三个步骤,将多个经过微调的 GPT-4 实例串入自动化化学家中。
第一个是人工智能图书馆员,它从各种在线资源中学习。当团队跟踪其偏好时,他们发现人工智能花费最多时间访问顶级化学期刊的文献。这种见解很有价值。大型语言模型通常被描述为“黑匣子”,它并不总是解释它们如何计算结果。另一方面,Coscientist 则像化学家在实验本上写笔记一样阐述其推理,因此其工作更容易重现。
Coscientist 中的第二个人工智能“阅读”分配化学反应物的机械臂的用户手册,就像阅读一本关于如何操作新割草机的小册子一样,人工智能利用这些知识来“理解”其指令。
最后,第三个人工智能操作机械臂来合成化学物质。它还具有内置的“教授模式”,可以分析哪些反应有效,哪些无效,然后反馈到系统中以进行进一步微调。
诺贝尔奖的努力
在最初的测试中,Coscientist 扮演了一种调酒师的角色。
人工智能控制机械臂装载多种颜色的液体,将每种颜色小心地喷射到 96 孔网格内的一条线上。这就像试图在冰盘中制作多种颜色的冰块而不溢出一样。它基本上起作用了。通过一个简单的命令“画一条蓝色对角线”,Coscientist 就能够按照说明进行操作(在一些人工帮助下)。
为了提高难度,该团队接下来挑战该系统合成七种重磅药物,包括常见的止痛药,如阿司匹林、对乙酰氨基酚(泰诺的活性成分)和布洛芬。
Coscientist 计算了每个机械臂需要多少每种成分,并以最佳速度混合它们。人工智能第一次遇到困难,但通过练习,它学会了机械臂何时过热或化学物质何时沸腾。最终,就像经验丰富的厨师一样,人工智能找到了所需产品的完美食谱。
该团队还要求 Coscientist 优化一系列化学反应以提高产量——这是一项众所周知的困难化学挑战。仅用 10 个示例,该系统就比现有的机器学习方法表现得更好。当 Coscientist 的 GPT 组件没有足够的示例时,它遇到了困难,但它很快就学会了。每次迭代之后,它都会获得“知识”并调整其策略以随着时间的推移规划下一步。
目前,Coscientist 有点像化学系的新学生。它可以阅读和分析当前的出版物、产生想法并对其进行测试。但它有时也会吐出一些废话,这是困扰大多数大型语言模型的一个问题。因此,化学家有必要运用他们的直觉并检查结果。现实世界的化学问题也比研究中解决的问题复杂得多,尤其是在生物学领域。
随着更多的发展,团队设想 Coscientist 作为一个助手。它可以快速测试一系列化学配方,化学家可以在机器人系统运转时睡个好觉。
“我们可以拥有可以自主运行的东西,试图发现新现象、新反应、新想法,”戈麦斯说。
图片来源: Louis Reed / Unsplash
原文: https://singularityhub.com/2024/01/09/the-ai-behind-chatgpt-is-ready-to-do-chemistry/