人工智能又做到了。
在解决了生物学中最大的谜团之一——预测蛋白质结构之后,它解码了蛋白质如何连接成复合物,并构想出新的蛋白质结构,这些结构最终可能转化为药物来控制我们的基本生物学、健康和生活。
然而,当面对巨大的蛋白质复合物时,人工智能却步履蹒跚。到现在。在一项令人费解的壮举中,一种新算法破译了遗传核心的结构——一个由大约 1000 种蛋白质组成的巨大复合体,有助于将 DNA 指令引导到细胞的其他部分。人工智能模型是由 DeepMind 的 AlphaFold 和华盛顿大学 David Baker 博士实验室的 RoseTTAfold 构建的,这两个模型都已向公众发布以供进一步实验。
我们的基因被安置在一个类似行星的结构中,被称为细胞核以提供保护。细胞核是一座高度安全的城堡:只有特定的分子才能进出,将 DNA 指令传递给外界——例如,细胞内的蛋白质制造工厂将遗传指令转化为蛋白质。
调节这种交通的核心是核孔复合体,或 NPC(向游戏玩家眨眼)。它们就像极其复杂的吊桥,严格监控分子信使的来龙去脉。在生物学教科书中,NPC 通常看起来像点缀在地球上的数千个卡通坑洼。实际上,每个 NPC 都是一个非常复杂的甜甜圈形建筑奇观,也是我们体内最大的蛋白质复合物之一。
为什么关心?就像解决一个巨大的拼图游戏一样,解决 NPC 结构本身就是有益的。但由于它们控制 DNA 信息如何传递到细胞的其他部分,所以 NPC 对于基因治疗、mRNA 型疫苗、 CRISPR以及我们尚未想象的其他潜在基因治疗至关重要。
“NPC [是] 疾病相关突变和宿主-病原体相互作用的热点,”《科学》杂志高级编辑姜迪博士在最新一期深入探讨 NPC 时说。 “这里报道的工作代表了实验结构生物学的胜利。”
结构之谜
“核毛孔”听起来像是护肤视频中的东西。但对于细胞生物学家来说,它们是一个长达数十年的谜团。 “NPC 对生命至关重要,”美国国立卫生研究院 (NIH) 前主任弗朗西斯·柯林斯博士解释说。
我们的 DNA 链缠绕在蛋白质线轴上。然后它们被隔离在细胞核内,从而保护 DNA 免受潜在有害化学物质、病毒或其他垃圾的影响。图片用双层保鲜膜包裹甜甜圈孔——这就是核膜。现在在包装纸上打几个洞——那些是 NPC。
这些看似简单的“墙上的洞”是细胞遗传控制的关键看门人。我们的细胞通过将 DNA 代码翻译成蛋白质来构建物理组织或控制基本的生物学功能——告诉细胞何时分裂或死亡、平衡新陈代谢和抵御病毒入侵者。
但是DNA被隔离在细胞核内。数百个蛋白质信使需要进入核区,将 DNA 指令转录成 mRNA,并将其运送回细胞的蛋白质制造工厂。每次运行都必须绕过 NPC——它们在一个结构中充当守卫和通道。
长期以来,科学家们一直试图破译其结构,使用生化魔法来篡改其正常功能,或使用 X 射线扫描其晶体结构。这项工作非常艰苦。从这些数据中,科学家们发现了两种主要类型的蛋白质,它们构成了我们遗传室的大门。
第一种类型构建门控脚手架。这些被称为 NUP(核孔蛋白)的蛋白质组成了隧道。第二种类型就像活的干墙泥。这些蛋白质更加灵活,沿着脚手架蛋白质涂抹并延伸到中央通道,在那里它们可以物理地抓住货物以帮助其移动。
NPC 结构由近 1,000 种蛋白质组成,形成大约 30 个不同的“码头”,因此很难解决,因为它们会动态变化。例如,多种蛋白质充当相互连接的铰链来改变孔的构型或大小。由 Drs 领导的团队解释说,由于整个结构“紧密地包围”了核膜,因此不能孤立地研究它们。马克斯普朗克生物物理研究所的 Gerhard Hummer 和 Martin Beck,以及欧洲分子生物学实验室的 Jan Kosinski 博士。到目前为止,即使采用最先进的生化手段,科学家也只解决了 46% 的 NPC 结构。
“这就像你拆卸和重新组装电子设备一样。总会留下一些螺丝,你只是不知道它们应该在哪里,”Kosinski 说。多亏了人工智能,“我们终于设法适应了大多数人,现在,我们确切地知道他们在哪里,他们做什么,以及如何做。”
进入人工智能
该团队首先利用并改进了一种流行的分析 NPC 的方法,称为低温 ET分析。该方法在 2015 年因能够将细胞结构解析到近原子尺度而声名鹊起。该团队解释说,解决 NPC 结构的问题之一是缺乏以前数据集的分辨率。在这里,他们收集了比之前尝试“大约五倍大的数据集”,并使用一种新的计算方法来分析数据。
查看新绘制的地图,该团队可以描绘出核膜——DNA“包装”——从收缩状态到更放松的状态。深入挖掘,该团队利用 AlphaFold 和 RoseTTAfold 来预测一套全面的 NPC 蛋白质模型。两人工作得很好——分析可以高可信度地模拟大多数核蛋白,并匹配来自传统微观分析方法的数据。
然后是困难的部分。就像院子里的船坞一样,NPC 与蛋白质运输方式密切相关,这通常很难在 3D 中建模。使用他们的模型,该团队将蛋白质接头的“锚点”映射到 NPC 主隧道。进一步的建模为链接器的连接方式构建了一个“谷歌地图”。就像一个组织良好的造船厂,每个都有助于维护 NPC 结构。
破解继承之心
使用人工智能解决蛋白质结构被吹捧为这十年的突破。这项研究是第一个展示算法在凌乱、复杂的现实世界环境中的强大功能的研究之一。
“这项工作体现了未来结构生物学将如何拥抱细胞生物学,以创建更大的分子组装的原子模型,这些分子在细胞的不同部分发挥不同的功能,”贝克说。
革命已经在路上。在同一期期刊中,由哈佛医学院的 Hao Wu 博士领导的另一个团队将显微镜成像与 AlphaFold 相结合,利用非洲爪蟾的卵解决了部分 NPC 结构,非洲爪蟾是生化研究的宠儿。
但人工智能还不是救世主。正如麻省理工学院的 Thomas Schwartz 博士(未参与这项研究)所指出的,NPC 是可以改变其配置的生物。例如,当它们快乐地依偎在核膜内时,它们的通道往往更宽,而不是在它们被拉出来在显微镜下研究之后。换句话说,蛋白质复合物很难破译和控制。但就像解决一个巨大的拼图游戏一样,人工智能就在我们身边。
“我们现在可以考虑建立一个完整的 NPC 动态模型,并模拟原子细节的核传输,”他说。借助基于 AI 的蛋白质预测,更令人兴奋的是即将到来的。
图片来源: V. ALTOUNIAN/ SCIENCE