生命的遗传密码基于读取为三个字母“单词”的核苷酸碱基序列。一项新的研究表明,基于四个字母单词的代码在生物物理学上是可行的,但也带来了挑战。
克里斯蒂娜·阿米蒂奇/广达杂志
地球上的生命千姿百态——无论是在亚马逊河猎杀鹿的美洲虎,在刚果盘绕一棵树的兰花藤,在加拿大沸腾的温泉中生长的原始细胞,还是在华尔街啜饮咖啡的股票经纪人——在基因层面,这一切都遵循相同的规则。四个化学字母或核苷酸碱基拼出 64 个三字母“单词”,称为密码子,每个单词代表 20 种氨基酸中的一种。当氨基酸按照这些编码指令串在一起时,它们就形成了每个物种特有的蛋白质。除了少数鲜为人知的例外,所有基因组都以相同的方式编码信息。
然而,在上个月发表在eLife上的一项新研究中,麻省理工学院和耶鲁大学的一组研究人员表明,有可能调整其中一个历史悠久的规则,并创造一个更广泛、全新的遗传密码。更长的密码子词。原则上,他们的发现指出了将遗传密码扩展为更通用系统的几种方法之一,合成生物学家可以使用该系统来制造具有新生物化学的细胞,从而使蛋白质在自然界中无处可寻。但这项工作也表明,扩展的遗传密码受到其自身复杂性的阻碍,在某些方面变得不那么有效,甚至出人意料地降低了能力——这些限制暗示了为什么生命最初可能不喜欢更长的密码子。
目前尚不确定这些发现对宇宙其他地方的生命如何被编码意味着什么,但这确实意味着我们自己的遗传密码进化得既不太复杂也不太限制性,而是恰到好处——然后在此后的数十亿年里统治着生命弗朗西斯·克里克(Francis Crick)称之为“冰冻事故”。作者说,大自然选择了这种 Goldilocks 代码,因为它简单且足以满足其目的,而不是因为其他代码无法实现。
例如,对于四字母(四联体)密码子,有 256 种独特的可能性,而不仅仅是 64 种,这似乎对生命有利,因为它将为编码大量超过 20 种氨基酸和更多样化的蛋白质阵列提供机会。 以前的合成生物学研究,甚至是自然界中一些罕见的例外,表明有时可以用几个四联体密码子来增加遗传密码,但直到现在,还没有人尝试过创建一个完全四联体的遗传系统来看看它是如何实现的与正常的三联密码子相比。
“这项研究非常真诚地提出了这个问题,”新论文的主要作者 Erika Alden DeBenedictis 说,他在该项目期间是麻省理工学院的博士生,目前是华盛顿大学的博士后。
扩展自然
为了测试四联密码子遗传密码,DeBenedictis 和她的同事们不得不修改一些生命中最基本的生物化学。当一个细胞制造蛋白质时,它的遗传信息片段首先被转录成信使 RNA (mRNA) 分子。然后被称为核糖体的细胞器读取这些 mRNA 中的密码子,并将它们与转移 RNA (tRNA) 分子中的互补“反密码子”相匹配,每个分子的尾部都带有一个独特的特定氨基酸。核糖体将氨基酸连接成一条不断增长的链,最终折叠成功能性蛋白质。一旦它们的工作完成并且蛋白质被翻译,mRNAs就会被降解以供回收利用,而用过的tRNAs会被合成酶重新加载氨基酸。
研究人员调整了大肠杆菌中的 tRNA,使其具有四联体反密码子。在对大肠杆菌的基因进行各种突变后,他们测试了细胞是否能够成功翻译四联代码,以及这种翻译是否会导致毒性效应或适应性缺陷。他们发现所有修饰的 tRNA 都可以与四联体密码子结合,这表明“用这种更大的密码子大小进行翻译在生物物理上没有任何问题,”DeBenedictis 说。
但他们还发现,合成酶只能识别 20 个四联体反密码子中的 9 个,因此他们无法用新的氨基酸对其余的反密码子进行充电。 DeBenedictis 说,有九个氨基酸可以在某种程度上用四联密码子翻译,这“既多又少”。 “对于大自然不需要工作的东西来说,这是很多氨基酸。”但这有点因为无法翻译 11 种必需氨基酸严格限制了生命必须使用的化学词汇。
此外,许多四联代码翻译效率极低,有些甚至不利于细胞的生长。 DeBenedictis 说,如果没有主要的适应性优势,自然就不太可能选择更复杂的代码,尤其是一旦它确定了一个工作代码。作者得出的结论是,大自然之所以没有选择四联码,不是因为它无法实现,而是因为三联码简单而足够。毕竟,即使生命需要扩展其 20 个氨基酸的库,现有的 64 个密码子仍有很大的空间可以这样做。
三重密码子在地球上运作良好,但尚不清楚在其他地方是否也是如此——宇宙中的生命可能在其化学或编码方面存在显着差异。没有参与这项研究的斯坦福大学生物工程副教授、生物砖基金会主席Drew Endy说,遗传密码“可能是肽的生物化学衍生物,并且是生命工作所必需的”。在比地球更复杂的环境中,生命可能需要由四重密码子编码,但在更简单的环境中,生命可能只需要双重密码子——当然,如果它使用密码子的话。
根深蒂固的竞争
无论生命是如何在我们的星球或其他星球上编码的,这篇论文的真正影响在于,现在我们知道“完全有可能制造四码生物”,而且研究结果表明这将是简单的,恩迪说。他补充说,通过一项研究,他们几乎完成了一半,这是“一项非常了不起的成就”。
并非所有人都同意创建一个完整的四编码生命形式会很简单。 “我不认为他们展示的任何东西表明这会很容易 – 但他们确实表明这并非不可能,这很有趣,”合成生物学家弗洛伊德罗姆斯伯格说,他是生物技术公司 Synthorx 的共同创始人。与尝试做不可能的事情相比,让效果不佳的事情变得更好是“非常非常不同的游戏”。
DeBenedictis 说,要使真正的四联代码运行良好需要多少努力是一个悬而未决的问题。她认为,您可能还需要重新设计大部分翻译机制,以便更好地处理更大的代码。她和她的团队希望通过在工程 tRNA 上添加一个额外的“尾巴”来将他们的工作提升到一个新的水平,这样它们就可以与一组设计用于单独使用它们的核糖体相互作用。这可能会通过减少与系统的任何三元组编码方面的竞争来提高翻译效率。
她补充说,克服来自三元组代码的竞争将始终是一项重大挑战,因为它已经运作良好。