基因就像埃及的象形文字。由于全基因组测序的进步,阅读每个 DNA 字母变得越来越容易。但是 A、T、C 和 G 的字符串带来了第二个难题:如果有的话,它们是什么意思?
自人类基因组计划完成以来,这个问题一直困扰着生物学家。该项目假设,通过利用我们的遗传基础代码,我们将能够控制遗传疾病,随意编辑它们,并轻松预测为我们的身体、功能和生活奠定基础的任何基因的后果。
愿景并没有完全成功。 DNA 序列虽然捕获了极其强大的遗传信息,但并不一定能转化为指示我们身体的行为方式。根据细胞的需要,基因可以在不同的组织中打开或关闭。读取任何基因的 DNA 序列就像解析细胞内部程序的基本代码。有原始的遗传密码——基因型——决定了表型,这是控制细胞行为的生命软件。将两者联系起来需要数十年的艰苦实验,慢慢建立起一个知识百科全书,解码基因对生物功能的影响。
一项新的研究加大了这项工作的力度。由博士领导。分别在纽约纪念斯隆凯特琳癌症中心和加州大学旧金山分校的 Thomas Norman 和 Jonathan Weissman,该团队在 CRISPR 的帮助下构建了用于将基因型转化为表型的 Rosetta Stone。
他们变大了。这项名为 Perturb-seq 的技术改变了超过 250 万个人类细胞中的基因表达,全面绘制了每种基因扰动如何改变细胞的图谱。该技术围绕着一种基于类固醇的 CRISPR。一旦被引入细胞,Perturb-seq 会迅速改变数千个基因——在基因组规模上进行一次残酷的重组,以观察单个细胞的反应。
换句话说,Perturb-seq 是一种大规模工具,可以帮助科学家将 DNA 代码转化为功能——一种用于揭示细胞内部运作的罗塞塔石碑。经过多年的制作,该数据集对任何人开放供探索。
“我认为这个数据集将使来自生物学其他领域的人们甚至还没有想到的各种分析成为可能,突然间他们就可以利用这些了,”诺曼说。
迷失在翻译中
基因的功能是什么?人们很容易认为基因是你的命运,但事实并非如此。环境因素,例如一大碗意大利面或沿着海滩散步,很容易改变基因表达、身体机能,甚至可能改变你的身心。
如果是这样的话,如果结果总是在不断变化,那么对全基因组进行测序又有什么意义呢? “遗传学的一个核心目标是定义基因型和表型之间的关系,”作者说。换句话说,任何基因实际上做了什么?
长期以来,科学家们一直在寻求在基因型和表型之间架起一座桥梁。这是一个艰苦的过程。例如,一种方法是逐一扰乱可能与疾病相关的基因并观察细胞的行为。被称为“前向遗传学”的想法是专注于基因而不是专注于表型。另一种方法,“反向遗传学”,深入研究身体或思想如何随着特定的基因编辑而变化。
每种方法都是一场艰苦的斗争。我们体内有超过 20,000 个基因,并且每个细胞的行为都略有不同(即使基因变化相同),破译基因的功能通常需要数年甚至数十年的时间。
有什么方法可以加快这个过程吗?
CRISPR 罗塞塔石碑
进入CRISPR。长期以来,该方法被视为一种基因编辑多功能工具,现已进一步发展成为一种生物翻译器。其核心是一项名为 Perturb-seq 的技术,该技术于 2016 年首次发布,用于剖析基因的表达。 Perturb-seq 使得跟踪在单个细胞中打开或关闭基因的后果成为可能。该方法在 2020 年迅速成名,因为它可以同时改变多个基因。
该团队表示,这对细胞生物学来说是一个巨大的胜利。虽然科学家们已经很容易破解连接基因和蛋白质的庞大网络,但确定单个基因的作用一直是一场斗争。 Weissman说: “我们经常将所有‘基因 X’被击倒的细胞取平均值,然后观察它们的变化情况。” “但有时当你击倒一个基因时,失去相同基因的不同细胞会表现出不同的行为,而这种行为可能会被平均水平所忽略。”
Perturb-seq 背后的想法非常简单。想象一个蹒跚学步的孩子在看到后果后会打破东西并意识到他做了什么。 Perturb-seq 使用 CRISPR-Cas9 一次沉默多个基因,这有时可能会改变细胞的行为。虽然功能强大,但该工具很难扩展,一次最多研究几百个基因扰动来解决预定义的生物学问题。
那么为什么不将该方法扩展到整个基因组呢?
“Perturb-seq 的优势在于它可以让你以无偏见的方式获得一个大数据集,”Norman说。 “没有人完全知道你可以从这种数据集中获得什么限制。现在的问题是,你实际上用它做什么?”
细胞的生命
在这项新研究中,该团队首先发现了利用 CRISPR 对人类细胞进行全基因组改变的神奇秘诀。一个重点是优化引导 RNA (sgRNA) 库,即追踪基因的“猎犬”。接下来,他们捕获了感染了 CRISPR 的细胞并分析了它们的基因表达。总体而言,该团队专注于近 2,000 个基因。交叉引用改变的基因与每个细胞的表型,然后他们将基因聚集成与细胞结果相关的网络。
一个神秘的基因脱颖而出: C7orf26 。用 CRISPR 处理它改变了细胞如何构建一个巨大的分子复合体,称为 Integrator,它有助于制造控制基因活性的分子。在 Perturb-seq 之前, C7orf26之前从未与复合体相关联。
在另一项分析中,研究小组发现了一个改变“子细胞”如何继承亲本基因组的基因子集。例如,当细胞分裂时,去除一些基因会改变染色体的分布。添加或移除染色体可以从根本上改变我们的生物学,例如导致唐氏综合症。
对 Norman 来说,这方面是 Perturb-seq 中最有趣的部分。 “它捕捉到了只能通过单细胞读数获得的表型。你不能以任何其他方式去追求它。”
这个数据库只是一个开始。该团队正在寻求在其他人类细胞类型上使用 Perturb-seq,并且所有数据都可用于协作。随着超低成本基因组测序解决方案 Ultima Genomics 的兴起,单细胞 CRISPR 筛选可能在生物技术中发挥更大的作用,例如分析 iPSC(诱导多能干细胞)的基因组。
对韦斯曼来说,它甚至可能引发我们研究细胞奥秘的方式发生转变。 “您无需提前定义您将要研究的生物学,而是拥有这张基因型-表型关系图,您可以进入并筛选数据库而无需进行任何实验,”他说。