合成生命新篇章,创造从未有过的生命

澳门威斯尼斯人手机版 1

澳门威斯尼斯人手机版 2
(本文由 Nautilus 授权转载,撰文/Carl Zimmer,绘图/Emiliano Ponzi)上世纪70年代那会儿,你早上打开一盒麦片,或许会掉出来一个硬纸板做的圆盘。这是个密码盘,9~12岁的密码师可以用它来编写属于自己的密码。这种密码盘由一大一小两张圆盘组成,圆心处被钉在一起,可以绕着同一个轴转。外面的盘上写着字母,里面的则画有箭头。如果把箭头对准一个字母,里面小盘上就会有打开一个小窗口,露出另外一个字母。你可以用这些字母组成一句话,外人(尤其是你的父母)看来则是天书。要弄清这句话说了什么,唯一的方法是借助另一盒麦片里的密码盘来破译——当然,是同一品牌的另一盒麦片。

澳门威斯尼斯人手机版 3

出品:科普中国

重塑生命,这是一些科学家正在研究的事。

编译:孙智、来源:The Economist

每次我在生物教科书上看见这个,都会想起那时候的密码盘:

►除了ATCG能存储遗传信息外,还有其他的遗传密码吗?图片来自synthorx.com

制作:夏至(关西科健产业研究院)

近日发表在Nature上的一项研究显示,来自英国剑桥大学的研究者们首次完全合成并彻底改变了一种我们所熟知的生物的DNA密码子。这种生物就是生活在我们肠道内及环境土壤内的大肠杆菌(Escherichia coli)。这为人类敲开了合成生物的大门,意义非凡。

1 合成生物学,破陈出新

澳门威斯尼斯人手机版 4

在生命科学高强度渗透以及多方位的普及下,很少人不知道基因、DNA是什么。基因是DNA链上一段可编码蛋白的碱基序列,由A和G四种密码子组成,其中A与T配对,C与G配对,形成一条长长的遗传密码片段。

监制:中国科学院计算机网络信息中心

澳门威斯尼斯人手机版 5

我们尝试从理解蛋白质合成的角度来理解生命。蛋白质执行了从代谢到复制几乎所有的基本生命功能,而无论是以何种方式形成的,蛋白质都是由20种氨基酸串联而成的多肽链。尽管蛋白质结构是极其复杂且难以预测的,但这几乎完全取决于氨基酸的顺序。

这里画的也是个转盘,但并不是用来编写“带上变形金刚玩具到后院见我”这样的口信。这个转盘就在我们的身体里、在我们30万亿个细胞里,它令细胞能将储存在DNA里的指令翻译为构成我们机体的物质。地球上的每一种生物体内都能找到几乎一模一样的密码,可以说,这就是生命的密码。

地球上物种丰富多样,形态各异,忠实地记录着由4种核苷酸组成的遗传信息。除了这四种碱基之外,有没有其他的可存储生命遗传信息的物质?对于这个问题,早在上世纪60年代,就有科学家感兴趣,并猜想遗传信息的存储,是否会更加丰富多样。

本周又有一株大肠杆菌登上了科学界的巅峰《自然》杂志,号称人类历史上第一个全基因组被改写的人工合成微生物。虽然“基因组改写”和“人工合成”这样的名词在人造生命研究领域已经不算是新鲜说法了,这株人造大肠杆菌还是登上了各国科技媒体的头条。它到底有什么特殊之处,能够称得上历史第一呢?

由于大肠杆菌的生存范围极其广泛,且其遗传密码子相对简单,因此它是全球研究者心中最理想的研究模型,其为生物材料、合成药物以及病毒学等多个领域的发展做出了不可磨灭的贡献。

这些蛋白质的基因仅仅是一套氨基酸次序表。与计算机中0/1字符串的存储方式类似,这套信息在基因组中是用DNA碱基——A、C、T和G——的序列来记录的。将这些DNA碱基序列转变为氨基酸序列的程序被称为遗传密码,它使用四种DNA碱基,赋予64种不同的三字母字符串固定的氨基酸含义,我们称之为“密码子”。

遗传密码不同于生物体特定的基因序列,后面这个概念大家可是要熟悉得多。例如大猩猩的基因组,它存储在大猩猩的DNA里,由一连串叫做碱基的化学单元构成,碱基就像书里的字母。大猩猩的这本“书”里一共有30.4亿个“字母”组成的2.1万个基因(单词)。

直到最近几年才有一些重要进展开始出现。

通俗地说,研究者们对大肠杆菌的整套DNA中的一些编码进行了同义替换,然后从头合成了这套“全新”的基因组,造出了这株叫做Syn61的人造大肠杆菌。由此可见,全基因组改写确实没错,但并非是完全改写,相当于一部书稿中对某几个词汇进行了同义替换。即便是这样,这一成就也堪称是人造生命研究史上的里程碑事件。那么,人造生命研究领域近年来发生了哪些大事件?它们与这次的成果相比有哪些异同之处?进行人造生命研究到底有什么现实意义呢?

所有生物的遗传信息均储存在 DNA 中,DNA 又由 A 、T、G 和 C 四种碱基来编码。野生大肠杆菌细胞的拟核有 1 个 DNA 分子,长度约为 470 万个碱基对,在 DNA 分子上分布着大约 4400 个基因,每个基因的平均长度约为 1000 个碱基对。

想象一份包含一列密码子和一列对应氨基酸的“密码本”。解码基因需要逐个查找密码子并记下它们的氨基酸含义。这是一套简单的,参照规则的运作方法——一种算法。细胞执行相同的算法,但它使用的不是将密码子与氨基酸直接匹配的密码本,而是利用tRNA——一种能够识别密码子并携带氨基酸的小分子——和核糖体——用来提供tRNA与基因副本互作的位点——来进行解码。逐个氨基酸串联形成蛋白质的过程也就是逐个密码子读取基因的过程。

为了将大猩猩的基因翻译成相应的蛋白质——是蛋白质构成了大猩猩的身体并且行使各项身体机能——大猩猩的细胞遵循一套规则,这套规则就是遗传密码。基因序列是一本书,必须靠遗传密码解读;没有了遗传密码,就好像阅读象形文字却没有罗塞塔石碑。

澳门威斯尼斯人手机版 6

澳门威斯尼斯人手机版 7

剑桥大学分子生物学实验室的研究人员首先提取并分析了野生大肠杆菌的基因组成,分析每个基因对于大肠杆菌的生存意义。此后经过 2 年的时间,研究人员重新设计并合成了大肠杆菌所需的所有的基因,再使用这些重组的基因合成了首个“人造”大肠杆菌。

澳门威斯尼斯人手机版 8

科学家在上世纪60年代的时候破译了遗传密码,遗传密码和DNA的双螺旋结构一起并称现代生物学的两大发现。掌握了遗传密码,科学家就能用新的基因制造生物体,从而开启了生物技术的新时代。

►新发现的两种碱基与自然状态下的A-T比较,图片来自nature

来源:Freepik.com

全新设计并合成的人工基因组大约包含 400 万个碱基对。如果用标准 A4 纸打印这些基因组,大约需要 970 页,这是人类历史上首次合成那么长且复杂的基因组。

当生物以这种方式执行算法时,它看起来似乎更像是一台计算机了。但是生物不会像机器那样处理信息。在编写程序时,机器和作用于它的逻辑是分开的。计算机用户可以忽略硬件的物理原理和特性来修改软件程序。可是,进化却不做这种区分,它只是在处理分子相互作用,就像尼龙搭扣一样——tRNA与密码子的粘附,核糖体粘合氨基酸时的构象变化等等。从简单的蛋白质翻译到波澜壮阔的受精卵发育,生命的信息与处理无处不在,不可分割。生命运转的“软件”与“硬件”相互依赖,这使得它对人类的重编程具有很强的抵抗力。

半个世纪以后,遗传密码仍然令科学家为之着迷。他们持续争论遗传密码是如何演化的、为什么没有出现很多种密码。他们重编码细胞,构建出自然中不存在的新蛋白质种类,并以此为基础研发新的药物。

2014年,斯克利普斯研究所化学系教授Floyd Eric Romesberg与其团队成员在试管中发现了一种新的碱基复制方式。通过在大肠杆菌的基因序列中植入两个新碱基dNaM–dTPT3,可形成半人工合成生命。近年来,围绕着人造碱基方面的工作,他和同事发表了一系列重要的工作。

人造生命近年来的重大进展

澳门威斯尼斯人手机版 9

但是,它也会被“黑客”入侵。使用从一个生物体中切割出一个基因并将其灌输到另一个生物体的策略,生物技术几乎可以命令细胞生产它们本不需要的产品,例如仅有51个氨基酸的人类胰岛素(1978年,第一家生物技术公司Genentech生产的第一种产品),到含有上千个氨基酸的人工抗体。

这类研究不仅仅包括我们平常在新闻里听到的那些生物技术进展,比如测序基因或微调蛋白质功能,还延伸到更远。它改变了DNA在生物学上的涵义。通过对生命进行重编码,科学家最终可能制造出与过去40亿年来在地球上生活的生物有着本质区别的新生物体——实验室里创生的异形生命。 

11月30日,Romesberg及其团队又有了新的重要发现,他们发现非自然状态下的碱基能够植入大肠杆菌的基因组中,产生半人工生命体,其可以通过转录、翻译非自然状态下的氨基酸,合成蛋白质的效率和天然核苷酸并无差距。相关研究发表在最新一期的Nature杂志上。

澳门威斯尼斯人手机版,人类历史上首个合成生命的名号属于2010年诞生的一个衣原体。当时的科研团队参照自然存在的衣原体,人工合成了未经改动的大小约有1Mb的衣原体基因组,造出了第一个人工合成的微生物。

图 |编码基因的整合与缩短(来源:Total synthesis ofEscherichia coliwith a recoded genome)

对自然的开发是需求驱动的,直到今天依旧如此。大多数蛋白质都是天然存在的,它们能够执行形形色色的功能——调节血糖,杀死害虫或分解衣物上的污垢。很显然,这是一条盈利的门路:可以将这些蛋白质的基因放入细菌的基因组中,然后让它们分泌胰岛素,或者放入作物的基因组中赋予它们对害虫的抗性,或者在发酵罐中生产洗涤剂。从无到有地生产蛋白质不再是一件难事,让不同来源的蛋白质协同工作同样可行。

澳门威斯尼斯人手机版 10

澳门威斯尼斯人手机版 11

2018年中国制造的单染色体酵母,则是将酵母的多条染色体首尾相接,没有对基因组进行大范围的改写,DNA也不是人工合成(酵母属于真核生物,基因组有12Mb之大,远远超过衣原体),但毕竟是创造了自然界中不存在的物种,也算得上是第一个人造真核生物。

基因决定蛋白质的表达,蛋白质又是生命活动的主要承担者。在生物体内,每三个碱基编码一种氨基酸。但存在多个密码子编码同一种氨基酸的情况,例如 TCG 、TCA 、AGT 、AGC 均编码丝氨酸。因此,研究者可以用这一现象缩小合成基因的数量,这也是野生型大肠杆菌含有 470 万个碱基对,而此项研究仅合成了 400 万个碱基对的原因。同时,TGA 、TAA 和 TAG 均为转录终止密码子,研究者将这三个密码子仅用 TGA 和 TAA 来指导转录的终止。

于是,自然界中注入了新的活力。蛋白质设计和DNA合成的发展使得创造自然界中本不存在的蛋白成为可能。但它们仍然不甚完美。但是因为DNA序列合成很便宜,所以可以测试很多的版本来看看哪些可以奏效。

一塌糊涂的谜团

当克里克和沃森在1953年发表DNA的结构时,可谓一举解开了生命的众多奥秘。前几代的科学家一直不明白遗传的化学机制,而DNA提供了一个精练的答案。DNA由两条骨架组成,骨架上面排列着一系列的碱基。DNA只用4种碱基——缩记为A、C、G和T——制造生命全部的多样性。碱基的一种组合方式给了我们大猩猩,另一种则是向日葵。

虽然做出了这一重大发现,但克里克和沃森完全不知道细胞是如何使用DNA构建蛋白质的。最难理解的一点是蛋白质的化学基础和基因完全不同。DNA由碱基构成,而蛋白质却是由20种不同的氨基酸搭建成的长链构成。 

俄罗斯籍科学家乔治·伽莫夫(George Gamow)看了沃森和克里克的论文后,他立即意识到这个难题是一个密码学问题。DNA里含有一个由4个字母组成的消息。蛋白质也是序列,但这些序列由另一个字母表的20个字母组成。通过某种方式,这个4位数的系统存储了制造我们体内所有蛋白质的信息,从肌肉到神经递质再到消化酶。伽莫夫后来写道,“于是问题就成了怎样让四位数的号码转换成这些‘单词’。”

伽莫夫像十年前破解纳粹德国恩尼格玛机的英国密码破译员那样解决这个问题。他没有进行生物实验,而是依靠逻辑。在没有确凿证据的情况下,伽莫夫提出氨基酸掉进DNA分子的洞里时形成了蛋白质。下面是伽莫夫的构想(圆圈代表缠绕DNA双螺旋的碱基,菱形则是用于形成氨基酸的孔):

澳门威斯尼斯人手机版 12

伽莫夫提出,一种氨基酸只能通过某一种碱基组合之间形成的孔。他算出DNA上的碱基可以形成20种不同的孔,正好符合20种不同的氨基酸。这结果不可能是个巧合吧,伽莫夫表示。

虽然伽莫夫的答案干净漂亮,但它完全是错误的。科学家最终找出了正确的答案,可惜它繁冗得几近笨拙:细胞先制作一条单链的复制基因,叫做信使RNA。被称为核糖体的分子工厂拿过这条信使RNA,读取其上的序列,再抓取细胞周围游离的氨基酸,制造DNA指定的蛋白质。每制造一个氨基酸,核糖体要一次性读取3个碱基,这三个碱基就被称为一个密码子。

澳门威斯尼斯人手机版 13

再来看看遗传密码的转盘。从内向外,这上面画出了遗传密码中的所有密码子。例如,GUA编码缬氨酸。最令人意想不到的是,不止一个密码子可以编码相同的氨基酸。GUA可以编码缬氨酸,GUC、GUG和GUU也能编码缬氨酸。其他氨基酸或被3个密码子编码,或被2个密码子编码。只有少数氨基酸被单一的密码子编码。这离开伽莫夫设想的一一对应可是差远了。真正的遗传密码看起来一塌糊涂。

要是我买了一个这样转的麦片密码盘,绝对会写信给商家要求退款。

►在核糖体上非自然状态下的基因编码,表达出非标准的氨基酸,图片来自scripps.edu

今年2月,日美科学家在《科学》杂志上发表论文,介绍了它们最新合成的8碱基DNA。我们在高中已经学过DNA是由ATGC四个碱基排列构成的,而8碱基DNA则是在通常四个碱基基础上,又添加了SBPZ四个新碱基,合成了一段含有8种碱基的DNA。8碱基DNA可以说是目前人造生命研究领域中最为“人造”的一项重大成果,因为SBPZ四个新碱基在自然界中根本不存在。可惜的是,这项成就在推广方面没有达到本身应有的高度,知名度不及其它几项研究。

在经过 18218 次编辑后,科学家们终于完成了对大肠杆菌所有基因的重新设计与合并。重新设计的碱基序列使用化学合成法合成并被一段一段地导入大肠杆菌内,最终人工合成的基因组全部代替了野生型基因组,首个完全合成且彻底改变了一种 DNA 构成的生物诞生了,其被命名为Syn61。这种人工合成大肠杆菌比正常大肠杆菌稍长,生长速度也较为缓慢,但最为重要的是,它竟然活下来了。

因此,有些公司致力于发展新的代谢途径,这些途径整合了新近发现的酶,被人们熟知的酶和重新设计的酶。这是一种严谨的工艺:它不仅要求找到合适的酶,而且需要在十几个或更多的酶协同工作的情况下实现精确平衡的基因表达,更不用说调谐代谢强度以防止新途径的产物破坏底盘细胞中固有的代谢环境了。尽管存在诸多要求,但从目前的状况来看,在自然界中发现的任何小分子或多或少都能够成功地在发酵罐中使用酵母或细菌来生产。

一套密码统领万物

为了破解遗传密码,科学家开始了对肠道细菌大肠杆菌的研究。他们之所以选择研究这一特定的微生物,是因为前几代的科学家已经研究过大肠杆菌,积累了大量剖析其生化机制的工具。在科学家解开大肠杆菌的遗传密码后,他们又立即开始研究其他的物种。一例接一例,科学家总是能够找到完全相同的古怪系统。

自从发现遗传密码以来,科学家一直想知道为什么我们最终得到的是这一普遍的松散遗传方式。有的研究人员认为这表面上的松散实际上是耐用性的体现——自然选择青睐这种遗传密码,因为它比之前的版本更有抗性。通过使用一个以上的密码子对应一个氨基酸,生物体能保护自己不受有害突变的影响。

如果GUC突变成GUU,我们的细胞并不会切换成别的氨基酸,从而制造出有缺陷的蛋白质。细胞在两种情况下都会选择缬氨酸。在一项研究中,研究人员创建了大量随机的遗传代码以衡量它们对突变的耐受度,并排列座次。真正的遗传代码排在所有可能代码的最顶端0.000001%的地方。

但其他科学家不赞同这种百万里挑一的说法,他们认为我们这套遗传密码可能并无特别之处。1968年,克里克提出了一个遗传密码的出现过程,他抒情地称其为“冻结事故”。克里克认为,最初的生命形态有着原始的、松散的遗传密码。细胞在破译密码子的时候经常会犯错,抓取不同的氨基酸。由于早期生命形态的蛋白质分子小、结构简单,它们可以凑合着使用这些不合格的产品。

随着时间的推移,微生物出现了,它们的遗传代码更加精确,细胞误读特定密码子的可能性也降低了。它们也开始使用更多的氨基酸,从而构建更复杂、具有更多功能的蛋白质。最终,克里克论证,细胞变得非常复杂,摆弄遗传密码变成了非常危险的事情:一个突变就可能使细胞生产出数百种不同的有缺陷的蛋白质,引发灾难性的故障。遗传密码的演化在尖利的刹车声中停了下来。

还有的研究人员,比如伊利诺伊大学的奈杰尔·格登菲尔德(Nigel Goldenfeld),在他们看来遗传密码更像是一种语言,它令不同的物种得以使用相同的基因,就好比生物学的通用语。微生物有时会从其他物种那里借来基因,而有时这些借来的基因会被证明是巨大的福音。例如,在我们的身体里,耐药菌可以将自己的基因捐献给其他易受物种用以抵御抗生素药物。但能够受益于借来基因的唯一方法是细胞可以解码它们。

格登菲尔德认为,经过数百万年, 生命的众多遗传密码相互交流,实现了DNA里的全球贸易,直到只留下单一的一个密码。 

“人造碱基的研究发展至今已有近 30 年的历史,它又被称为非天然碱基对或人工扩展碱基字母,是一种通过对碱基的改造,人工设计合成的可以行使或模拟天然核酸功能、而又具有相对独立性的人造 DNA 。”中国科学院北京基因组研究所“百人计划”学者陈非对该研究做了解读。

与这些历史上的“第一”做个对比,就知道Syn61为何称得上是第一个全基因组被改写的人工合成微生物了(具有8碱基DNA的微生物目前还未被制造出来)。Syn61是在一株经过冗余基因删除的大肠杆菌MDS42的基础上进行改写的。此前,其他科学团队只做到了在大肠杆菌的全基因组中替换一个终止信号(且其DNA并非全人工合成),或者在一段基因中进行部分替换。

澳门威斯尼斯人手机版 14

两个十分有趣的生产实例分别是来自大麻的大麻素和来自罂粟的鸦片和吗啡衍生物。大麻素的结构与功能活性非常广泛,有些具有神经活性,有些可用于治疗;在某些管辖区内可以有许多合法的使用途径,而在其他地方则是非法的。Keasling博士及其同事今年2月描述的一组大麻素合成途径为治疗和消遣提供了可能性,后续将由Demetrix公司进行进一步探索。Keasling博士的学生Christina Smolke开发了一种能够产生吗啡及其多种衍生物的代谢途径,提供了更加典型的案例。目前Smolke成立了Antheia公司,致力于生产低价、低成瘾风险的鸦片类制剂,旨在让全世界数千万疼痛病患能够获得更为安全的舒缓疗法。

密码躲猫猫

在发现通用遗传密码的几十年后,科学家发现它并不是真正普适的。1992年,研究人员发现遗传密码规则的一个例外。而这起例外就在我们自己的细胞里。

人类DNA的大部分都储存在细胞核里,但一小撮却游离其外,存在于为细胞提供动力的线粒体之中。线粒体就像是我们细胞里的微型细胞,有它们自己的核糖体解码自己的基因。(其实线粒体有可能一开始是独立的细胞,它们的祖先很可能是自由生活的细菌,在20亿年前入侵了我们人体的细胞。)

在研究线粒体时,科学家偶然得出了一个惊人的发现:线粒体的遗传密码并非完全符合细胞核里DNA的遗传密码。通常来说,UGA命令核糖体停止制造蛋白质并将蛋白质释放出来。在人体的线粒体中,UGA不再是“终止密码子”;在这里,它解码成为色氨酸。

从第一起例外发现以来,研究人员已经找出了34例遗传密码的变种。每一例变化都是对祖辈遗传密码演化修饰的结果。布朗大学的细胞生物学家肯·米勒(Ken Miller)将这些变种比作方言。“美式英语、加拿大英语和英式英语的拼写和词义差异反映出它们源于同一语言。DNA的通用语也正是如此。”

在已知的遗传密码变种中,几乎每一种都有一个密码子被重新分配,解码20种标准氨基酸里的另一种。但也有极少数的物种扩大了密码,纳入了从未被其他生命形态使用过的新的氨基酸种类。有的微生物将它们的一个密码子换为解码硒代半胱氨酸。有的则添加了吡咯赖氨酸。还有的将这两种都加入进来。

这些遗传方言给生物学家带来了难题。这些具有变种遗传密码的物种彼此相隔甚远,居住在生命树枝桠的两端。这意味着遗传密码在进化中被改变了一遍又一遍。

2009年,宾夕法尼亚州立大学的进化生物学家爱德华·霍尔姆斯(Edward Holmes)和他的同事发现了携带变种遗传密码的物种间的另一共同点,这可能是驱使变种遗传密码演化的原因。研究人员观察了当时所有已知携带变种遗传密码的物种,发现没有证据表明病毒可以感染它们。

霍尔姆斯等人提出,躲避病毒是驱使一些物种改变自己遗传密码的原因。虽然病毒可以使其宿主致命,但它们同时也依赖于宿主生存。病毒通常只有一个蛋白质外壳和里面包裹的基因,没有核糖体或其他制造蛋白质或基因所需的组件。为了繁殖,它们必须侵入细胞并诱使其读出自己的基因。为了成功入侵宿主细胞,病毒必须使用与宿主相同的密码。如果密码不匹配,宿主细胞将产生有缺陷的病毒蛋白质,而新的病毒无法依靠其存活。

当一场致命的新病毒疫情爆发时,病毒有可能消灭大部分的宿主。携带变种遗传密码的宿主更有可能存活下来,因为病毒无法诱骗它们的细胞。这些突变宿主活了下来,重新建立种群。从那时起,由于体内的变种遗传密码,宿主物种对所有的病毒都免疫。

然而,今年早些时候,布法罗大学的科学家发现了首个感染携带变种遗传密码物种的病毒。它的宿主是一种将遗传密码CUG的编码从亮氨酸改为丝氨酸的酵母。研究人员仔细研究了这种病毒的DNA,发现其中几乎完全不含CUG密码子。看来是在酵母改变了密码后,病毒也改变了遗传信息,从而避免乱码出现。通过去掉CUG密码子,病毒消除了产生故障的风险。不断演化出变种的遗传密码是免受病毒侵害的好方法,但可能保证不了百分百免疫。有的病毒可能会抢先一步。

陈非研究员表示,“2014年,Romesberg研究小组成功构建了包含一对人造碱基的人工合成细菌,首次成功实现人造碱基对的体内复制,这一里程碑式的工作发表于Nature上,并被Science杂志列为当年十大科学突破之一。本研究在上述研究的基础上更进一步,Romesberg研究小组借助人工合成的反密码子GYT的 tRNA 的帮助,成功实现了非天然碱基X的体内翻译。本研究以绿色荧光蛋白为非天然碱基体内翻译的报告基因,在其151位氨基酸密码子中掺入了一个人工碱基X,合成并使用了3种人工合成的包含人工碱基反密码子的tRNA(分别源于E.coli,Methanosarcina mazei,Methanococcus jannaschii的tRNA序列),均实现了人工碱基的高效内源表达,且不影响细菌的正常生长。”

澳门威斯尼斯人手机版 15

图 |人工设计与合成400万个碱基对的拟核(来源:Total synthesis ofEscherichia coliwith a recoded genome)

2 代码突破

生命的新任编码大师

20世纪60年代对遗传密码的发现在50年后的今天仍然渗透到我们的日常生活里。在科学家认识到人类和大肠杆菌使用相同的密码破译各自的基因以后,他们想知道微生物是否也能根据人类的DNA制造蛋白质。赫伯特·博耶(Herbert Boyer)和他的同事想出一种方法,从人类细胞中截取胰岛素基因并将其插入到细菌的DNA里。正如博耶等人希望的那样,细菌开始产出胰岛素。今天,数百万的糖尿病患者注射进自己体内的都是细菌制造的胰岛素。

科学家在利用遗传密码制造有价值的分子这件事上愈发得心应手。他们可以令山羊在分泌的乳汁中产出蜘蛛丝。他们可以调整基因产生新的蛋白质,制备针对特定病原体的特异抗体。所有这些壮举都是因为有了生命的通用语才成为可能。

然而,遗传密码也限制了生物技术的创造力。它仅仅编码20个氨基酸。自然界中还有成百上千的其他氨基酸(有的甚至存在于星际空间)从未被生命使用过。更重要的是,科学家可以合成几乎无限多种的非天然氨基酸。如果科学家能够对遗传密码进行重编程,将这些其他氨基酸纳入生命的体系,将会开启控制生命的无限可能。

大自然已经修改过遗传密码的事实给了研究人员试图对其做出更多修改的信心。他们在21世纪初进行了第一次尝试。2002年,斯克里普斯研究所的化学家彼得·舒尔茨(Peter Schultz)和他的同事创造出感光的蛋白质。

舒尔茨等人将一个普通的氨基酸(苯丙氨酸)和一种叫做二苯甲酮的光敏化合物相结合从而实现了这一壮举。二苯甲酮被紫外光照射后会获得一定能量并与邻近的蛋白质结合。舒尔茨他们改变了细胞的分子,将原来读作终止密码子的UGA改为读出新的携带二苯甲酮的氨基酸。

接下来他们将改造的基因片段插入大肠杆菌,令大肠杆菌制造蛋白质而后采集做样本。当研究人员用紫外线照射这些蛋白质时,其中一些连在一起,这都要归功于二苯甲酮形成的化学键。改造细菌制造出了此前从未有生物体制造出的分子。

在这类实验的基础上,舒尔茨后来参与成立了一家名为Ambryx的公司。2012年,Ambryx与制药巨头默克公司(Merck)签署了一份3.03亿美元的合约,通过改变遗传密码探索新的制药途径。

在一个典型项目里,Ambryx的研究人员正在努力开发像制导导弹那样对抗肿瘤的抗癌分子。他们希望改善一类现有的药物,这类药物由单克隆抗体这种蛋白质制成。这些抗体被制造成只攻击已经变成癌的细胞。标准的单克隆抗体与癌细胞结合,从而令它们更容易被免疫细胞发现,然后杀死它们。

Ambryx研究人员正在研究如何令抗体动手剿灭癌细胞。他们正在构想携带毒素的非天然氨基酸,同时改造细菌,使其在制造抗体时会使用这些有毒的氨基酸。他们希望一旦这些非天然的抗体附着于癌细胞后,携带的毒素会立即杀死癌细胞。

就目前而言,拓展遗传密码只是一项有前景的技术,而不是救赎。默克公司没有一箱箱制造癌症药物的大肠杆菌。没有人知道细菌制造这些非天然蛋白质的效率有多少。

更极端地改变遗传密码可能最后会带来更大的成功。耶鲁大学的生化学家法伦·艾萨克斯(Farren Isaacs)和他的同事正在运作这样一个雄心勃勃的项目。他们想改变不是一个而是几十个密码子。如果成功了,他们可能会制造出崭新的蛋白质。他们重编码出的微生物将完全不同于如今活着的生物,或许不同于任何曾在地球上出现过的东西。

艾萨克斯想利用遗传密码中大量冗余密码子这批资源。他想重写生物体的DNA,使原本编码精氨酸的4个不同的密码子只留下一个编码精氨酸,这样就腾出3个密码子,可以用来重编码制造非天然氨基酸。标准的遗传密码中有44个冗余密码子,艾萨克的策略可能开辟广阔的生物新可能。

在《科学》10月初发表的一项研究中,萨克斯和他的同事踏出了走上这条道路的第一步。他们使用新的基因编辑工具搜索大肠杆菌基因组中每一处含有UAG序列的终止密码子:结果一共找到了314处 。萨克斯等人将这314处的UAG序列替换成另一终止密码子UAA序列。细菌在不含冗余密码子的情况下运转一切正常。

这个实验标志着研究人员第一次改变了生物体基因组中的单一密码子。现在UAG被腾了出来,可以用于编码新的氨基酸,科学家因此得以将TAG密码子加到许多不同的基因当中。如果这种方法起效了,或许能用到其他的冗余密码子上面。

以这种方式重写遗传密码不仅可以让科学家创造新型分子。如今,生物技术操作受病毒所限,因为病毒会杀死科学家用来产生新分子的微生物。萨克斯重编码的微生物可能被制造成对病毒免疫。

一种新的遗传密码也可能消除改造微生物逃出实验室到外面肆虐的风险。科学家可以改造微生物,令它们依赖于非天然氨基酸生存。如果它们逃出实验室,只能找到天然氨基酸,就只能死亡。换句话说,这些改造物种会沦为我们密码的奴隶,从根本上与我们这个星球上的其他生物和天然密码隔绝开来。

现在对转基因食品的争论主要受我们突然开始以危险方法篡改DNA这一概念的煽动。事实上,几千年来,从我们驯化作物和牲畜开始,我们就一直在摆弄DNA。水果玉米的基因与其有着坚硬种子的祖先相去甚远。近几十年来,生物技术使我们能够更好地将一个物种的基因移进另一个物种,科学家甚至开始编辑DNA的单个碱基从而微调基因。

尽管携带人胰岛素基因的细菌可能看起来很怪,不过它仍然使用的是生命几十亿年来赖以生存的古老密码。现在,我们或许正处在一个全新时代的边缘——在那里,是我们而非自然演化驾驭生命的密码。

本文作者卡尔·齐默(Carl Zimmer)是《纽约时报》专栏作家,著有《病毒的星球》(A Planet of Viruses)等多部科普著作。

澳门威斯尼斯人手机版 16

本文由 Nautilus 授权果壳网(guokr.com)编译发表,严禁转载。 

目前,陈非研究员正从事合成生命遗传系统设计与构建、重大疾病基因组学及相关核酸分子精准检测、诊断技术等方面的研究,他曾师从现代合成生物学联合创始人Steven A Benner教授。

染色体和DNA的结构关系,来源:Freepik.com

Chin 教授表示,由于此种大肠杆菌的基因组与野生型大肠杆菌存在较大差异性,因此病毒难以入侵并在此种细菌体内繁殖,这实际上赋予了此种细菌先天的抗病毒能力。他认为,此种细菌未来可用于药物合成中,因为许多疾病的特效药,例如胰岛素,依赖从细菌体内大量提取,但细菌又容易受到病毒的感染,导致药物的生产效率降低。这种人工合成大肠杆菌具有先天的抗病毒能力,其可大大提高药物研发和生产的效率。

至少从化学的角度来看,创造新酶以催化从未有过的化学反应是比重塑和改进天然化合物更为激进的策略,比如酶法催化碳硅成键的反应。化学家对此非常擅长,他们创造的有机硅化物被广泛用在电子,制药,建材,假体植入等。然而生命不使用碳-硅键,因此也没有天然酶合成它们。

- 编译自Creating Life As We Don't Know It

  • ### 原创人员:撰文/ Carl Zimmer;绘图/ Emiliano Ponzi

澳门威斯尼斯人手机版 17

对遗传语言的同义替换是如何做到的?

伦敦帝国理工学院合成生物学研究员 Tom Ellis 表示:“这项研究将合成基因组学领域提升到了一个新的水平,不仅成功构建了迄今为止最大的合成基因组,而且编码变化也达到了迄今为止的最高水平。”

2016年,加州理工学院的Frances Arnold补充了自然界的不足。她利用进化技术创造了一种将硅固定在碳上的酶,为生物学打开了一个全新的化学领域。 她现在正利用机器学习的手段来改进她的定向进化技术(2018年诺贝尔生理医学奖),可以更好地减轻主观导致的盲目性。 她认为合成生物学原则上可以为化学家提供绝大多数反应所需要的酶,这些反应目前尚在使用稀有催化剂,高温和高压或环境不友好的溶剂。

►半人工合成大肠杆菌敲入一个非自然状态的遗传密码,表达出绿色荧光蛋白,图片来自scripps.edu

要搞清楚这个问题,先来复习一下生物的遗传密码DNA。

但此纪录很可能在不久的未来被打破,因为哈佛大学的研究人员正在进行一个更为复杂的基因组合成研究。

除了创造新的蛋白质,还可以创造新的RNA,这就是CRISPR基因编辑的工作原理。一个RNA分子被生产出来,锚定到基因组中的特定位置;而后一个伴侣蛋白开始切割被“高亮”显示的DNA序列。 一旦DNA被断开,新的基因或基因片段就有机会插入到这个间隙中。如果将表达CRISPR RNA及其蛋白质的基因以特定条件诱导表达的方式放入细胞中,那么就拥有了一个可以通过条件控制来重新编程基因组的细胞。

Romesberg认为,半合成生命体能够储存、复制非自然状态下的遗传信息,未来可被用来创造新的新的蛋白质,新的材料,甚至新的治疗方法。对于药物的开发以及其他有用的分子来说,半合成人工生命体同样也会有帮助。

高中生物课告诉我们,地球上的一切生物,包括我们自身、我们的宠物、我们的食物和我们身上和体内的细菌等等,遗传信息均由细胞核内染色体上称为DNA的大分子所保存(部分病毒为RNA,即核糖核酸)。而DNA是用一套遗传语言编码而成的,且这套语言中只含有ATGC四个字母,A与T、G与C两两配对(在RNA中是AUGC,U代替DNA中的T,与A配对)。这四个字母代表的四种碱基排列构成了我们的DNA,一段段记录了遗传信息的DNA就是基因。

—End—

如果想要从头开始编写基因组,可以有多种方式轻易地把它搞乱。目前,世界范围内十个实验室组成的联盟正在重写酿酒酵母的整个基因组,希望其成为比现在更好的遗传研究实验模型。为此,他们将6,000多个基因的最合适的版本以及它们之间发现的大多数有时重要的衔接区段精心拼接在一起,总共超过12 Mb。该项目同时将一套控制系统写入基因组,当它被激活时,它会进行自我切割并重排内部基因。伦敦帝国理工学院的Tom Ellis说,这项技术将会为进化研究提供强大的新工具。

也许有人会担忧,未来可能会造出完全不由ATCG组成的、由其他遗传密码组成的人工生命体。Romesberg强调,目前这项研究仅在单细胞等低等生物中进行实验,仅用它们来存储遗传信息。

澳门威斯尼斯人手机版 18

编辑:Michael

所谓的“Sc 2.0”与酿酒酵母不同的更深层原因是它的遗传密码略有不同。DNA的64种密码子中有三种描述的不是氨基酸,而是一个动作:“停止”。 这三个密码子——TAG,TAA和TGA——告诉核糖体及其tRNA:“这是这个基因的终点,别添加氨基酸了,你们已经造好这个蛋白了。”然而,在重新设计的酵母中,只使用了这三种终止密码子中的两种。天然的酵母基因组的蛋白质编码基因的末端只要含有未选定的终止密码子,编写Sc 2.0的科学家就会把它替换为其他的终止密码子。这意味着在Sc 2.0中TAG没有任何意义——因此它可以用来表示新的东西。

对于这项研究,陈非给予了高度评价,“这无疑是人工合成生命领域的一次革命性的突破,它的成功打通了人造碱基的体内复制、转录、翻译生命中心法则的主要环节,为构建稳定遗传的人工合成生命遗传系统翻开了新的一页。这既是‘生命工程化’的一次有益的尝试,也是‘从头合成生命系统’领域的一次革命,对化学合成生物学研究领域的发展也会起到极大的推动促进作用,并可能为合成生物学开辟出一条新的、更安全的别样健康发展之路。”

DNA和RNA的结构对比,作者见图

参考文献:Thomas S. Elliott,Jason W. Chin. Total synthesis of Escherichia coli with a recoded genome

大自然通常使用20种氨基酸来制造蛋白质。但是还有数以百计的氨基酸可以使用,其中一些会带来有趣的新属性。在Sc 2.0中,通过设计识别TAG密码子的新tRNA分子和将新氨基酸粘附到该tRNA上的新酶,可以使TAG密码子转变成为编码氨基酸的密码子成员之一。如此配备的细胞将能够利用全新的氨基酸。

澳门威斯尼斯人手机版 19

在读取基因记录的信息时,相邻的三个碱基为一组,4种碱基可能出现的排列组合就有64种,这样的排列组合就是密码子。每种密码子可以对应一种氨基酸或者终止信号,64种密码子对应了参与合成蛋白质的20种氨基酸和3个终止信号。

请随简历附上3篇往期作品

这个方法并不止步于此。遗传密码使用61种密码子来编码20种氨基酸; 而某些氨基酸会有多个密码子“同义词”。 以无同义词的形式编写有机体的DNA是一项组合任务,这类似于选择在写作时避免使用共同的语言符号,例如“e”; 结果可能看起来有点无趣,但是是可以做到的。用较少的同义词重写代码,这样就拥有了更多的密码子用于引入非天然氨基酸。这就有可能为治疗感染提供一种细菌防御机制所不能应对的药物。细菌已经进化到可以对抗天然的蛋白质的程度,但若是投入他们从未见过的氨基酸,其中一些防御措施或许就将不再适用。

►这项研究的第一作者和Romesberg,图片来自scripps.edu

在制造蛋白质时,DNA的序列首先被转录到信使RNA中,蛋白质制造工厂——核糖体则以信使RNA为模板,读取三个碱基一组的遗传信息,将一个个氨基酸连成一串,最终合成生命的基础——蛋白质。只有4个字母的DNA中就是这样携带了大量信息,再通过精巧的过程被解读,使我们和宠物、食物、细菌的区别一目了然。

{"type":2,"value":"

合成生命新篇章,创造从未有过的生命。定制遗传密码的吸引力还在于超越现有的“词汇量”。今天的遗传密码的普适性使得病毒得以“奴役”遭受感染的细胞,从病毒基因中制造出病毒蛋白。使用另一套遗传密码的基因组对于这种攻击是坚不可摧的;病毒的基因将不能描述它所需的蛋白质。因此,重新编码可以使细胞免疫任何病毒攻击; 事实上,已经有人在细菌中实现了这一目标。

澳门威斯尼斯人手机版 20

如下图所示,信使RNA携带从DNA处转录而来的遗传信息密码子进入核糖体,转移RNA携带氨基酸前来与之配对,把密码子片段表示的氨基酸装配成蛋白质。好比是串珠一般,信使RNA按照DNA的指示,决定了每颗珠子安放的位置,核糖体负责进行串珠操作,转移RNA负责把五颜六色的各色珠子搬运到作业场所,拼合而成的珠串就是新合成的蛋白质。

如果它有效,这种重新编码的策略可能对现有的生物技术非常有帮助。永远不会被污染的发酵罐和无法“偷渡”病毒的生产抗体的细胞系将会是一个巨大的福音。甚至可以构想密码子以如此激进的方法编码氨基酸,以至于合成生物学在某种程度上成为了一个独立的“创世”,它从原始的生物体中萌发,却又不再与其平行的生物圈接触;其间居住着既不传染也不感染的生物,只有符合设计的意向才能与创世的其余部分联系起来。

►Romesberg教授曾在TED演讲:Expanding the genetic alphabet。

澳门威斯尼斯人手机版 21

今年1月,佛罗里达州应用分子进化基金会的Stephen Benner和他的同事们在Science杂志上发表的一篇论文中可以看到这种奇幻景观的影子。他们创造了一套既包括现有的A、T、C、G,又含有补充的Z、P、S、B的双螺旋。 这种hachimojiDNA提供了比过去40亿年更加密集的可用数据存储量。例如,如果希望使用hachimoji来重新设计核糖体,tRNA等,就可以使用双联体而不是三联体作为密码子来重新编码基因组。

合成生命新篇章,创造从未有过的生命。值得一提的是,Romesberg于2016年由河南师范大学推选,入选有机化学学科的“长江学者奖励计划”讲座教授名单,并成为该校首位入选“长江学者奖励计划”的专家。

蛋白质合成过程,公有领域

有人想要试一试吗?现有代码的潜力巨大,理论上可以描述的蛋白质尚未探索完毕;似乎没有必要这般大费周章。更何况,工程师们乐于做大自然的“修补匠”。

然而,20种氨基酸对应的密码子却有61个, 终止信号还有3个,这样就会产生多种密码子对应同一种氨基酸的“冗余”情况。事实上,对应同一种氨基酸的不同密码子的效果并不是完全相同。在不同的物种中、不同的情况下,有一些密码子的使用会多于另一些密码子,这种现象叫做密码子偏好,而即便是同义密码子之间的替换也会改变蛋白质的表达情况。

澳门威斯尼斯人手机版 22

构成人体20种氨基酸的密码子表,图中U即代表DNA中的T,作者供图

大肠杆菌Syn61的重大意义在哪里?

正常情况下,生物体中编码蛋白质的密码子即便存在“密码子偏好”,也不会出现某种密码子完全不会出现的情况。那么问题就来了,是不是每一种密码子都不可或缺?如果某几种密码子完全不出现在基因组中,生命体还能维持基础功能吗?

Syn61的重大意义就在于此。此次研究中,科学家们将两个编码丝氨酸的密码子TCG和TCA分别用AGC和AGT进行替换(这四个组合都能编码丝氨酸,参见上图),将终止密码子TAG替换成TAA,最终编写了Syn61的基因组。Syn61即意为合成的、有61个密码子(59个氨基酸密码子 2个终止密码子,正常情况是61个氨基酸密码子和3个终止密码子)。

这株“人工致残”的大肠杆菌Syn61也确实与改编之前的祖先MDS42有些许不同:Syn61菌体的长度要略长于MDS42;在37℃下,Syn61比MDS42的复制速度要慢1.6倍。可见,即便是编码同一个氨基酸,不同的密码子对基因表达的影响也是不可估量的。要知道在这项研究中,科学家们在改编密码子的时候已经非常小心翼翼了。考虑到DNA中G和C两种碱基的含量会影响DNA的性质,科学家选用了尽可能不改变G、C含量的改写方法。

除了形态和生长速度方面的改变,删除特定密码子也给Syn61带来了特殊的性质。首先,一种针对TCG密码子的毒性物质对于Syn61来说毫无杀伤力。另外,对于普通大肠杆菌来说不可缺少的、TCA密码子必需的物质,对于Syn61来说也可有可无。

那么,腾出来的三个密码子又有什么用?简单来说,如果细菌不需要这三个密码子,我们就可以让这些密码子携带其他的信息,比如对应一种现有蛋白质中20种氨基酸之外的氨基酸,赋予大肠杆菌一些人类所需要的功能。当然,要做到这一步除了“密码”要换,相应的“解码器”也要换,这项技术离具体应用还非常遥远。

澳门威斯尼斯人手机版 23

密码子不够用,为什么不增加碱基呢!

4种碱基最多只能组合出64种密码子,除去细菌必需的密码子,我们能够利用的极其有限。另外一群美国科学家并没有将思维局限于此,他们的思路是,增加碱基数量,这样密码子想要多少就有多少,这就是我们文章第一部分提到过的8碱基DNA。

这项新鲜出炉的研究发表在今年2月份的《科学》杂志上。在通常的ATGC之外,他们模仿现有碱基的结构创造了SBPZ四个新碱基,合成了一段含有8个碱基的DNA。文章的第一作者是一位日籍科学家,这个自豪的日本人和他慷慨的美国老板将这种8碱基的核酸命名为“Hachimoji”,即为日语“八文字”的发音。8碱基DNA中S和B配对,P和Z配对,无论新碱基如何排列,三维结构都可以完全维持4碱基DNA的原状,保证了8碱基DNA的稳定存在和后续功能的执行。与之前或无法自然配对或无法维持DNA结构的人工合成碱基相比,8碱基DNA绝对称得上是一项里程碑式的发明。

当然这个团队并没有满足于此,考虑到DNA只有将信息传达出去才能实现其价值,他们通过改造现有的RNA聚合酶,找到了可以将8碱基DNA转录成RNA 的那一个。SBPZ 四个新碱基都有对应的RNA版本,因此新合成的8碱基DNA可以无障碍地转录成RNA,并有望继续执行功能。当然,8碱基DNA和RNA的合成距离其成为真正的遗传系统(至少需要能够指导蛋白质的合成)还有很长的路要走,但是这条路终点的生物体,就是从各种意义上来讲都当之无愧的人工合成生命。

澳门威斯尼斯人手机版 24

人工合成的碱基到底有什么应用价值?

正如前面所说,新的碱基可以帮助科学家利用新的氨基酸合成自然界中不存在的蛋白质,8种碱基就相当于有了512种密码子。除此之外,创造8碱基DNA的团队曾经发现,他们合成的含有碱基Z和P的DNA能够更好地和癌细胞结合。利用这项特性,人工合成DNA就可以在癌症的诊断、药物定向导入等等方面发挥巨大作用。

澳门威斯尼斯人手机版 25

如何用几句话把上面的所有技术都归纳出来?

举个可能有些不太准确的例子,遗传信息好比是我们手中的一份文稿,有几十页。本来它们都按着页码叠在一起,但是你要是把它们一页一页首尾相接粘起来,这就和中国的单染色体酵母类似了。如果你把文稿中的一些词汇全部替换为另外的说法,那就和这次的全基因组改写大肠杆菌类似了。如果你在文稿中加入了另外一套之前谁都没有见过的文字,这就是8碱基DNA的情形,并且,由于你加入了全新的文字,很多其它的文稿处理软件很可能没法正确识别你的文档,这就是所谓的8碱基DNA还需要与之相应的技术支持才能真正发挥效用。

澳门威斯尼斯人手机版 26

参考文献:

3.

{"type":2,"value":"

本文由澳门威斯尼斯人手机版发布于澳门威斯尼斯人手机版,转载请注明出处:合成生命新篇章,创造从未有过的生命

TAG标签:
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。