0371-68273998

深度解读丨新一代纳米孔测序技术,将如何重塑植物基因组测序的未来?

作为人类所需的食物、药物、衣物和燃料,千百年来,植物在我们的日常生活中扮演着关键角色。如今,随着分子技术的发展,全世界越来越多的科学家们将关注的焦点放在研究植物遗传的多样性和育种培养上。

根据最新估计,目前科学界已知植物的物种大约有40万种,但迄今为止,科学界只测序了约600株植物品系(约225种种类)的基因组。既然植物研究在我们的生活中扮演着如此重要的角色,为何只有这么少的种类得到了测序?究其原因,与植物基因组大小多样和复杂程度不无关系。

   基因组大小多样化  

植物基因组的大小非常多样,从61Mb的螺旋狸藻 (Genlisea tuberosa)到152Gb的重楼百合(Paris japonica),后者几乎是人类基因组的50倍。此外,植物还表现出多种倍性(染色体拷贝),从二倍体——两个拷贝,如拟南芥(Arabidopsis thaliana),到十倍体——十个拷贝,如草莓(Fragaria iturupensis)。由于传统的短读长技术通常产生150~300bp的读长长度,这种大型基因组在本质上难以使用传统技术进行测序。

   重复区域和结构变异  

植物还可以表现出具有高比例重复DNA的超大基因组。一些物种(例如玉米)呈现出超过80%的重复DNA,这些DNA重复序列可以复制并插入新的染色体位置,因而在基因组进化中发挥重要作用。也正是如此,准确定位和表征这些转座因子可以为植物进化和适应提供新的信息,对遗传操作具有重要作用。

当前的短读长测序方法,由于读长长度无法跨越完整的DNA重复区域,由其产生的大多数现有基因组组装均显示对应重复区域和结构变异存在着许多不完整的间隙。

   植物本身的问题  

由于高水平的次级代谢物如多糖和多酚,想要从植物细胞中获得纯的、高质量的高分子量DNA相当困难。这些污染物的存在是导致低测序产率的最常见原因之一,并且会对下游分析产生很大影响。目前并没有一种通用的涵盖所有植物物种、组织、或在不同条件下都能使用的实验方案。科学家们往往需要多次测序样本来进行测试,不断优化和调整方案,这也导致了实验成本的提高。

   纳米孔测序技术  

为了解决这些问题,生成高质量、高度连续的植物基因组,为植物保护和育种提供新的机会,科学家们将目光转向了更新一代的测序方法——纳米孔测序。纳米孔测序由英国公司Oxford Nanopore Technologies研发,其提供的长读长能够跨越高度重复和含有结构变异的区域,提供更连续的基因组组装[1]。纳米孔能够测序处理呈现给它的DNA片段的整个长度,并且已经可以做到常规处理数千kb的完整片段,目前为止最长的单一读长超过了2 Mb[2]。这种超长读长无疑能够简化基因组的组装过程,提供更完整、更连续的基因组。因此,研究人员现在正在使用纳米孔技术对植物参考基因组进行从头测序和分析。

众所周知,郁金香是荷兰的代名词,每年的出口量为20亿株。因此,理解郁金香的基因组,提高育种和养殖对农业经济有着巨大的影响。然而,郁金香的基因组非常的庞大。它大小约为34 Gb,是人类基因组的10倍,并且包含大量的重复区域,对传统的短读长测序和组装可以说是巨大的挑战。为了应对这个挑战,荷兰Future Genomics Technologies的Jansen博士转向了纳米孔长读长技术,带领研究团队利用Oxford Nanopore Technologies研发的测序仪MinION和PromethION对郁金香基因组(Tulipa gesneriana)进行测序[3]。他们总共生成了203 Gb的数据,约为6倍的基因组覆盖率。在完成测序后,他们面临的又一挑战是将这些序列重新组装成基因组。传统的基因组组装工具需要将每一条读长与其它所有读长比对,在大型基因组的组装中,这不但增加了计算量,也大大延长了电脑CPU的耗时。研究小组为此研发了一种名为“Tulipa-julia”的组装工具,只利用纳米孔长读长数据上独特的、以及含有信息量的部分来进行比对。由于基因组庞大,目前比对工作仍在进行中。但Jansen博士表示,他们初步获得的结果已证明纳米孔长读长在大基因组测序中的价值。并且,高通量测序设备PromethION能够稳定地产生大量的数据,使他们能够更轻易地测序任何基因组。

在20世纪50年代,Barbara McClintock首次注意了到植物中DNA甲基化的作用,并将其描述为一种可以在活跃和非活动形式之间切换的新型移动元素。现在已知植物中的DNA甲基化发生在CG、CHG和CHH(其中H可以是A,C或T)的环境中[4]。这些甲基化碱基在基因表达中起关键作用,因此在农业研究和植物育种计划中具有越来越重要的意义。例如,在不同的压力因素中(如盐度,缺水和杀虫剂),甲基化显示出差异性反应。与传统的测序技术不同,基于纳米孔的测序允许同时和直接检测DNA甲基化和其他碱基类似物以及DNA序列,为所研究的基因组提供更为详细的表征[5,6]。

另外,使用传统的短读长序列,大多数真核基因组测序项目仅限于结合每个染色体拷贝的数据来产生单个单倍体的共有序列。纳米孔技术提供的长序列读长现在使单倍型分析更加可行——即使对于多倍体物种也是如此[7,8]。远程单倍型分析信息可以提供植物进化和驯化的新见解,并可能推动和改善未来作物的生产。

 从实地到实验室测序的 

不同选择方案

纳米孔长读长测序是Oxford Nanopore Technologies公司研发的新一代的测序技术。其当家明星产品MinION是世界上第一款掌上纳米孔DNA/RNA测序仪。它是一款便携式、实时、长读长和低成本的设备。启动套装包含测序试剂和两张测序芯片,价格不到人民币1万元。MinION由一个USB接口连接到笔记本电脑上启动,现在还可以使用新开发的MinION伴侣——MinIT,一个预配置过的小型电脑分析仪,省去对笔记本电脑的需求。

来自J. Craig Venter研究所的团队在单个MinION测序芯片上,在短短四天内以1000美元的成本为模型生物拟南芥(Arabidopsis thaliana)创建了高度连续的基因组组装。该组装显示出比现有的“金标准”参考基因组更高的连续性,且基本准确度相同。该项目的首席研究员托德·迈克尔教授对此表示,长读纳米孔组装揭示了我们在短读技术中看不到的微观变异[1]。

此外,Oxford Nanopore Technologies还推出了更高通量的台式设备GridION X5和PromethION,以及更袖珍的适合单次使用的Flongle,以适应对不同大小基因组以及更高覆盖率和样本量的要求。GridION数据产量是MinION的5倍,而高通量、高样本量的PromethION数据产量约为MinION的300倍,可以独立或同时使用48个测序芯片,48小时可产生数据15 Tb,可以为如种子银行或者转基因系之类大型或多个植物基因组项目提供经济高效的分析。

对需要调整不同的文库制备参数,并对多个样品进行测试的测序方案往往不可避免的增加实验成本。在启动大型基因组测序项目之前,可以使用能够适配于MinION和GridION设备的单次测序芯片Flongle(2018年可加入早期用户计划),进行经济有效的样品优化和质量检查。

 小   结   

2000年,拟南芥(Arabidopsis thaliana)成为第一个进行基因组测序和组装的植物。这项具有里程碑意义的成就耗时10年才完成,耗资更是高达1亿美元。现在,使用单个MinION测序芯片可以在几天内就完成测序,成本为1000美元。

与传统的短读长方法相比,长读长纳米孔测序具有许多优势,使研究人员能够组装和探索以前难以处理的植物基因组,为植物进化和育种策略提供新的重要见解。这些进展对于经济有效地应对世界上一些最紧迫的挑战至关重要,例如在面临气候变化带来的农业威胁,抗虫害和依赖有限数量的遗传同质作物物种的同时,可靠地为快速增长的人口提供食物。(文章来源:洋葱头  测序中国)