新闻中心

安诺优达单体型基因组组装新品发布,为基因组学提供新的分析思路和方案
发布时间:2022-06-21

基因组组装技术的应用推动了基础生命科学和医学研究领域的发展。传统的基因组组装策略由于忽略同源染色体之间的差异,不可避免的会遇到嵌合体基因组,无法区分同源染色体的等位基因表达的差异,同源染色体修饰差异等。为了打破这种局限性,单体型基因组组装技术顺势而生,现已成为高精确基因组组装和准确位点筛选的突破性技术。


为了深入地探究单体型基因组组装技术在物种进化、分子育种和遗传病研究上的应用,解析等位基因遗传表达机制和遗传调控机理,安诺优达推出单体型基因组组装技术,现已将此技术应用在多倍体、高杂合的基因组组装和人常染色体遗传病分子靶标筛选等领域。为了促进学术交流,加强新技术的应用,2022年6月18日安诺优达线上举办了“单体型基因组组装技术新品发布会”。

 

在本次新品发布会上,首先由安诺优达CEO李志民先生和PacBio中国区总经理吴应光先生进行了开场致辞,对基因组技术的发展创新,新产品的广泛应用及未来两公司的深入交流合作表达了高度期许。


新品发布环节中,安诺优达李营博士为大家分享了新产品的相关内容,三种单体型基因组组装方案及实测数据。安诺优达根据二倍体、四倍体的倍性差异和有无亲本数据分别提出ADPA、AUPPA和ATPA方案。

 

ADPA(有亲本二倍体单体型组装方案)是基于双亲本二代数据获取特异k-mer,并利用k-mer对HiFi序列进行分型,之后使用Hi-C挂载到染色体水平。除contig N50之外,单体型块的平均长度block N50也是重要评估指标,block N50越长越好,contig N50/block N50越接近1,分型准确性越高。安诺优达的实测数据表明,ADPA的block N50高于其他方法约18%-172%,虽然method A的block N50与ADPA接近,但是contig N50/block N50最低。


在解决部分物种难以获得准确的亲本序列的问题上,安诺优达提出AUPPA(无亲本二倍体单体型组装方案):初步组装后,将序列回比获得SNP,利用SNP和Hi-C对组装后的contig进行分型,之后使用Hi-C挂载。安诺优达实测数据发现,AUPPA的block N50最高,超过其他三个方法11倍!AUPPA的contig N50/block N50和switch error也表现优质。


为了解决同源度高不易组装的问题,安诺优达开发了基于近缘二倍体物种的ATPA(同源四倍体单体型组装方案)分型方案:利用双亲本或研究物种的近缘二倍体物种的基因组,利用reads在基因组中的SNP信息对序列进行初步分型,结合深度信息再次对未分型数据再次分型后组装,然后使用Hi-C挂载,从而达到4套同源染色体的拆分。测试数据表明,高度同源四倍体的染色体间存在差异,等位基因形成模式仍然有待深入研究。


安诺优达实测数据表明,在获得高质量二倍体单体型基因组的方法上,ADPA最优,AUPPA次之。异源/同源四倍体都可以实现较好分型,但是近缘二倍体对同源四倍体分型(ATPA)是必需的。


新品发布环节结束后,进入了专家报告环节,由中国农业科学院作物科学研究所的周美亮研究员进行线上主持。


北京林业大学的钮世辉教授带来了题为《超大基因组装注释策略及面临的挑战》的报告分享。钮教授介绍了油松超大基因组组装注释过程中遇到的一些难题及解决方法,并表示油松基因组的组装象征着我们已经具备高质量组装任何超大基因组的能力。然而,针叶树基因结构注释比基因组组装有更大的挑战。其中主要原因是针叶树中具有大量超大内含子,平均长度是被子植物的20倍,也给基因结构注释带来了严峻挑战。最后,钮教授指出超大复杂基因组项目仍面临的一些挑战:多倍体物种复杂基因组的正确分型组装与基因注释等,不断发展的新测序技术和组装技术在解决这些关键问题上正发挥着越来越重要的作用。

 

中国科学院植物研究所的焦远年研究员带来了题为《被子植物基因组解析的进化研究》的报告分享。植物是陆地生态系统的主体,生物多样性是长期进化的产物。而被子植物类群物种丰富且多样性很高,被子植物的起源和快速分化是进化生物学家关注的热点问题,也是难点。焦远年研究员表示,多倍化是新性状起源、生物多样性形成以及作物驯化和改良的重要原因之一。焦远年研究员介绍了本人及团队主导并参与的陆地植物代表性物种的基因组测序和研究工作。焦远年研究员表示,基因组测序为植物进化、新性状起源、作物驯化和改良等提供了极其重要的数据基础;高质量基因组(单倍型、T2T、单细胞)将为更准确、更有趣的生命现象研究提供可能;越来越多的物种基因组解析可以让我们充分认识基因组进化特征和规律,进而理解物种进化的过程和未来发展;大数据时代下,进化研究也将真正深入到生命科学领域的各个研究方向。

 

广州医科大学附属第三医院的范勇研究员带来了题为《单细胞测序技术在生殖遗传领域的研究与应用》的报告分享。首先介绍辅助生殖技术面临的挑战,单细胞测序技术可以助力辅助生殖,在降低生殖缺陷,生殖和遗传相关疾病的筛查、诊断和治疗方面有非常重要的作用。接着介绍了单细胞测序技术在辅助生殖中的单基因病筛选、精子发生发育、胚胎单细胞转录组调控机制、胚胎单细胞表观修饰及着床发育等方向的成功研究应用案例。最后展望了单细胞测序技术未来在肿瘤、微生物、神经科学和免疫学中的应用前景。

 

华南农业大学的夏瑞教授带来了题为《岭南水果荔枝的起源和演化历史及开花调控》的报告分享。夏瑞教授结合多种测序技术和组装技术,获得了完整的 “妃子笑”荔枝基因组,大小为470 Mb,含有15条假染色体。后续利用改进的单倍型组装技术,获得了两套单独的单倍型基因组,并发现13,517对等位基因在不同组织中存在差异表达。极早熟荔枝种质倾向比对到一个单倍型基因组上,可能起源于云南野生荔枝群落;迟熟荔枝倾向比对到另一个单倍型上,起源于海南野生荔枝群落;而早熟荔枝则来源于极早熟荔枝和迟熟荔枝的杂交。对荔枝开花相关基因的分析发现,存在特异的基因扩增事件和COL基因3.7kb的序列缺失可能与荔枝花期调控有重要关系。关于荔枝基因组和驯化历史的结果将加速荔枝及其它相关无患子科植物的基础研究和遗传改良。

 

PacBio公司的资深生物信息科学家Wilson Cheng带来了题为《5-base HiFi Sequencing-Accuracy,Read Length & Methylation Calling》的报告分享。Wilson介绍了PacBio HiFi测序可通过检测酶动力学,在进行DNA测序时直接对碱基修饰进行检测。HiFi测序可检测DNA上的5mC甲基化修饰,无需特殊的文库制备流程,如重亚硫酸盐处理或特殊的分析流程。测试数据证明,HiFi测序的5mC检测与其它甲基化检测方法的结果高度一致,且通过HiFi 5mC 还能够获得单倍型的甲基化信息。此外,Wilson还向我们展示了HiFi数据在人类细胞系、人类罕见病、非人类脊椎动物和植物上检测5mC的优秀表现。


中国中医科学院中药研究所的徐江副研究员带来了题为《药用生物分型基因组研究》的报告分享。药用生物是天然药物的主要来源。由于物种众多,基因组特性差异较大,对其基因组的解析构成挑战。徐江研究员分别以灵芝和黄花蒿为代表,介绍了不同方法在解决不同特性基因组分型过程中的应用。首先以灵芝为例,介绍了使用多种关键技术(PacBio+Bionano+Hi-C)解决灵芝单体型基因组装以及基于单体型对灵芝酸合成途径的解析;其次以黄花蒿为例,介绍了基于组装的两个株系4套单体型在青蒿素生物合成途径等问题的应用;徐江研究员认为灵活采用多种技术有助于基因组分型,单体型基因组的研究能够大大促进药用生物的解析,为药用生物产业的科学发展提供支撑。

 

最后中国海洋大学的包立随副教授带来了题为《单体型基因组与复杂性状的解析》的报告分享。变异与性状是生命科学领域中永恒的议题,探索并理解其互作关系是发育、进化、疾病研究中的核心问题。包立随教授分别从以下三个方面介绍了单体型基因组学应用在变异介导的复杂性状研究领域展现出的巨大潜力。首先是斑点叉尾鮰的适应性性状解析,讲述了单体型基因组组装在雌雄序列分型上的独有优势,以及在性染色体与性别决定基因的定位与进化研究中的应用;其次是扇贝的性染色体进化,通过8种主要扇贝科物种染色体水平组装解析了扇贝的性别决定基因等问题;最后以癌症的复杂结构变异为例,介绍了通过偶联复杂变异的单体型定相技术,可加深对染色体重排与癌症发生机制的理解。包立随教授通过上述三个研究案例,向大家梳理了单体型基因组技术的发展如何助力后基因组时代复杂性状的研究。


本次会议安诺优达提出的单体型组装方案可以实现准确且便捷的分型。未来,单体型组装技术可以更好地解决等位基因表达差异、染色体重排、单体型特异性插入等问题,并为加速基因编辑发展提供有效方案。我们期待未来安诺优达能够在基因组测序和组装技术上不断开拓和创新,加速推动基因组组装技术在生命科学和医学研究领域上的更广泛应用。