人基因组重测序是基于二代测序技术的人基因组测序主要集中于用来分析单核苷酸变异(SNV))以及小片段插入缺失突变(InDel),在一些重复序列区域的变异检测以及大片段的结构变异(SV)检测中面临着挑战,而PacBio三代长读长测序可以覆盖长的结构变异序列,低深度的三代测序能有效鉴定人基因组中大部分结构变异。利用高准确度的HiFi reads进行分析能同时获得SNV、InDel和SV的突变情况。
HiFi测序揭示综合征性智力障碍的致病性结构变异(12-kb 拷贝中性倒位)
Pathogenic 12-kb copy-neutral inversion in syndromic intellectual disability identified by high-fidelity long-read sequencing
智力障碍(Intellectual Disability,ID)是一种常见的发育障碍,其临床特征表现为认知水平低下和适应性能力缺陷。遗传和基因组变异是引起ID的主要原因,如细胞遗传学异常(插入、缺失、倒位和易位)、CNV(删除和重复)和SNP等。一对12岁的单卵双胞胎女孩(II-2和II-3)自5个月时起出现发育迟缓,眼睑严重下垂和癫痫发作,临床症状符合智力发育障碍(图1)。该病例曾进行全外显子测序分析,但未发现致病变异。
图1 患ID双胞胎的临床特征
样本选择:Trio家系(双胞胎女孩之一及其父母,II-2,I-1和I-2)
测序策略:三代 PacBio Sequel II 测序,构建15kb HiFi文库
1. 变异检测及关联位点筛选
先证者 (II-2) 及其父母 (I-1和I-2)测序深度分别为 20.4X,10.8X 和 10.1X,使用pbsv软件对Trio家系进行SV分析。在II-2中共检测到10,616个缺失、15,363个插入、63个倒位和1,476个重复。基于基因对功能的影响程度进行SV筛选,共发现11个缺失、2个插入、2个倒位和1个重复与RefSeq注释的外显子区域有重叠。其中,研究者在3号染色体上发现一个12 kb的倒位变异,IGV分析显示该倒位涉及BRPF1基因的前两个外显子和CPNE9基因的后四个外显子,这两个基因都被倒位变异破坏,可能导致基因功能丧失。而BRPF1基因异常会导致IDDDFP(OMIM#617333),其特征是智力残疾、面部特征畸形、颈椎融合和癫痫发作。
2. 验证分析
Southern印迹分析显示仅在受影响的双胞胎(II-2和II-3)中检测到与倒位等位基因相对应的5.1 kb KpnI片段,而在其哥哥(II-1)和父母(I-1和I-2)中未检测到。根据pbsv软件的位置信息,研究者利用PCR确定倒位片段(chr3:9,767,386–9,779,615)在连接处没有核苷酸缺失/插入,且双胞胎女孩的倒位断点相同(图2b,c)。Sanger测序鉴定的两个断点连接点和pbsv检测相同,证明了HiFi长读长分析的准确性。
图2 12Kb的倒位变异及其验证结果
3. 单倍体分型追溯倒位变异的来源
研究者通过WhatsHap等软件对目标变异区域进行单体型定相。先证者(II-2)的HiFi数据被分成22,363个单倍型块,平均块大小为84kb。12kb的倒位位于II-2中的321kb的单倍型块内。比较来自Trio家系(II-2,I-1和I-2)的分型结果,揭示了倒位染色体的来源。含染色体位置9,757,086 _ 9,757,754 _ 9,757,993 _ 9,775,730 _ 9,782,977的5个SNP的单倍型G_A_C_A_A证实了12kb倒位遗传自母亲。
图3 单倍型分析揭示倒位的来源
本研究选用三代PacBio HiFi测序对患ID Trio家系进行SV检测分析,挖掘到到一个影响该疾病的12 kb倒位变异。此外,基于Trio家系的单倍型定相分析发现该倒位变异遗传自母亲。研究表明,PacBio测序技术可以发现之前短读长测序遗漏的致病变异。
[1] Mizuguchi T, Okamoto N, Yanagihara K, et al. Pathogenic 12-kb copy-neutral inversion in syndromic intellectual disability identified by high-fidelity long-read sequencing[J]. Genomics. 2021, 113(1):1044-1053.
Q | 三代人基因组重测序检测结构变异需要多少数据量? |
A | 根据已发表的文章数据表明10 X左右的低深度三代测序数据就能有效的鉴定出人基因组中的大部分结构变异,因此我们CLR人重 SV检测产品推荐的测序深度是10 X~20 X左右,如果深入挖掘变异信息,30 X数据量最好。对于HiFi全变异检测产品,推荐HiFi reads深度15 X左右,一般HiFi reads数据量尽量不低于40Gb。 |
Q | 三代人基因组重测序主要能够检测到哪些类型的结构变异? |
A | 染色体缺失、插入、重复、倒位、易位等结构变异均可以通过三代测序检测到。 |
Q | CLR模式和HiFi模式进行人重分析有何不同? |
A | CLR模式测序主要优势是读长较长,能够有效的检测大片段SV,但由于序列精确度不高,低深度的CLR测序在检测SNP和InDel等小变异上准确度相对较低。而HiFi reads利用三代CCS测序模式通过循环测序增加了序列的准确度的同时也保持了较长的读长(10-15kb),因此对于鉴定SNP、InDel和SV均适用。研究者可以根据自己的研究对象和目的选择不同的测序策略。 |