Genome Biology项目文章 | 安诺助力首个鱼类Y染色体完整图谱构建完成
2021.08.04

2021年7月12日,福建省淡水水产研究所薛凌展团队联合福建师范大学、华中农业大学和维也纳大学等单位,在Genome Biology在线发表题为Telomere-to-telomere assembly of a fish Y chromosome reveals the origin of a young sex chromosome pair的论文,从染色体层面解析了大刺鳅基因组,对性染色体的起源及重组抑制进行了相关研究,构建了鱼类Y染色体完整图谱,提出动物性染色体近着丝粒起源的假说。安诺优达在本研究中提供了三代测序、Hi-C辅助组装以及RNA-Seq等多组学测序技术和服务。

1628039408788322.jpg


文章名称:Telomere-to-telomere assembly of a fish Y chromosome reveals the origin of a young sex chromosome pair(鱼Y染色体的端粒对端粒组装揭示了年轻的性染色体对的起源

发表时间:2021年7月12日

发表杂志:Genome Biology(13.583)


样本选择

大刺鳅Mastacembelus armatus的肌肉组织、眼睛、大脑、皮肤和睾丸等不同组织样本

测序策略

DNA:

PacBio Sequel II平台基因组测序,构建20 kb文库

Illumina HiSeq X Ten测序,构建Hi-C文库

Illumina NovaSeq 6000测序,构建DNA小片段文库

RNA:

Illumina HiSeq X Ten测序,构建RNA文库


研究背景

性染色体起源需要在原性染色体之间建立重组抑制。在许多鱼类物种中,性染色体对是最近起源的同态染色体。要弄清重组抑制是如何在性染色体早期分化阶段发生的,就需要合适的研究物种及其高完整度的基因组。

大刺鳅隶属于合鳃目,具有性逆转的现象。其Y染色体具有更早期的起源,这为研究Y染色体退化的早期阶段提供了标本。然而Y染色体连接区域具有大量重复序列和异染色质化,很难通过二代测序的短读长进行组装拼接。通过三代测序CCS模式(环状重复测序)产生的HiFi reads准确率超过99.5%,读长达20 kb,且无需家系信息,可进行高准确度和完整度的基因组组装。研究团队选择大刺鳅作为研究样本,利用三代和Hi-C测序技术进行二倍体基因组组装,期望通过年轻的性染色体对的单倍型基因组组装解析性染色体分化的早期问题。


研究思路


1.2.jpg


研究结果


01

单倍型解析的染色体水平组装




研究团队提取了雄性大刺鳅的肌肉组织DNA进行PacBio三代测序,产生30 G的HiFi数据,结合Hi-C数据进行基因组辅助组装,获得了高质量染色体水平的基因组。k-mer分析表明,HiFi读取错误率仅为0.086%,基因组大小为600.1 Mb,contig N50为9.9 Mb。组装获得大刺鳅的基因组序列可独立产生两个染色体水平的单倍体基因组hap-X和hap-Y(图1)。通过7个鲈形总目(Percomorpha)物种和一个外群物种Acanthochaenus luetkenii(一种基生棘鳍目鱼类)的全基因组比对数据,确认了大刺鳅与亚洲沼泽鳗有密切的亲缘关系,并估计它们在大约3,600万年前彼此分化。

1628039460230052.jpg

图1 单倍型基因组组装


02

着丝粒卫星的基因组和细胞遗传学鉴定




大刺鳅高质量的基因组组装有助于解析染色体复杂区域。为了鉴定着丝粒卫星DNA,团队根据基因组注释获取了两个拷贝数较大的卫星序列,单体长度分别为524 bp(命名为CEN-524)和190 bp(命名为Tel-190)。CEN-524通常出现在每条染色体上的一个位点上。在端着丝粒染色体中,它出现在染色体的一端,在中部和亚中部着丝粒染色体中,它出现在中间。因此Cen-524被验证为候选着丝粒卫星。Tel-190只出现在染色体的末端,Tel-190被认为与端粒有关。为了进一步验证候选着丝粒卫星,利用荧光原位杂交对Cen-524和Tel-190探针进行杂交,发现它们在染色体上的位置与基因组组装序列位置基本一致(图2)。

1628039578670976.jpg

图2 着丝粒卫星的基因组和细胞遗传学鉴定


03

年轻的性染色体分析




研究团队使用雄性特异性标记来区分X和Y染色体,为了进一步划分完全性连锁区(sex-linked region,SLR),选用10个雄性和10个雌性个体进行重测序,并筛选与性别相关的变异分析发现了年轻的性染色体。Y染色体上~7Mb序列被发现与性别有关,与假常染色体区(pseudoautosomal region,PAR)或常染色体相比,显示出高密度的雄性特异性突变,雄性和雌性之间的分化增加。由此推测SLR跨越着丝粒,染色体的两端是PAR。这表明物理上靠近着丝粒的位置可能是SLR缺乏重组的原因。

根据雄性特异性变异的密度和内含子序列的X-Y差异,将SLR分为R1和R2两个区域。在这两个区域中,X-Y序列差异接近1%,表明两者起源很近。由于短臂异染色质位于着丝粒附近,推测短臂异染色质可能起源于着丝粒周围异染色质(pericentromeric heterochromatin,PCH)。通过转录组分析,检测雄性、雌性和间性个体(发生性逆转个体)性腺中SLR基因的表达谱,获得两个特异性表达的基因SYCE3和HMGN6。SYCE3可能参与成熟睾丸的精子发生或其他生物学过程,而HMGN6是指导睾丸发育的性别决定候选基因。

1628039595369952.jpg

图3 性连锁区域的鉴定


04

着丝粒周围存在异染色质结构域




为了确定着丝粒周围区域的边界,研究团队检测了染色体重复丰度。着丝粒周围区域(~4 Mb)具有较高的重复序列、较低的基因密度、较低的重组率和更频繁的H3k9me3修饰,与PCH一致。大多数PCH长约4.2 Mb,其大小仅与染色体大小呈弱相关且不显著。较小的染色体,特别是端着丝粒和近中着丝粒染色体,具有较大比例的PCH,包括XY染色体。在着丝粒周围区域,较大物理距离上的染色质相互作用更为频繁,与其较高的折叠和压缩程度特征一致。着丝粒周围区域比其他区域有更大比例的高表达水平和宽度的基因,与前人研究观点一致,即H3K9me3在基因抑制中的作用有限,可能存在其他表观遗传修饰调节PCH中的基因表达(图4)。


1628039613798379.jpg

图4 着丝粒周围异染色质对基因组区室化的影响


图片

文章小结

本文利用PacBio三代HiFi测序数据和Hi-C测序数据组装出了大刺鳅高质量的染色体水平的基因组,从染色体层面解析了大刺鳅基因组。结合转录组数据分析,获得SLR中两个特异性表达的基因SYCE3和HMGN6,其中HMGN6是指导睾丸发育的性别决定候选基因。本文对性染色体的起源及重组抑制进行了相关研究,构建了鱼类Y染色体完整图谱,提出了动物性染色体近着丝粒起源的假说,为性染色体起源的研究提供了新线索。


作为国内基因组行业知名企业,安诺基因拥有实力强大的测序服务平台,配备系列先进仪器设备,三代PacBio(1台Sequel IIe+7台Sequel II+10台Sequel)为您的科研之路保驾护航;专业的生物信息分析团队,丰富的项目分析经验,让您的数据分析之途无忧。安诺基因已与中国农业大学、中科院遗传与发育所、中国海洋大学、中国农业科学院、福建农林大学等多家科研院所开展了深度合作,助力基因组文章发表于Nature、Nature Plants、Nature Communications、Molecular Plant、Communications Biology、The Plant Journal等多个国际高水平期刊。


参考文献

Lingzhan Xue, Yu Gao, Meiying Wu, et al. Telomere-to-telomere assembly of a fish Y chromosome reveals the origin of a young sex chromosome pair[J]. Genome Biology. 2021, 22(1): 203.