Long read genome assemblies complemented by single cell RNA-sequencing reveal genetic and cellular mechanisms underlying the adaptive evolution of yak
牦牛是生活在世界平均海拔最高地区的、体型最大的反刍动物之一,其生理上可以适应缺氧和寒冷的环境,在青藏高原(QTP)具有生态、经济和文化意义。家牦牛于数千年前被驯化,和野牦牛之间存在明显形态差异,但这两个物种都具有高海拔适应的遗传特征,被认为是研究大型哺乳动物缺氧耐受性的优秀模型。目前已有的研究多集中在牦牛基因组单核苷酸多态性(SNP)分析上,较少涉及对大片段结构变异(SV)分布情况的描述和潜在功能的解析。由于参考基因组不完整等因素制约,研究人员对牦牛适应性相关分子遗传机制的了解依然十分有限。而独特的基因特征和精准调控的基因表达是牦牛在高海拔地区生存的关键因素,牦牛肺部的进化在其高海拔低氧环境适应过程中起到了关键作用。
2022年9月6日,中科院西北高原生物研究所联合中科院昆明动物所等单位,在Nature Communications (IF=17.69)杂志发表了题为“Long read genome assemblies complemented by single cell RNA-sequencing reveal genetic and cellular mechanisms underlying the adaptive evolution of yak”的研究论文。该研究利用Nanopore测序和Hi-C数据成功组装高质量牦牛基因组,并利用BD Rhapsody单细胞平台解析了牦牛和普通黄牛肺部单细胞转录组。基因组学和转录组学联合分析揭示了一种新的内皮细胞亚型,并揭示了一系列与牦牛肺独特结构发育相关的基因和通路。
单细胞测序相关平台与应用
BD Rhapsody单细胞多组学分析系统
BD Rhapsody WTA全转录组分析:
#633801 BD Rhapsody全转录组扩增试剂盒
#664887 Rhapsody enhanced Cartridge配套试剂盒
#633733 Rhapsody Cartridge试剂盒
#633773 Rhapsody 反转录试剂盒
BD AbSeq 寡核苷酸偶联抗体
研究结果
1 检测牦牛和黄牛基因组中的结构变异(SVs)
作者使用长读长测序的方法对牦牛和普通黄牛基因组中的结构变异进行了检测。作者检测了3只黄牛,19只家牦牛和7只野生牦牛的基因组,总计检测到74,279个片段缺失,79,467个插入,3,464个重复和867个倒位。接下来作者对这些SVs进行了注释,并利用F-statistics(FST)对所有SVs位点进行统计分析,圈定了一些可能参与高海拔适应的SVs。
2 转录组和染色质可及性联合分析揭示SVs的潜在功能
许多SVs位于非编码区域,比如说启动子和UTR等。为了解析SVs和基因表达的关系,作者检测了家牦牛和黄牛之间不同器官组织的转录组差异表达基因,结果发现不同组织中差异表达基因和带有SV的基因具有相关性。通过组合相关基因组变异数据,作者在肺部发现了127个携带High-FST SVs的差异表达基因。
此外,作者还进行了基序富集分析,结果在携带High-FST SVs的启动子区域鉴定到了632个峰,富集分析之后鉴定到了446个motifs,并且富集到了5个已知对缺氧反应十分重要的转录因子。这些数据表明,缺氧相关的基因启动子区域的SVs在基因表达调控方面可能有非常重要的作用。
3 家牦牛和黄牛肺部组织的单细胞转录组分析
为了解析高海拔牦牛的肺部细胞异质性和基因表达图谱,作者利用BD Rhapsody单细胞平台分别对5只家牦牛和5只黄牛的肺部进行了单细胞测序分析。作者总计捕获测序了31,579个家牦牛细胞和27,951个黄牛肺部细胞。单细胞测序结果在家牦牛和黄牛肺组织中都鉴定出四种主要细胞类型,包括上皮细胞、内皮细胞、间充质细胞和免疫细胞,这四种细胞类型同样存在于小鼠肺中,说明肺组织的主要细胞类型在物种间具有保守性。此外,作者还揭示了所有细胞类型的一些新的标记物。进一步分析发现一种家牦牛特有的内皮细胞簇yak16与黄牛细胞亚群相关性较弱,可能是一类与高海拔适应相关功能基因的高表达相关的新细胞簇。
4 家牦牛和黄牛肺部基因表达模式和细胞成分的鉴定
除了肺部组织细胞组成的不同,相同细胞群差异表达基因也可能是牦牛高海拔适应的原因。作者发现牦牛和黄牛的肺部间充质细胞之间有1024的差异基因,富集分析之后发现这些差异基因主要与血管发育和形态发生相关。作者进一步用HE染色观测了肺部组织形态,结果发现牦牛微血管内侧厚度明显大于黄牛。Gomori染色结果显示,家牦牛的弹性纤维含量明显更高。
5 基因组变异和单细胞转录测序联合分析揭示家养牦牛高海拔适应性的遗传基础
作者接下来构建了基因组变异和新型细胞簇发育的因果关系。他们检测了每种细胞簇中含有高FST SVs的富集基因和差异基因表达。结果发现黄牛肺部组织中含有最高比例高FST SVs的是内皮细胞,最高比例的差异基因和携带高FST差异基因的细胞是黄牛的肺部免疫细胞。最后,作者也比较了家牦牛和黄牛肺部四种细胞的标记基因中携带SV的差异表达基因,发现在间充质细胞核上皮细胞中,牦牛比黄牛表达更多含有高FST的SV,而黄牛的内皮细胞比牦牛表达更多的DEGs。这些数据共同说明,SVs可能与肺部不同细胞亚群中差异基因表达相关,并很可能在牦牛高海拔适应中起到关键作用。
总结与展望
这项研究检测并注释了牦牛基因组中的SVs,提供了野牦牛和家牦牛高质量染色体水平的基因组图谱。利用BD Rhapsody单细胞平台解析了牦牛和普通牛肺部单细胞转录组,并展开了深入研究。通过基因组和转录组水平的联合分析,作者发现基因组中的SVs与转录组表达调控相关,其独特基因组和转录表达精准调控可能是牦牛高海拔适应的关键。最终,论文为理解动物高海拔适应和人类缺氧相关疾病的发生的遗传和分子机制提供了重要信息。在这项研究中,BD Rhapsody单细胞平台发挥了重要作用,快速准确地捕获了上万个肺部单细胞并进行测序,全面解析了野生牦牛,家养牦牛和牛肺部的单细胞图谱,为基因组中SVs与转录组表达调控建立了联系。