基因

首页 » 常识 » 预防 » 原创解读PJ追踪多倍体短柄草中已知和未知
TUhjnbcbe - 2025/5/10 17:10:00
北京治疗白癜风便宜的医院 http://www.xftobacco.com/index.html

当多倍体植物的祖先物种灭绝或未知时,或者当它们的祖先基因组序列不可用时,解开多倍体植物的进化之谜是一项挑战。现有的亚基因组鉴定方法如果不考虑可能存在的未知祖细胞,就无法充分推断异源多倍体中存在的同源基因组。

年12月24日,ThePlantJournal在线发表了题为“TrackingtheAncestryofKnownand‘Ghost’HomeologousSubgenomesinModelGrassBrachypodiumPolyploids”的研究论文,使用基于转录组的系统发育和新开发的亚基因组检测算法,结合比较染色体barcoding分析,揭示了异源多倍体模式植物短柄草的进化之谜。

引言

目前,通过构建多物种联合进化树和网络,连同使用同线性reads映射系统发育方法,成功地重建了一些异源多倍体植物中同源基因组的进化历史。然而,这些成功案例中的异源多倍体,大多具有已知的二倍体祖先。很少有研究去确定源自未知二倍体祖先的亚基因组(ghost亚基因组)。基于联合的分析方法解释了基因进化树中的不完全谱系分选(ILS)事件,并为异源多倍体中的亚基因组创建了一致性融合场景。然而,由于这些基于似然或贝叶斯算法的方法受计算量的限制,使其处于劣势。此外,如何选择最佳杂交方案在二倍体祖先未知的情况下同样是一道难题,并且难度随着倍性增加而增加。短柄草是研究异源多倍体的模式植物,大多数异源多倍体短柄草种可能是由非整倍体祖先种杂交产生不同的基本染色体数而来。本文,作者开发了一种新方法——PhyloSD,来揭示异源六倍体短柄草中的同源二倍体亚基因组,并重建其进化过程,尤其是那些二倍体祖先已灭绝或未知的种属。

PhyloSD分析流程

PhyloSD流程融合了三种算法:NearestDiploidSpeciesNode,BootstrappingRefinement,和SubgenomeAssignment(图1a-c)。NearestDiploidSpeciesNode算法根据同源序列相对于最优二倍体骨架树及其茎分支中最近的二倍体物种的嫁接位置来标记同源序列;BootstrappingRefinement算法用于测试标记的同源物;SubgenomeAssignment算法基于i)嫁接分布频率等级和ii)主坐标分析(PCoA)中的同源物簇与叠加的最小生成树(MST),将同源物分配给相应的多倍体亚基因组。

图1.PhylogeneticSubgenomeDetection(PhyloSD)流程.

在小麦中测试

异源六倍体小麦的祖先二倍体基因组是已知的,PhyloSD构建的二倍体小麦和山羊草属类群的系统发育树与预期一致,同源基因“C”对应于T.turgidum和T.aestivum中存在的亚基因组C,“F”对应于T.aestivum中存在的亚基因组F,而“I”对应于T.turgidum和T.aestivum存在的亚基因组I(图2a-c)。根据Marcussen等人的报道,PhyloSD获得的C、F和I亚基因组分别为我们所熟知的B、D和A亚基因组。此外,PhyloSD还证实了C、F和I与其各自的Ae.speltoides-like,Ae.tauschii-like和T.urartu-like二倍体祖先基因组的姐妹关系。这些结果说明PhyloSD可以准确的预测异源多倍体植物的亚基因组。

图2.PhylogeneticSubgenomeDetection(PhyloSD)预测小麦亚基因组的结果.

已知和未知祖先亚基因组的多倍体短柄草同源亚基因组预测

基于PhyloSD,作者预测了已知和未知祖先亚基因组的多倍体短柄草同源亚基因组(图3a-c)。与小麦相比,短柄草有大量同源类型,需要排序、选择最常见的类型并合并其中一些类型以检索一些多倍体的合理亚基因组。异源四倍体B.hybridum是个例外,它的情形比较简单,其中“b”和“d”分别对应于它的亚基因组B(B.stacei型)和D(B.distachyon型)。对于其余多倍体短柄草,“a”和“c”同源类型(在某些物种中加上“b”)被认为是祖先A亚基因组的变体,单独的“e”同源类型被分配到中间进化的E亚基因组,f、g、h和i同源类型被假定为G亚基因组的变体。同时,作者在异源四倍体杂交芽孢杆菌及其现存的二倍体祖先物种之一(B.stacei)中,进一步评估了转录本与直系同源(真正同源)等位基因的正确识别和对应关系,使用了将转录本组装到参考转录组和带注释的参考基因组的策略。结果显示,组装基因与其各自参考基因的第一次匹配显示出非常高的一致性(99%)(B.stacei;B.hybridumD和S亚基因组),支持了所选择的B.stacei和B.hybridum转录本与其各自的直系同源编码基因的对应关系,摒弃了旁系学对PhyloSD算法性能和正确分配的潜在影响。

图3.短柄草进化树构建示意图

核亚基因组最大似然进化树(图3c)产生了与贝叶斯BEAST树相同的短柄草基因拓扑结构(图4a)。同时,质体和核进化树的相互比较,可以推断所研究的多倍体种质的假定母体基因组供体。

图4.基于核基因核质体转录本构建的核和质体发育进化树

对B.arbuscula(2n=18),B.boissieri(2n=48)和B.retusum(2n=32)物种进行核型分析,结果显示二倍体B.arbuscula的核型模式与核心多年生进化枝二倍体B.sylvaticum和B.pinnatum的基因组相同;B.boissieri(2n=48)为六倍体;而B.retusum有两组不同的染色体,每组由八对染色体组成,表明其细胞型的异源四倍体特性(图5)。这些结果进一步验证了PhyloSD的准确性。

图5.基于组合系统发育和比较染色体barcoding分析的短柄草异源多倍体起源的综合进化框架

总结

作者开发了可在未知祖先亚基因组的条件下预测多倍体同源亚基因组的新方法,即PhyloSD,并且多方面证明了PhyloSD方法与染色体barcoding比较方法在检测多倍体亚基因组方面的价值。通过在小麦中进行测试,证明作者开发的方法可以从现存的祖细胞中识别出二倍体同源亚基因组。更重要的是,作者还在短柄草中确定了三个已知的和四个新的“ghost”亚基因组,从而揭示了短柄草复杂而多变的进化历史(图6)。需要强调的是,这一方法在具有复杂杂交和多倍化历史的多倍体植物的研究中可能具有重要价值。

图6.基于核同源和亚基因组进化树(图3b-c)、dated核进化树(图4a)、质体进化树(图4b)以及细胞遗传和核型进化数据。

小编心得体会:

这是一篇方法类文章,百看不如一用,该分析流程已经上传到github,大家可以下载玩一玩。

1
查看完整版本: 原创解读PJ追踪多倍体短柄草中已知和未知