北京哪里治疗白癜风安全 http://yyk.39.net/bj/zhuanke/89ac7.html研究背景
基因组结构变异(StructuralVariation,SV)包括缺失、插入、倒位、重复和易位等类型的基因组变异,与人类的疾病、进化、基因调控和相关表型等密切相关[1]。近年来,OxfordNanoporeTechnologies等平台开发的长读长测序技术为准确检测基因组SV提供了可能。随着识别分辨率的不断提升,相比于短读长测序,长读长测序可检测出多达两倍的SV[2,3]。然而受限于SV检测的准确度、灵敏度及测序成本等因素(目前,大多数SV检测工具仍然高度依赖高深度的测序数据),在相关领域大范围推广SV检测技术仍然面临着巨大的挑战。
来自哈尔滨工业大学的姜涛老师在近期发表的文章中[4]介绍了一款全新的SV检测工具——cuteSV,该工具使用了纳米孔测序高通量测序平台PromethION最新发布的长读长测序技术,解析了GenomeinaBottle(GIAB)HG人类参考基因组样本中的SV。cuteSV是一款快速的SV检测工具,在准确度和灵敏度等指标上均有优异的表现,同时在低测序深度数据上仍保持着良好的结构变异检测率(见图2)。这些结果表明,基因组SV研究领域正在进入一个高性能和低成本的时代。cuteSV概览cuteSV是一款基于长测序片段比对的基因组SV检测工具,它主要包括以下三个步骤(图1):
SV信号的识别:cuteSV设计和实现了多种SV信号识别方法,分别从比对内和比对间全面收集多种类型SV信号。同时,cuteSV采用了一套高效的启发式算法,将琐碎的插入与删除变异信号进行自动化整合以提升后续过程中SV识别的准确度。
SV信号的聚类:cuteSV设计了一种渐进复杂空间的聚类算法以及多重启发式的规则,在基因组局部区域内分别对SV信号进行聚类并对其进行优化,使零乱、繁杂的SV信号转换为高一致性的SV候选位点。
SV的检测与基因分型:cuteSV设计了一套特定的SV检测与基因分型规则,在上述聚类得到的SV候选位点中识别SV并完成基因分型。此外,cuteSV还可以输出基因型的似然估计、变异质量分数等多重统计量,以便于进一步的质量控制和构建更高准确度的检测集。图1:cuteSV技术路线图
姜涛老师采用了最新发布的ONTPromethIONHG基因组样本数据集(平均读长:bp,覆盖度:47x,下载