基因

首页 » 常识 » 常识 » WGS和WES对肿瘤样本基因突变特征的对
TUhjnbcbe - 2021/1/21 12:10:00
福州白癜风医院 http://pf.39.net/bjzkbdfyy/140108/4323414.html

近日,华盛顿大学麦克唐奈基因组研究所在杂志NatureCommunications(IF:12.12)发表最新研究成果,其主要基于癌症基因组图谱(TCGA)和国际癌症基因组联盟(ICGC)的数据库,对38个肿瘤类型,共个肿瘤基因进行突变分析。该研究通过对个肿瘤样本的全基因组(WGS)和全外显子组(WES)测序数据联合分析发现,肿瘤组织中~80%的基因突变来源于外显子区域。同时,分析结果显示WGS捕获了大约50%以上的外显子区域变异和未被报道的GC可变区突变,~30%的WGS独家突变可追溯至由WES的单一变异导致,文章提出了WES和WGS两种基因突变检测的差异。

01

研究背景

全外显子组(WES)和全基因组(WGS)测序技术所识别的突变的重复性仍然是一个重要问题,不仅对科学上大规模、已建立的数据集的使用,而且对未来研究项目的数据设计也是一个重要问题。癌症基因组图谱(TCGA)和国际癌症基因组联盟(ICGC)分别从癌症基因组的外显子组和全基因组水平测序数据中,公布了两个高质量、最精细和可重复的体细胞变异数据集,这两个数据集属于全基因组泛癌分析联盟(PCAWG)的一部分。简而言之,PCAWG联盟汇总了ICGC和TCGA项目产生的38种肿瘤类型的种癌症的全基因组测序数据。这些测序数据通过标准化的高精度流水线重新分析,以与人类基因组比对并识别种系变异和体细胞获得突变。Belkadi等人比较了WGS和WES之间的突变信息,发现约有3%的高质量编码变异仅在WGS中检测到,WGS在覆盖深度、基因型质量、阅读率等方面的分布更加均匀。此外,由于下一代测序中较高的读取错误率,低变异等位基因分数(VAFs)突变的可检测性受到背景噪声的限制。尽管这些研究对WGS数据更具有偏向性,但在WGS成本下降之前,WES仍是一个更好的选择。Schwarze等人呼吁进行更多的综合研究,比较WES和WGS的研究,特别是这个问题对临床有重要的影响。本研究则对WES和WGS数据中泛癌种进行突变分析,捕获的肿瘤突变集体的外显子区域,结果显示这两个数据集是基本一致的。作者评估了重现性如何影响更高层次的突变特征分析,探讨了WGS检测全外显子组测序捕获非编码突变的能力。

01

研究结果

1,数据分析流程及分析癌种统计本研究中,作者主要使用MC3和PCAWG存储库的公开数据,分别由约3.6M和约47M变体组成(图A)。个样本通过WES和WGS进行测序,包括同一肿瘤的不同位点和不同部位。通过公共数据集重叠的样本,作者分别筛选了~K(6.1%)和~23M(49.6%)突变的外显子组和全基因组数据。作者获得个TCGA条形码,发现MC3和PCAWG之间符合突变一致性,不同的条形码没有明显的影响。比较PCAWG结果和TCGA外显子组队列数据时,进行了富集分析,以确定哪些肿瘤亚型可能已被优先选择为不同的癌症类型,每一种癌症的最终肿瘤样本计数如下图所示。2,WGS和WES数据集基因突变重叠分析作者将接下来的分析局限于足够覆盖的编码区域,共得到个变异(,个匹配,21,个独特的MC3变异,24,个独特的PCAWG突变),其中MC3和PCAWG的一致性为76.7%,MC3和PCAWG的特异性分别为10.7%和12.3%。作者进一步研究变异重叠情况以揭示其与数据集、样本及癌症类型之间的相互关联,PCAWG以及MC3的交集共捕获91,个(45.3%)协调变异。在所有癌症类型中,皮肤黑色素瘤表现最好,MC3和PCAWG的变异匹配率最高。一般来说,当分别考虑所有MC3和所有PCAWG突变时,研究发现PCAWG变异配合率普遍较高,特别是肾脏厌色症(KICH)、脑低级别胶质瘤(LGG)、卵巢浆液性囊腺癌(OV)、直肠腺癌(READ)和甲状腺癌(THCA)。3,WGS和WES独家突变分析特性分析作者随后试图对MC3数据库中唯一识别的癌症驱动突变进行分类。个癌症突变中存在4个最常见的突变基因,分别为:KMT2C,PIK3CA,SPTA1和NCOR1。众所周知,外显子组捕获效率会受到非常高或非常低的GC含量的影响,因此作者同时检测GC含量是否与MC3和PCAWG中的检出率相关。首先,作者评估阅读深度的分布在GC含量MC3和PCAWG之间变化。研究发现,PCAWG在GC含量箱中具有相当均匀的读取深度,而MC3的读取深度集中在GC含量适中的区域。4,地覆盖的非编码UTR区域突变信息分析最后,与之前的研究类似,作者研究了非编码突变对显著突变基因时的潜在影响。作者只对超过35个样本的癌症类型进行SMG分析,最初确定了之前的泛癌全基因组分析中未见报道的潜在的候选驱动基因:FUT9、MMP16、SNHG14和SFTPB。通过对表达差异进行全基因组关联分析,文章证实了SFTPBUTR突变的影响,发现有SFTPB突变的样本中PCDHA7的RNA丰度较低,PCDHA7是一种已知参与细胞自我识别和非自我辨别的基因。

01

研究结论

在过去的十几年中,癌症基因组学为许多不同类型的肿瘤提供了全面的分子特征,本研究对MC3和PCAWG这两种联合外显子组和全基因组测序突变的份样本进行了比较评价,这一联合数据集表明约80%的预测体细胞突变被两种检测手段捕获。此外,90%的样本有超过80%的变异相关性时,涵盖的外显子突变从个别组群单独考虑。在利用WES或WGS时,体细胞突变检测具有明显的优势和劣势,全基因组和全外显子组测序的差异有70%左右受到低变异等位基因比例的影响。最后,在WES或WGS中发现了仅在外显子区域可见的额外突变。例如,WES唯一确定了个癌症基因突变。

参考文献

1.Bailey,MatthewH.etal.Retrospectiveevaluationofwholeexomeandgenomemutationcallsincancersamples.Nature

1
查看完整版本: WGS和WES对肿瘤样本基因突变特征的对