基因

注册

 

发新话题 回复该主题

6生信分析文章,带你了解基因构建预后模 [复制链接]

1#

云生信

预测无复发生存率和去势抵抗的分子特征对于前列腺癌的治疗决策是至关重要的,但是现有的预测模型不够稳健。今天小编就给大家分享一篇关于前列腺癌预测的最新研究,该研究包含了大量的数据集和分析方法,这篇文章是:NovelGeneSignaturesPredictiveofPatientRecurrence-FreeSurvivalandCastrationResistanceinProstateCancer(预测前列腺癌患者无复发生存率和去势抵抗的新基因特征)。这是一篇新文章发表于年的Cancers,IF是6.。

研究思路

本文应用稳健排序整合(RRA,RobustRankAggregation)方法对前列腺癌(PCa,prostatecancer)转录组进行分析,并鉴定了个在去势抵抗型前列腺癌(CRPC,castration-resistantPCa)和激素敏感型前列腺癌(HSPC,hormone-sensitivePCa)之间差异表达的基因。对个基因进行LASSO和逐步Cox回归分析,得到预测PCa中无复发生存率(RFS,recurrence-freesurvival)的6-genesignature,包括NPEPL1、VWF、LMO7、ALDH2、NUAK1和TPT1,被称为CRPC衍生预后模型(CRPCPS)。这6个基因中的3个(NPEPL1、LMO7和TPT1)构成了另一个能够区分CRPC和HSPC的signature。通过验证发现,CRPCPS预测了5/9队列中的RFS,并维持了按肿瘤分期、Gleason评分和淋巴结转移状态分层的患者的预后。它还预测了总生存率和无转移生存率。所有9个队列的C指数、校准图以及3个队列的ROC曲线证明了CRPCPS的稳健性。列线图分析证实了CRPCPS的临床适用性。因此,CRPCPS对于PCa中的RFS预测是有用的。

下面我们就来看一下文章的研究内容有哪些:

1.综合筛选稳健的CRPC相关基因

四个GEO数据集(GSE、GSE、GSE和GSE)用于鉴定稳健的CRPC相关基因,在CRPC和HSPC之间分别鉴定了、、和个DEGs(figure2a)。通过RRA方法整合获得个DEGs。CRPC中前20个上调和前20个下调的基因显示为层次聚类热图(figure2b)。对于CRPC和HSPC之间的前个DEGs在四个数据集中的表达模式显示在循环图中。这个DEGs的位置涉及除Y染色体以外的所有染色体(figure2c)。GO富集和KEGG通路分析进一步阐明了其潜在的生物学功能和涉及整个个DEGs的有可能的信号通路(figure2d)。

2.建立用于预测RFS的CRPC衍生的6-genesignatur(CRPCPS)

本文所用的队列的临床病理信息如table1所示。

Cox回归分析得到基于6个基因:NPEPL1、VWF、LMO7、ALDH2、NUAK1和TPT1的6-genesignature(CRPCPS)(table2,figure3ab)。Kaplan-Meier分析表明,ALDH2、LMO7或TPT1表达水平较高的患者具有更好的RFS(figure3c)。NPEPL1、NUAK1或VWF表达水平较高的患者具有更高的复发风险(figure3d)。

在TCGA训练队列中,将患者分为高风险组或低风险组(figure4a)。复发患者的数量随着CRPCPS评分的增加而增加(figure4b)。NPEPL1、VWF和NUAK1的表达水平上调,LMO7、ALDH2和TPT1的表达水平下调(figure4c)。Kaplan-Meier分析表明,低风险组患者的RFS延长(figure4d)。训练队列的校准图显示预测结果和实际观察结果之间的3年、5年和8年RFS概率非常一致(figure4e)。采用CRPCPS评分、Gleason评分和肿瘤病理分期的ROC曲线评价TCGA训练队列中3、5和8年RFS的可预测性。3年、5年和8年AUC分别为0.、0.和0.,显著大于Gleason评分和病理肿瘤分期(figure4f)。

3.基于CRPCPS基因的CRPC诊断模型的建立

为了探讨这6个基因在预测CRPC发生中的潜在应用,应用ROC曲线下面积(AUC)来评价这6个基因的诊断效果。在训练队列(trainingcohort)中,六分之五的基因(NPEPL1、LMO7、VWF、NUAK1和TPT1)能够有效区分AUC值大于0.7的CRPC和HSPC样本,其中四个在验证队列(validationcohort)中表现出良好的区分性能(figure5a)。在通过综合少数超抽样技术(SMOTE,syntheticminorityover-samplingtechnique)克服数据不平衡问题后,拟合logistic回归模型以建立训练队列中的CRPC诊断得分,并且正向逐步选择进一步优化模型到3-genepanel(NPEPL1、LMO7和TPT1)。ROC曲线和校正图显示,该3-geneCRPC诊断模型在临床上对CRPC与HSPC的鉴别具有较高的准确性(figure5bc)。

4.CRPCPS在独立患者队列中的内部和外部验证

CRPCPS的预后价值在不同验证队列中的表现。Kaplan-Meier图用于显示高危和低危患者的RFS概率(左图),校准曲线用于评估不同队列中的3年、5年和8年RFS概率(右图)。CRPCPS的预后价值首先在内部验证队列和整个TCGA队列中得到验证,CRPCPS评分的增加与NPEPL1、NUAK1和VWF的上调相关,与ALDH2、LMO7和TPT1的下调相关(图S3a-c和figure6ab)。其次,本文还在6个完全独立的数据集中验证了CRPCP(theMSKCCcohort,Stockholmcohort(GSE70),Cambridgecohort,Belfastcohort,GSEcohort,CPC-GENEcohort)。同样,在6个队列中的5个队列中,CRPCPS评分定义的低风险组患者的RFS显著长于高风险组患者。六个外部验证队列的校准图也表明估计值和观察值之间有很好的一致性(figure6c-h)。

总生存率(OS)数据和无转移生存率(MFS)数据用于三个数据集(MSKCC、Belfast和GSE)去评估CRPCPS是否能预测OS和/或MFS。如figure7所示,在MSKCC队列(figure7a)和GSE队列(figure7b)中,高危患者的OS比低危患者的短。只有Belfast队列有可用的MFS数据,CRPCP对MFS也有很好的预测能力(figure7c)。

5.CRPCPS是PCa中RFS的预后指标

对TCGA训练队列、内部验证队列和整个TCGA队列中CRPCPS评分、患者诊断年龄、Gleason评分、肿瘤分期和淋巴结状态的单变量和多变量Cox回归分析。单变量分析结果显示,CRPCPS与训练队列(figure8a,上图)、内部验证队列(figure8b,上图)和整个TCGA队列(figure8c,上图)中的RFS显著相关。多元Cox回归分析进一步证明,在调整了不同临床病理特征(包括年龄、glason评分、肿瘤分期和淋巴结状态)后,CRPCPS仍然是独立的预后因素(figure8a,下图)。在所有9个队列中,当排除样本量小于20的变量进行分析时,其中5个队列的CRPCP显著,包括训练队列、整个TCGA队列、MSKCC队列、Stockholm队列(GSE70)和GSE队列(figure8ac和table3)。

6在具有特定临床病理参数的PCa患者中,CRPCPS仍然具有预后

在CRPCP的发现和验证分析中的9个队列中有6个队列(包括TCGA培训、内部验证队列、整个TCGA队列和三个验证队列(MSKCC,Cambridge,和Belfast队列))具有更多的患者。因此,他们被用来评估CRPCPS与各种临床病理特征之间的关系。特征包括肿瘤分期,淋巴结状况、Gleason评分和诊断年龄。较高的CRPCPS评分与多种不良临床病理特征呈正相关,包括较高的肿瘤分期(figrue9a)、较高的Gleason评分(figrue9b左图)和淋巴结转移(figrue9c)。

此外,根据不同队列中的肿瘤分期、淋巴结状态和Gleason评分对CRPCPS的预后价值进行了评估。对于此类评估,只使用分层后有50名或以上患者的亚组。有趣的是,5个队列中有3个队列的T1/T2亚组中,较高的CRPCPS评分与较差的RFS显著相关(figure10a)。在整个TCGA的训练队列(figure10b左图)中,在T3/T4肿瘤患者中也可以检测到较高的CRPCPS评分和较差的RFS之间的关联队列、MSKCC队列(figure10b右图)、Cambridge队列(GSE)和Belfast队列(GSE)。内部验证队列是唯一没有显示显著预后的队列。

进一步的分层分析显示,CRPCPS评分可以区分6个队列中5个队列(figure10abc和图S7a、b、d)中Gleason评分为≤7的患者的不同预后,尽管在Cambridge队列中发现了临界预后意义(GSE,图S7c)。在多个队列中,Gleason评分≥8分或以上的患者中也观察到了这种关联(figure10d和图S7e,g)。尽管如此,在五个可用队列中的四个队列中,没有淋巴结转移(N0)的患者在按CRPCPS评分分层的高风险组和低风险组之间显示出不同的RFS(figure10e和图S8a,b)。同时,这在Cambridge组中并不明显(GSE,图S8c)。在整个TCGA队列中,淋巴结转移(N1)的患者人数太少,无法进行分析(图S8d)。

7.CRPCPS的6-genesignature与其他预后模型比较

为了进一步评估6-genesignature的预测性能,将CRPCPS与整个TCGA队列(n=)和MSKCC队列(n=)中的三个已发表的其他预后模型进行比较(图S9)。对比本研究中的CRPCPS预后效果较好。

8基于CRPCPS评分和临床病理特征的列线图

为了建立预测RFS的定量方法,本文将CRPCPS评分与其他临床病理特征(即诊断年龄、Gleason评分、病理肿瘤分期和淋巴结状态)结合起来,在TCGA训练队列中构建列线图估计前列腺癌患者3年、5年和8年的RFS率(figure11a)。绘制ROC曲线和校正曲线,评价列线图的可靠性。在训练队列,内部验证队列,和在整个TCGA队列中,预测3年、5年和8年RFS的AUC(figure11bcd)。此外,校准图中的直线段接近45°线,表明训练队列(figure11e)、内部验证队列(figure11f)和整个TCGA队列(figure11g)中的预测和观察非常一致。

9.CRPCPS基因的功能富集分析

最后,为了探索与CRPCPS相关的潜在的分子事件,将训练队列中的患者根据CRPCPS评分分为高风险组和低风险组,利用基因集变异分析(GSVA)技术,进行GO富集和KEGG途径分析,探索与CRPCPS相关的生物过程和途径(图S10)。

总结

好了,到这里文章的结果就基本结束了,弱弱的问一句,有没有童靴跟小编一样,有点被这么多的研究内容给绕晕了呢?

总而言之,本研究是为了鉴定去势抵抗型前列腺癌(CRPC)相关基因,建立可靠的无复发生存率(RFS)和CRPC模型。在个在CRPC和HSPC样本中差异表达的基因中,有6个基因构成了预测RFS的CRPC衍生的预后模型(CRPCPS)。此外,从6个CRPCPS基因衍生出的3个基因组能够区分CRPC和HSPC。分析表明这两个signature可能是预测RFS和CRPC的有力工具。

本研究包含了大量的数据集,构建包含预后和诊断双重功能的模型,多种分析方法应有尽有。没有看明白的童靴可以根据研究流程图,结合文章的附表,多看几遍,然后从中选择自己需要的研究内容借鉴学习。加油!

文献出处:AJ,ZhangB,ZhangZ,HuH,DongJT.NovelGeneSignaturesPredictiveofPatientRecurrence-FreeSurvivalandCastrationResistanceinProstateCancer.Cancers(Basel).Feb22;13(4):.doi:10./cancers13040.

END

往期推荐

Meta分析的核心技术与应用

肠道菌群机制研究及国自然课题设计

m6A(RNA甲基化修饰)课题思路介绍及热点方向分析

预览时标签不可点收录于话题#个上一篇下一篇
分享 转发
TOP
发新话题 回复该主题