文献解读:TCGA做OS及DFS免疫预后模型

大家好!今天跟大家分享的是2020年5月发表在Genomics(IF = 6.205)上的文章。文章利用了从TCGA中搜集的子宫内膜癌(endometrial carcinoma,EC)表达谱数据进行了表达分析,联合Cox回归分析建立了针对总体生存率(OS)和无病生存期(DFS)的两个风险预测模型,并对预测模型进行了评估,在低风险组患者中发现较高的免疫状态、肿瘤突变负荷增加和免疫检查点基因表达升高,这些发现可能为EC中新的生物标志物和免疫治疗靶标提供新思路。

题目:Exploration of a novel prognostic risk signatures and immune checkpoint molecules in endometrial carcinoma microenvironment

探究子宫内膜癌微环境中新的预后风险特征和免疫检查点分子

摘要

本文致力于基于TCGA中EC表达谱测序数据研究EC中的免疫相关基因和肿瘤微环境(TME)。共进行了799个上调和139个下调免疫相关基因和差异表达的基因的功能注释和预后分析。通过联合Cox回归分析,本文建立了OS和DFS两个风险模型以及相应的列线图。在低风险组中,发现与免疫相关的生物学通路富集最明显。根据风险因素对TME进行进一步分析,发现低风险组免疫细胞浸润和活化较高、肿瘤纯度较低、突变负荷较高及预后较好。低风险组中免疫检查点PD-1、CTLA4、PD-L1和PD-L2的表达和免疫表观评分均显著增加。这些发现可能为EC中新的生物标志物和免疫治疗靶标提供新思路。

流程图

 

1.    数据的获取和整理

从TCGA数据库获取了587个EC样品(552个EC样品和35个正常样品)的基因表达谱。

 

2.    免疫状况与EC的预后相关

通过ESTIMATE算法评估EC患者结果发现,基质评分分布从-2224.62到860.43,免疫评分为1359.51至3614.677。ESTIMATE评分(由免疫评分和基质评分组成)范围为−3166.98至3990.15。通过分析这3个评分与587个样本的临床特征之间的关联,发现患者在较低等级中始终显示较高分数(图1A),而其他临床因素未显示出一致的统计学意义。之后分析了高分和低分组的生存率,发现免疫得分较高的患者与总体生存率(OS)显著正相关,而基质得分没有显著性差异(图1B)。这些结果表明EC的基质和免疫评分是患者预后的积极因素。

图1 免疫、基质和ESTIMATE评分与EC患者的分级和预后显著相关

3.    EC的免疫相关差异表达基因(DEG)的获取及功能注释

通过比较高评分和低评分组中不同的表达水平筛选出了与免疫相关的基因。高免疫评分组中有1093个上调基因和764个下调基因,高基质评分组中有1478个上调基因和243个下调基因。在高基质/免疫评分组中选择重叠的基因。如维恩图所示,鉴定出799个上调基因和139个下调基因为EC的免疫相关DEG(图2C)。

对这些基因进行功能注释,GO分析结果显示,BP组中排名前5位的富集条目是:细胞活化、白细胞粘附、淋巴细胞活化调节、调节T细胞活化和调节白细胞与细胞的粘附。在MF组中,显著富集的条目是细胞因子活性、细胞因子受体结合、细胞因子受体活性、趋化因子活性和趋化因子受体结合。质膜的外侧、MHC蛋白复合物、分泌性颗粒膜、三级粒子和三级粒子膜是CC组中排名前五位的富集条目(图2D)。同时,KEGG分析表明在以下生物学通路有富集:细胞因子-细胞因子受体相互作用、造血细胞谱系、细胞粘附分子(CAMs)、趋化因子信号传导生物学通路和抗宿主疾病(图2E)。这些功能注释均与免疫相关,并提示可能导致EC发生的生物学通路或功能失衡。

图2 基因表达谱与EC的免疫和基质评分的比较

4.    鉴定预后的免疫相关DEG并构建PPI网络

为了进一步筛选出对EC患者具有潜在预后价值的DEG,对所有预后DEG进行生存分析,方法是根据中值表达比较高表达和低表达组的OS。结果,在938个交叉点DEG中发现了225个与OS相关的基因,这些基因被认为是与预后相关的基因,需要进一步研究。

从STRING获得了基于225个DEG的PPI网络。225个与免疫相关的预后基因网络包含224个结点和2408个关系。PPI网络中排名前十的重要蛋白是IL2、CD2、LCP2、CTLA4、CCR5、CCR7、CD28、GZMB、PRF1和IL2RB,这些基因可能在EC的肿瘤发生中起关键作用。在MCODE中,总共生成了八个聚类,本文根据在MCODE中计算出的分数,选择了前3个模块作为中心集群。进一步研究了这3个模块的功能注释,并且这些聚类中富集的生物学通路均与趋化因子有关,与上述结果一致。

 

5.    基于免疫相关DEG的预后模型的构建

进一步对225个预后DEGs进行了生存和预后分析,整合了mRNA表达谱和临床信息,得到了520个OS相关和481个DFS相关的EC样品。进一步研究了TCGA中的上述预后EC样品,以确定可以作为预后生物标志物的DEG。对于OS和DFS,将这些样本随机1:1分成训练集和测试集。通过单变量Cox回归分析,LASSO Cox回归分析和多元Cox回归分析(图3A–D),逐步筛选出训练组EC患者的基因表达谱和相应的生存信息,分别从OS和DFS两个方面探索该基因集。最后,鉴定出13个基因是OS模型中关键的预后免疫相关基因(图3E),在DFS模型中,4个基因被鉴定为关键的预后免疫相关基因(图3F)。

图3 基于免疫相关DEG的预后模型的构建

6.    EC中预后模型的验证和应用

为了评估这2种风险模型的预后价值,本文同时使用了训练、测试和整体数据集进行了验证。基于OS模型,计算了训练集中EC患者的风险评分并对其进行了排名,根据中位风险评分值将训练组中的患者分为高风险或低风险组。根据训练集的风险评分,将整个和测试集中的EC患者分别分为高风险和低风险组。图4A–C显示了每例患者的风险评分,生存状态以及13种基因在OS模型中的分布。K-M生存分析的结果显示低风险组总生存时间明显高于高风险组(图4D)。除此之外,根据训练集绘制的ROC曲线如图5E所示。验证数据集和整体数据集的生存分析结果和ROC曲线的AUC与上述相似。

对于DFS,根据DFS模型的预测值与训练集中位风险的临界值将患者分为高风险组和低风险组。根据训练集的临界风险评分,将整个EC患者分为高危组和低危组。在附录中显示了每位患者的风险评分分布,生存状态以及DFS模型中四个基因的表达(图5A–C)。尽管AUC值保持在0.6至0.7之间,略低于OS模型,但DFS模型仍可以将患者分为具有不同结局的亚组。此外,对年龄、分期、阶段和组织学类型进行了亚组分析。OS和DFS模型中,本文发现高风险评分的患者倾向于在所有亚组中都具有较短的OS。

通过在训练,测试和整个集合中进行单变量和多变量联合分析,本文发现风险评分(在OS和DFS模型中均)可能是EC患者的独立风险因素。同时,通过绘制ROC曲线,本文发现在1年、3年和5年生存率中,风险评分比其他临床因素具有更好的预测能力(图6A)。将风险评分与其他临床因素结合后,ROC曲线的AUC升高(图6B),这表明该风险评分可能是患者的独立风险因素。结合风险评分,年龄,阶段,等级和组织学类型的列线图(图6C),在1年、3年和5年OS中,实际生存率和列线图预测的概率生存率一致(图6D–F)。DFS的结果与OS相似。与使用单个预后因素建立的列线图相比,所建立的列线图可能是预测EC患者OS和DFS的改良列线图,这可能有助于临床治疗。

图4 基于OS模型的风险评分分析,基于时间的ROC分析和K-M生存曲线分析

 

图5 基于DFS模型的风险评分分析,基于时间的ROC分析和K-M生存曲线分析

 

图6 根据OS模型预测EC中1年,3年或5年OS的列线图

7.    基因富集分析

通过GSEA分析了按风险评分分为高危和低危亚组的患者的转录组信息。在OS模型中,低危患者的典型KEGG生物学为同种异体排斥、自身免疫性甲状腺疾病、细胞因子-细胞因子受体相互作用、宿主疾病和 IgA产生的肠道免疫网络。此外,高危患者的典型KEGG生物学通路为基础转录因子、细胞周期、核苷酸切除修复、RNA降解和剪接体(图7A)。在DFS模型中,除了OS模型中提到的那些生物学通路外,高风险组还有DNA复制、同源重组和错配修复生物学通路。无论在OS模型还是DFS模型中,低风险组中富集的生物学通路都是免疫相关的。高风险组中富集的生物学通路与免疫无关,但在癌症中经常失调(图7B)。

    图7 OS和DFS模型的基因富集分析

 

8.    免疫细胞类型分数的评估

利用CIBERSORT,本文评估了低危和高危人群之间22种免疫细胞类型的免疫浸润差异。相对于癌旁组织,在癌组织中可以检测到更高比例的天然B细胞、静息CD4 +记忆T细胞、γ-δT细胞单核细胞和静息肥大细胞。而浆细胞、滤泡辅助性T细胞、调节性T细胞(Tregs)和M0巨噬细胞在癌症组织中的比例较低。在OS模型中,巨噬细胞M0、T细胞调节(Tregs)、T细胞CD8、静息肥大细胞和嗜中性粒细胞的浸润不同(图8),树突细胞静止、T细胞调节(Tregs)和树突状细胞被激活;在DFS模型中,T细胞CD8、巨噬细胞M0、浆细胞和NK细胞有差异变化。Treg和γT细胞浸润情况不同的患者可能具有不同的临床预后。

图8 OS免疫相关的预后风险评分与免疫细胞的关系

9.    免疫检查点调节因子在EC中的预后价值及其与肿瘤浸润免疫细胞的相关性

免疫检查点蛋白在免疫反应中起重要作用,并与免疫细胞发生多种相互作用。17个分子据报道是重要的免疫调节剂。本文分析了这些分子的预后,其中11个分子在EC中具有统计学意义。评估了17个免疫检查点调节剂和22个免疫细胞之间的相关性。如图9A所示,免疫调节剂与 CD8 + T细胞、活化记忆CD4 + T细胞和M1巨噬细胞呈正相关,与静止记忆CD4 + T细胞、 M0巨噬细胞和活化的树突状细胞呈负相关。并且本文发现,大多数免疫调节因子在高免疫评分组(图9B)或高基质评分组(图9C)中均显著增加。

图9 免疫调节因子与免疫细胞,免疫和基质评分的关系

10. 评估低风险和高风险人群之间的免疫状况

本文评估了肿瘤纯度与免疫相关风险特征之间的关系。进行ssGSEA来研究高风险和低风险组中29个免疫特征基因组的表达情况。低风险和高风险样品的免疫状态在OS(图10A)和DFS模型(图9B)中显示出一定程度的异质性。低风险组不仅显示出更多的免疫活性,而且肿瘤纯度明显降低。这可能是由于低危人群中较高的浸润免疫和基质状态所致。低风险和高风险组的肿瘤纯度通过小提琴图进行展示(图10C–D)。由于HLA相关基因在免疫调节中起着关键作用,本文进一步分析发现,与高风险组相比,低风险组中关键HLA基因的表达明显更高(图10E-F)。

图10 低风险和高风险组显示不同的肿瘤纯度

11. 免疫相关的风险特征和突变特征

基因突变是肿瘤发生和发展的重要原因。本文利用体细胞突变数据评估了低风险和高风险组患者的肿瘤突变负担(TMB)。在OS和DFS模型中,与高危患者相比,低危患者的TMB较高。但是,在两个模型中结果在统计上并不显著。此外,本文发现TMB与OS不相关(图11D),但与DFS相关(图11H)。

图11 免疫、基质和ESTIMATE评分与EC患者的分级和预后显著相关

结语

本文的研究筛选出EC中重要的免疫相关基因,并建立了预后风险特征。根据基于免疫相关基因的模型,探索了TME分子在EC中的潜在作用,包括免疫细胞,免疫检查点促进分析和免疫检查点抑制分子。研究证明高免疫力的TME可能阻止EC的发展,这表明使用免疫疗法对抗EC的可能性。

本文在创新思路上有待提升,研究肿瘤微环境与免疫的关系缺乏创新点,文章堆砌了大量工作量以提升文章质量;同时文章的分析思路过于松散,做的内容很多,但是相互间的联系过于松散,前一部分做预测模型,后面做免疫检查点,中间缺少有效的连接。除此之外,将同一组数据随机分组,训练集与测试集的相似性较高,这样验证出来的模型结果广泛适用性存疑。

文献解读

【课题套路】国自然中转录因子研究思路

2020-8-22 14:39:52

文献解读

单细胞测序研究新冠恢复期病人的免疫细胞图谱

2020-8-23 21:16:51

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索