文献解读:如何构建免疫相关预后分数?

大家好, 今天和大家分享的是 2020 年 2 月发表在 Aging(IF:4.831)上的一篇文章,“Identification of an immune-related risk signature for predicting prognosis in clear cell renal cell carcinoma ”。作者使用多种数据库对5个ccRCC的IRG特征进行开发和验证,评估IRG与临床病理特征的相关性,并整合了IRG 特征与临床特征,建立列线图,以改善ccRCC患者的预后评估。

Identification of an immune-related risk signature for predicting prognosis in clear cell renal cell carcinoma
免疫相关风险特征的鉴定用于透明肾细胞癌的预后预测

一、研究背景

        透明肾细胞癌(ccRCC)是肾细胞癌(RCC)中最常见的类型, 无控制的肿瘤进展和死亡大约在30%的患者中发生。免疫检查点靶点的出现,为转移性RCC患者提供了另一种治疗策略,强调了肿瘤免疫状态对患者预后的重要性。肿瘤免疫微环境的多种成分对癌症的发生和预后有重要作用,免疫细胞组分与RCC患者的生存有关,T细胞浸润与ccRCC的复发有关。然而,ccRCC的活性免疫标志物的预后价值仍需要全面探索。

        如今,评估RCC患者预后的经典分类系统主要基于患者的临床病理特征。有许多研究提出了使用基因表达特征分析来评估RCC患者的预后,但只有少数研究全面探究了RCC中免疫相关的表型,以及它与预后的关系。因此,需要一个更为精确的基于免疫相关基因(IRG)分析的分类系统,以提高预后准确性,指导临床实践。

 

二、分析流程

三、结果解读

1、ccRCC中差异表达的IRGs的鉴定

 

图1B&C DEGs的鉴定

        作者分析了GEOTCGA数据库中的样本,提取GEO和TCGA数据库之间的重叠DEGs:756个上调基因和746个下调基因(图1b)。接着,将这些DEGS与IRG集(由ImmPort和InnateDB数据库组合的列表组成)相交,得到326个差异表达的IRGs(图1c)。随后,作者对IRGs进行了PCA,这些IRGs体现不同的分布模式,表明在GEO和TCGA样本中,正常组织与肿瘤组织间存在免疫表型的差异。

 

2、核心IRGs的鉴定

图2 核心IRGs的功能富集分析

        作者将识别出的IRGs导入STRING数据库,建立了PPI网络,获得了47个由连接度>20和相互作用分数>0.7的核心IRG。与上述GO分析结果一致,对这47个核心基因的GO分析显示,“炎症反应”、“细胞外间隙”和“趋化因子活性”是最显著富集的条目(图2A)。在KEGG分析中,“趋化因子信号通路”是最常见的富集过程(图2B)。15个最重要的疾病本体(DO)条目中,可看出这些核心基因与肾脏疾病有关。

 

3、TCGA数据库中5个IRG特征的鉴定及验证

补充图3 LASSO Cox回归模型

        作者使用LASSO Cox回归模型,根据上文提取的47个核心IRG与TCGA发现集中患者生存率的关联来识别最有价值的预后IRG。图3示LASSO系数的剖面图(A),以及TCGA数据库中47个免疫相关中心基因的部分似然偏差图(B,Plot of partial likelihood deviance )。根据左侧虚线可知一共可入选5个最有价值的基因。最后作者选择出5个IRG:SHC1、IRF7、KDR、JAK3和CXCL5。

表1 5个IRG的单变量Cox回归分析结果

 

补充图4 5个IRG的K-M分析

 

补充图5 qT-PCR验证5个IRG表达水平

        作者使用TCGA发现集探究5个IRG的预后价值。表1,4个IRG的表达上调与患者的不良预后有关(HR>1),除了KDR(HR<1,KDR与患者预后呈正相关,是一个良好的预后因素)。P<0.05表明这5个IRG与患者预后的关联具有统计学意义。作者在Kaplan-Meier分析中发现(补充图4A),4个IRG的表达水平(除KDR外)与患者生存率呈负相关,这些IRG表达越高,预后越差。K-M分析结果与上表结果一致。

        接下来是验证5个IRG的表达水平。GEPIA数据库进一步验证了这5个基因的预后价值:除了SHC1(补充图4B)外,获得了与上文K-M分析一致的结果。收集35对ccRCC正常标本,用qRT-PCR进一步验证了IRG特征中各基因的相对表达,可看出肿瘤样本中的这些基因表达较高(补充图5),与数据库验证方法的结果一致。仍需对SHC1进行进一步的实验探究。

 

图1D 风险评分的C-指数

        基于每个基因的表达水平构建风险评分公式:风险评分=(0.08995984 * SHC1) + (0.05754872 * IRF7) + (-0.13910054 * KDR) + (0.01889022 * JAK3) +(0.02791388 * CXCL5) 。TCGA发现集中风险评分的C指数为0.666。验证集的风险评分(共3个验证集,TCGA内部集、TCGA完整集和EMTAB-3267数据集)C指数分别为0.686、0.677和0.591。

 

补充图6 使用X-tile软件为基于IRG特征的风险评分选择最佳的截断值

        作者使用X-tile软件,优化截断值以区分高低风险患者。横坐标所示为风险评分的最佳截断值。A图所示为TCGA发现集,截断值为0.135;B图所示为E-MTAB-3267数据集,截断值为0.448。

 

图3 预后风险特征的验证

        已知TCGA发现集样本的风险评分截断值为0.135,由此将患者分为高低风险两组。高风险患者的预后较差,而低风险患者的总体生存率更好(图3a,左)。ROC分析评估5个IRG在预测患者生存期中的准确性。AUC在患者生存期1年时为0.753,3年时为0.686,5年时为0.637(图3a,中)。高风险患者的生存率明显低于低风险患者(P<0.001)(图3a,右)。

        验证:TCGA内部验证集和TCGA完整集样本的风险评分截断值与TCGA发现值一致,均为0.135;E-MTAB-3267数据集截断值为0.448。这些截断值分别把各自数据集的患者分为高低风险两组。结果:与TCGA发现集一致,三个验证集中的高风险患者的预后比低风险组的患者差(图3b-d,左)。验证集中,五个基因特征的ROC曲线表现出良好的性能(图3b-d,中)。验证集的生存分析证实高风险患者的生存率较低(P<0.001)(图3b-d,右)。

 

4、5个基因特征与临床病理因素的相关性及亚组分析

表2 基于5分IRG特征的风险评分与患者临床特征的关联

 

补充图7 基于5个IRG特征的风险评分与患者临床特征的关联

        作者探究基于IRG特征的风险评分与临床特征的相关性。基于IRG特征的风险评分与性别、分期、分级显著相关,与年龄之间的相关性不具有统计学意义(p=0.347)(表2)。补充图7显示,男性、晚期、高级别和高风险患者的风险评分更高(p<0.05)。随后,作者进行亚组分析,以进一步评估5个IRG特征在特定临床参数范围内,对生存率的预后价值(补充表):风险特征仍然是预测年轻或老年(年龄≥65岁)患者、男或女性患者、低级别(Fuhrman 1级和2级)或高级别(Fuhrman  3级和4级)患者以及晚期疾病(III级和IV级)患者的生存率的有力工具(以上因素,P<0.05)。

 

5、不同的免疫表型是高风险和低风险ccRCC患者的特征

图4 PCA和GSEA的结果

        考虑到高风险和低风险ccRCC患者的不同预后,作者试图根据IRG特征的风险评分,来探索在分离病例时是否能发现免疫细胞群体的表型差异。作者基于47个核心基因的免疫球蛋白(图4A),和326个差异表达IRG的免疫球蛋白(图4B)进行PCA,结果都显示了出不同的分布模式,表明高风险组和低风险组患者的免疫表型显著不同。

        接着作者使用GSEA用于比较两组(高风险和低风险)免疫细胞表型的差异以及潜在的基因特征。与低风险患者相比,高风险患者的免疫途径发生了显著变化(图4C)。高风险患者中富集的途径包括:原发性免疫缺陷、产生IgA的肠道免疫网络、细胞因子-细胞因子受体相互作用、补体和凝血级联反应、Nod样受体信号通路和细胞周期。

 

6、低风险和高风险ccRCC患者的免疫状况不同

图5 高风险和低风险组患者的免疫图景

        为评估5个IRG能否正确评估肿瘤免疫微环境,作者使用CIBERSOFT 算法对ccRCC中22种免疫细胞进行了测试。22种免疫细胞类型在组内和组间的分布各不相同(图5A),这表明ccRCC中的免疫表型可能是每个个体的固有特征。这22种免疫细胞类型的相对比例与风险分类呈弱至中度相关(图5B)。其中,高风险组患者CD8  T+细胞、T滤泡辅助细胞、Tregs和M0巨噬细胞的表达显著增高,自然杀伤(NK)细胞、浆细胞、树突状细胞、肥大细胞和嗜酸性粒细胞的丰度显著降低(P<0.05)(图5C),表明高风险患者的免疫表型减弱。

 

图6 高风险及低风险患者与免疫标志物表达水平的相关性

        作者还探究了基于IRG的风险评分与T细胞标志物的相关性。作者发现风险评分与CD4、CD8A、PD-1、CTLA-4、LAG3、CD47的表达呈正相关,与PD-L1表达呈负相关。与低风险患者相比,CD4, CD8A, PD-1, CTLA-4, LAG3, CD47在高风险患者中高表达(p<0.05)。高风险患者出现免疫抑制的肿瘤微环境,与上文风险评分越高,患者肿瘤分期和分级越高以及预后越差的结果一致。这反映了免疫抑制肿瘤微环境有助于肿瘤进展和复发。

 

7、整合IRG特征和临床病理特征改善预后预测

表3 单因素和多因素Cox回归分析以预测患者OS

        为评估包含临床特征是否可以增加基于5个IRG特征的风险评分的精确度,作者对风险评分、病人的年龄、性别、Fuhrman级别以及肿瘤分期进行单变量和多变量Cox 回归分析。(使用TCGA发现集、验证集和TCGA完整集)。结果表明,基于IRG特征的风险评分是TCGA发现集、验证集和TCGA完整集的独立预后因素。年龄、分期和分级是TCGA完整集的独立预后因素。

 

表4 预后模型效果的比较

        基于多因素回归分析,计算相关参数的C-index、AIC。结果如表4。与单独的风险评分或者临床特征相比,5个IRG特征的风险评分与临床特征的联合有较高的C-index,和较低AIC,表明风险评分与临床特征结合可以提高ccRCC的预后精确性。

 

图7 列线图和校准图用于预测患者在TCGA集合中的生存率

        列线图整合了IRG风险评分和临床特征,用于定量预测生存性率(图7A)。校准图显示,列线图对于预测1、3、5年生存率具有良好的能力(图7B)。

 

小结

    作者通过提取IRGs,进行GO、KEGG、DO以及GSEA富集分析,发现对它们与炎症激活、免疫微环境重塑以及ccRCC的发展有关。通过PPI网络和LASSO回归分析,筛选出5个核心的IRG。作者通过TCGA发现集以及TCGA内部验证集、TCGA完整集和E-MTAB-3267数据集进行验证,探索了基于5个IRG的特征为ccRCC的一个基因特征。而且基于IRG特征的风险评分预后模型具有良好的性能,它可以将患者分为两组预后明显不同的组。IRG特征与某些临床特征(性别、分期、分级)显著相关,提示它可能指导患者分层。它还与患者的免疫表型有关(抑制性免疫标志物上调)。此外,作者将IRG特征与临床特征相结合,发现结合后预后预测效果更好。最后作者建立了综合预后列线图,以定量评估ccRCC患者的预后。该列线图性能良好,有希望指导临床实践。

局限性:局部免疫状态对ccRCC进展和预后预测的影响仍有待充分探讨。IRGs与ccRCC免疫状态的细胞和分子介质之间可能存在的分子相互作用机制仍需要进一步探讨。

文献解读

模型构建在非肿瘤类疾病(小众疾病)上的应用

2020-8-21 13:11:35

文献解读

【课题套路】国自然中转录因子研究思路

2020-8-22 14:39:52

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索