免疫相关基因预后模型及列线图构建

大家好,这次给大家分享的文献是Exploration of the molecular characteristics of the tumor–immune interaction and the development of an individualized immune prognostic signature for neuroblastoma,2020年5月发表在J. Cell. Physiol杂志上,影响因子5.546。作者基于多种机器学习方法,找到与神经母细胞瘤患者预后相关的免疫基因并构建预测模型,方法众多且分析透彻,下面让我们一起来看一下这篇文章!

01

研究流程图

 

02

结果解读

免疫表型与肿瘤微环境

通过ssGSEA算法,利用29个免疫基因集对160个样本进行分析。层次聚类算法将样本分为两类:72个样本被聚类到亚群1中,88个样本被聚类到亚群2中。其中亚群1为高免疫组,亚群2为低免疫组(图1a)。利用CIBERSORT算法对每个样本的肿瘤微环境(TME)进行评分(图1b),并比较免疫高/低组的肿瘤微环境特征,可以看出两组的TME有显著差异(图1c-f),其中高免疫组的间质细胞浸润和免疫细胞浸润水平高于低免疫组,但肿瘤纯度较低。这一发现与先前的研究一致。

图1

NBL-免疫互作分子特征的描述和潜在的预后价值

在高低免疫组间进行差异分析,共有2248个基因被鉴定为DEGs。其中,免疫高组2010个基因上调,238个基因下调。NBL患者的所有DEG表达水平如图2a所示,所有DEG的log2|FC|和q值如图2c所示。根据ImmPort数据库确定535个基因为差异表达免疫基因(DEIGs),其中527个基因上调,8个基因下调(图2b)。图2d显示了DEIGs的log2|FC|和q值。最后,采用单变量Cox分析识别出23个预后相关免疫基因(PIG),并计算了风险比(HR)(图2e)。这些基因在高低免疫组的差异表达情况如图2f所示。

图2

基于免疫相关基因预后模型(IGPM)的风险特征的构建和验证
对上述基因进行多变量cox分析并构建IGPM(表1),根据IGPM计算每个NBL患者的风险评分,以风险中位数为参考标准将患者分为高风险组和低风险组。根据风险评分评估队列中每个患者的生存状态(图3a)。生存分析可以看出高低风险组间差异显著(图3b)。相关分析显示,风险评分与生存时间呈显著负相关,说明NBL患者的生存时间随着风险评分的增加而逐渐减少(图3j)。ROC曲线分析显示IGPM的预测能力和准确性都较好(图3d)。此外作者还比较了基于IGPM的风险特征与临床特征的预测能力和准确性,发现基于IGPM的风险特征仍然比临床特征具有更高的预测能力和准确性,表明与常见临床特征相比,该模型具有相对优越的预测潜力和准确性(图3f)。校准曲线的结果也表明基于IGPM的风险特征的预测值与实际值吻合良好(图3g)。为了验证基于IGPM的风险特征的稳健性,作者使用GSE62564外部数据集来验证基于IGPM的风险特征。可以看出,AMH、UNC93B1或IRF7的高表达组和低表达组的存活率有显著差异(图3h,i,k,l)。基于迭代算法的生存分析也表明高风险组和低风险组之间存在显著差异(图3c)。ROC曲线也再次验证基于IGPM的风险特征的预测能力和准确性(图3e)。最后,作者想确定IGPM是否独立于常见的临床特征,是否可以作为NBL患者的独立预后因素。多变量Cox分析和单变量Cox分析结果显示基于IGPM的风险特征可以作为独立的预后因素(表2)。

图3

IGPM与临床特征、免疫细胞浸润、免疫炎症的关系
为了阐明临床特征、kIGs(IGPM的关键基因)和基于IGPM的风险特征之间的相互关系,作者计算了风险分数、KIG和临床特征之间的相关性(图4a)。结果表明,除AMH、SECTM1、UNC93B1和KLRK1外,大部分kIGs均为显著正相关,说名kIGs可能通过共表达机制影响NBL患者的预后。就MYCN而言,AMH在扩增组中显著表达,IRF7和SECTM1在未扩增组中高表达,这与相关分析的结果一致(图4c)。在COG风险组中,IGKV1‐20、IGKV1‐16、IRF7、SOCS1和UNC93B1在高风险组中高表达,表明KIG对COG风险有显著影响(图4d)。就年龄而言,IGKV1-20、IGKV1-16、IRF7、SOCS1和UNC93B1的表达量在老年组都有所增加,表明这些KIG随着年龄的增长而增加(图4e)。性别与kIGs的表达水平无显著相关性,也无显著影响,表明kIGs在男性和女性NBL患者中的表达水平是稳定的(图4f)。KLRK1对肿瘤分级有显著影响,在未分化或低分化组中表达量增加(图4g)。而MKI不影响kIGs的表达水平(图4h)。与高倍体组相比,低倍体组的IGKV1-20、IRF7和SOCS1的表达量增加(图4i)。
免疫微环境在肿瘤的发生和发展中起着至关重要的作用。因此作者研究了基于IGPM的风险特征与NBL免疫微环境之间的相关性。在免疫细胞浸润方面,活化的CD4记忆T细胞和血浆细胞与危险评分呈显著正相关;高危NBL患者活化的CD4记忆T细胞和血浆细胞的浸润程度高于低风险NBL患者(图4b)。考虑到免疫-炎症相互作用机制在NBL发展中的重要作用,作者又研究了与NBL发展密切相关的炎症相关分子的表达水平与基于IGPM的风险特征之间的关系。结果发现CXCL12、IL6和NDUFA2(CD14)在高风险组中显著过度表达(图4j),这与之前的研究是一致的。

图4

NBL免疫分子的多维调控网络

为了研究NBL(神经母细胞瘤)免疫分子的多维调控网络在肿瘤发生和发展过程中的作用,作者首先探索了KIG的上游机制,即:NBLTF–kIG调控网络。结合差异表达分析和ImmPort数据库中的数据,确定了与NBL发生相关的转录因子(图5a)。通过相关性分析,共鉴定出36个参与上游调控的转录因子和126对NBLTF-kIG调控关系。NBLTF-KIG调控网络如图5b所示。考虑到KIG之间存在显著的正相关(图4a),可能暗示它们之间存在一定程度的相互作用,而PPI分析也证实了它们之间确实存在相互作用(图5c)。GO(图5d)和KEGG(图5e)富集分析表明kIGs主要参与先天性免疫应答和干扰素相关信号通路。

图5

临床特征列线图的建立与验证

为了扩大基于IGPM的风险特征的临床应用和可用性,作者将其与常见的临床特征相结合,构建了一个易于用于计算单个NBL患者预期生存率的列线图(图6a)。KM生存分析表明,基于列线图的NBL患者个体风险分层可以更好地区分存活率较低的患者(图6b)。校准曲线显示,列线图的预测值与实际值具有良好的相关性(图6d)。ROC曲线也表明列线图的预测能力和准确性较好(图6c,f)。通过比较列线图和基于IGPM的风险特征的C-指数,证明列线图在预测短期生存状态方面具有更好的区分能力,基于IGPM的风险特征在预测长期生存率方面更为稳健(图6e)。

往期推荐:手把手掌握临床研究的必备绘图技能:列线图

图6

03

结语

这篇文章的工作量是很大的,从数据的收集到模型的构建,作者所做的分析很全面,可以看出5分多的文章跟4分多的文章差距还是有的。文章首先对NBL患者进行免疫表型分类,并做差异分析,得到免疫相关差异表达基因,构建预测模型和列线图并进行验证。文章思路清晰,分析透彻,其中的一些方法学应用值得我们去学习与借鉴!

文献解读

筛选单基因进行诊断生信分析思路

2020-8-24 21:31:10

文献解读

【课题思路】如何设计lncRNA RBP套路文章

2020-8-25 20:30:29

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索