利用肿瘤微环境识别乳腺癌不良预后亚型

An independent poor-prognosis subtype of breast cancer defined by a distinct tumor immune microenvironment

2019.12.3

IF:11.878

背景:

在乳腺癌中,临床病理学如年龄、分级、分期以及分子亚型与预后相关,并且影响治疗决策。五种乳腺癌临床亚型:Luminal A型, Luminal B型, Her2-enriched型, Basal like型和Normal-like型。
肿瘤炎症微环境影响癌症的开始和进展。癌细胞周围的免疫微环境可以识别和抑制肿瘤的生长或促进肿瘤的进展。所以确定肿瘤部位免疫反应的质量和数量至关重要,因为这可能有助于确定哪些患者可以从免疫治疗中受益,并将提高我们对肿瘤宿主生物学(tumor–host biology)的理解。
在乳腺癌中,较高的免疫浸润与较好的临床结果相关。高免疫浸润与增加新辅助化疗和辅助化疗的应答有关。
最近已经有工作证明转录组数据可以用来解剖肿瘤微环境。一些研究表明白细胞标记基因的表达升高与乳腺癌复发风险降低有关。一些其他研究中,分别评估了每个预测的细胞类型,并没有将免疫微环境作为一个整体来考虑。需要更多的研究来明确免疫环境在乳腺癌中的作用和临床相关性。
在本工作中,发现临床相关的免疫类型有逐渐免疫浸润的现象。在15套共6101个乳腺癌样本中,发现肿瘤免疫浸润程度中等的患者预后较差,与已知的预后分子和临床病理特征无关。同时发现一个与预后不良组相关的原致瘤性(pro-tumorigenic)免疫浸润。乳腺癌中有两种相互排斥的侵袭性肿瘤表型,一种与上皮-间质转化(EMT)相关,另一种与增殖相关,这两种亚型都出现在预后不良的非活性/原致瘤性免疫微环境中。

数据:

(1)Oslo1样本:可手术的早期乳腺癌患者,1995年至1995年微转移观察研究。

(2)MicMa样本:Oslo1中有一部分患者收集了新鲜原发肿瘤,共96个。

(3)OSL2样本:在挪威东南部的几家医院收集具有主要可手术疾病的乳腺癌患者的研究,2006年至今。

(4)公共数据集:Gene Expression Omnibus, the European Genome-phenome Archive, ArrayExpress, 和TCGA data portals.

 

结果:

一、乳腺癌中免疫浸润类

首先使用nCounter®PanCancer Immune Profiling(一种用于分析实体肿瘤中免疫浸润的方法)来测量MicMa样本中95个福尔马林浸泡石蜡包埋(FFPE)的肿瘤样本中760个基因的表达。用Agilent wholegenome 4 × 44K oligo array对其中79个样本测基因表达。使用Pearson和Spearman方法评估两个平台测量表达值之间的相关性,发现基因表达值之间存在高度正相关。
为了根据免疫相关基因表达的相似性对患者进行分组,对相关性矩阵进行无监督的层次聚类(Fig. 1a)。3至10个类的轮廓图分析(Silhouette plot analysis)表明,3个聚类对nCounter和Agilent数据集的分割效果最好。因此接下来基于三类对患者进行分析。
为了确认这些类与肿瘤免疫微环境相关(Fig.1b),使用算法Nanodissect对总淋巴细胞和髓细胞浸润情况进行评分。Nanodissect分数首先在MicMa样本中验证,分析(由经验丰富的病理学家)苏木精和伊红(H&E)切片的免疫浸润(Fig. 1b)。发现这三个与纳米解剖淋巴细胞(Fig.1b)和髓细胞的分数显著相关。此外,卡方检验显示这些类与免疫浸润有显著的相关性(p < 0.0001)。发现A-C表现逐渐的免疫浸润,称为免疫

 

二、各聚类表现出逐渐免疫浸润

在其他9套数据集中,用样本表达数据验证各聚类与淋巴/骨髓浸润的关系。760个基因中的509个在所有样本中都有表达值,所以用509个基因构建相关性矩阵,对其在METABRIC和TCGA的样本中进行无监督聚类(Fig.1 d)。在每套数据中,三个类都与淋巴和骨髓Nanodissect分数相关(Fig.1e)。
为了进一步验证,对METABRIC数据进行病理学评估其免疫浸润情况,这与Nanodissect评分显著相关(Fig.1f)。(Nanodissect算法能够预测淋巴细胞和骨髓细胞的浸润情况)
PanCancer Immune Profiling array的无监督层次聚类可以根据免疫浸润的渐进水平对乳腺癌肿瘤进行分组

 

三、免疫类与预后相关

 

生存分析显示,在METABRIC (n = 1904)和TCGA (n = 981)数据中类B(免疫浸润程度中等)与较差预后相关。ER阴性和ER阳性样本进行分类时,也是B类预后差(Fig. 2)。
无论是ER阴性乳腺癌还是ER阳性乳腺癌,免疫簇都与预后相关

 

 

四、二项logistic回归(binomial logistic regression)预测免疫类

该研究意图开发一种通用的方法,可以精确地预测预后较差的患者,而不必依赖于无监督聚类。对10套数据(4546个样本)的作为训练集开发了一个模型,5套(1555个样本)作为测试集。
使用二项logistic回归通过lasso方法获得的一组能够预测类B的敏感基因,用ROC进行评估(Fig. 3a),该模型预测的免疫类AUC = 85.8%(82.8%-88.7%)。通过聚类得到的A、C类样本中,有96.3%的样本被模型预测为A、C类。通过聚类的B类样本中,有68.8%的样本是用lasso方法预测为B类(Fig. 3b)。结果表明,lasso方法减少了B类样本的数量(Fig.3b)。由于无监督聚类在小群体中不太可靠,并且从几个群体中学习聚类分配将有助于精确免疫聚类的表型,因此假设基于lasso的分类将是比聚类方法更好的预后因子。lasso模型在另外5套数据中进行了验证:Fig. 3c–e为STAM (n = 856),MAINZ (n =),UPSA (n = 289)。由于二项logistic回归只能预测两个类(类B与类A和类C),所以接着进行了另一轮二项logistic回归来区分类A和类C。
综上所述,lasso方法对二项logistic回归重新定义了聚类B,并提供一个单一样本预测器,可适用于临床的每一个病人。

 

 

五、免疫类是一个独立的预后标志

为了探究免疫类与已知的临床病理学特征(大小、年龄、分级、分期、淋巴结转移及分子亚型(PAM50))的关系。发现类A(免疫浸润低)在ER阳性和腔内病例中富集,而类C(免疫浸润高)在ER阴性和Luminal 型比例较高(Fig. 4a, b)。ER阴性和ER阳性的样本以及PAM50亚型在预后不良的类B中同样存在(Fig. 4a, b)。多变量Cox回归分析发现免疫类是模型生存的一个重要因素。
使用逐步逆向选择来验证免疫类作为预后标志的效能,在最初的Cox 模型中,在不削弱模型的情况下删除最弱的预测变量(通过AIC指数的计算来监控)。这样找到最能解释生存的一组变量,免疫类都保持在最佳拟合最小模型中11套数据中有9套数据中,免疫类是一个显著的预后变量(Table 1)。

 

 

 

六、在新数据集用复发风险scores进行验证

利用数据集EMIT0(OSLO2数据中的一部分),评估了免疫类是否能增加ROR(risk of recurence,风险复发)评分的预后价值。发现类B的样本与类A和类C相比具有中等的ROR评分(Fig. 4c),说明与类B相关的不良预后不太可能由ROR评分中包含的信息来解释。
对于所有的样本,按照Parker等人的方法计算ROR分数,证实类B由中间程度ROR评分组成,图所示METABRIC 数据的score情况(Fig. 4d)。

 

 

七、免疫类以及对新辅助化疗反应

使用新辅助化疗(术前化疗)患者的基因表达数据,终点是病理完全反应(pCR),即在化疗方案结束时,即术前完全消灭癌细胞。
使用8个研究(1377个样本)的基因表达数据,用lasso方法将样本划分所属免疫类(Fig. 4e)。发现类C应答者的比例最高(59%),其次是类A(30%),类B应答者的比例最低(11%)。

卡方检验表明应答者在免疫类中的分布存在显著差异,类B中应答者少,类C中应答者多。
结果表明,类C患者有更高的可能性成为应答者。类B有低应答率,这些患者可能是新辅助治疗方案的候选对象。

 

八、免疫簇用算法分类

使用CIBERSORT算法估计了22种不同免疫细胞的比例,计算每套数据和每种聚类中每个免疫细胞类型的中位浸润,并对这些细胞类型特异性中位浸润scores进行无监督聚类(Fig. 5a)。
在类C中,巨噬细胞M1、记忆激活T细胞和滤泡T辅助细胞有显著富集(Fig. 5a),类A的免疫细胞水平非常低。在反应差和预后差的类B中,巨噬细胞M2、静息肥大细胞和静息记忆T细胞的水平较高(Fig. 5a), METABRIC 和TCGA数据也说明了这一点(Fig. 5b)。
用广义线性模型,明确了区分类B和类A-C的免疫细胞类型,并确定了类B的静息和原致瘤免疫细胞类型(Fig. 5c)。类B中具有致瘤性的免疫细胞浸润可能有利于肿瘤的生长。认为类A为免疫冷性(immune-cold)肿瘤,类C为免疫热性(immune-hot)肿瘤,类B为原致瘤性(pro-tumorigenic)免疫浸润。

 

 

九、免疫簇的表型分析

对类B进行差异基因表达分析,发现类B中显著过表达(相比类A、C)的基因有909个,GSEA分析表明这些基因与干细胞生物学和EMT相关(Fig. 6a)。
使用了与EMT、干细胞、缺氧和增殖相关的基因集,共11个基因。使用GSVA方法计算每个聚类和数据集的平均基因集富集分数(反映免疫类中每个通路/基因的活性),对平均基因集scores的无监督聚类清楚地分出了免疫类A和类C,类B分为两个亚组(图6b)。说明免疫类和干细胞/ EMT相关特征基因之间的联系。

 

 

十、乳腺癌中两种相互排斥的表型

对GSVA富集分数进行无监督聚类,确定了乳腺癌中两个相互排斥的特征基因(i)一个与增殖和胚胎干细胞样表型相关(ii)另一个与EMT和乳腺干细胞表型相关。
类C以增殖性表型为主,类B中,EMT或增殖相关特征的平均基因集得分较高,类A 中EMT和增殖状态评分均较低。
为了确定哪个基因集得分能够解释类B,使用广义线性模型测试了每个基因集对类B与类A组和类C的贡献。EMT标记对类B有积极贡献,而类A和类C与细胞增殖和细胞运动相关(Fig. 6c)。当测试了与类A或类C单独比较时,哪个基因集评分可以解释类B,发现在两种情况下,EMT评分都是类B的一个重要解释变量。
根据Cox回归分析,EMT特征评分本身并不具有很强的预后价值。这些结果表明EMT和乳腺癌的增殖是相互排斥的,只有在伴随一定的免疫背景下,EMT或增殖表型才会导致预后不良。

 

 

十一、肿瘤表型与免疫浸润的相关性研究

由于免疫类与(i)免疫细胞类型和(ii)基因集特征都相关,这里评估免疫浸润(CIBERSORT)与癌细胞特征(基因集得分)之间的关系。Figure 6d显示,增殖和EMT评分与不同类型的免疫细胞显著相关。高EMT评分与巨噬细胞M2、静息肥大细胞相关。静息记忆T细胞高增殖与更活跃的适应性肿瘤微环境(巨噬细胞M1、T辅助细胞、活化的树突状细胞)相关。这些结果说明,在癌细胞表型和肿瘤微环境的组成之间存在连续统一关系。

 

十二、类B基因集得分的异质性

类B特征是原致瘤免疫浸润和EMT信号高,但约35%的类B标本也表现出增殖表型。探究类B内部的异质性,根据基因特征scores,用无监督方式将样本分为以EMT表型为主的B1组和以增殖为主的B2组((Fig. 6e)。TCGA和METABRIC样本,B2组预后不好(Fig. 6f, g)。
为了进一步评估基因集评分的异质性是否伴随着免疫环境的异质性,在B1和B2亚型之间寻找特异性免疫细胞类型的差异,结果表明B1和B2均具有致瘤/静息免疫微环境。

 

小编总结:

在本工作中,首先根据一组免疫基因表达的相关性分数对将样本划分成三类,对免疫三类进行分析,发现临床相关的免疫类型有逐渐免疫浸润的现象,肿瘤免疫浸润程度中等(类B)的患者预后较差,具有原致瘤性(pro-tumorigenic)免疫浸润特征,并且在该类中,出现两种互斥的侵袭性肿瘤表型,一种与EMT相关,另一种与增殖相关。

文献解读

临床样本怎样简单生信分析?对肝细胞癌建立分子和免疫分型

2020-8-28 4:06:15

文献解读

基于免疫相关基因构建非鳞状非小细胞肺癌的预后特征

2020-8-28 4:11:52

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索