【经典文章】基于基质和免疫打分评估肿瘤纯度

Inferring tumour purity and stromal and immune cell admixture from expression data

恶性肿瘤的组成除了有肿瘤细胞以外,还有肿瘤相关的正常上皮和基质细胞免疫细胞血管细胞。基质细胞在肿瘤的生长、疾病进展和耐药性方面有重要作用。在卵巢癌中已观察到浸润的T淋巴细胞具有抗肿瘤作用,在结直肠癌中与肿瘤生长、入侵和转移相关。
本工作构建算法ESTIMATE (Estimation of STromal and Immune cells in MAlignant Tumour tissues using Expression data),利用转录组数据推断肿瘤的细胞构成和不同的正常细胞的浸润情况。主要关注基质细胞和免疫细胞(是肿瘤中非瘤成分的主要组成),并且识别与基质细胞和免疫细胞浸润相关的特定signatures,利用ssGSEAsignatures打分形成评估肿瘤纯的的ESTIMATE scores

一、评估肿瘤细胞的浸润情况和肿瘤纯度

数据:

4个测序平台的TCGA10个癌型表达数据,GEOArrayExpress31个基因表达数据集

1.方法

首先从6个平台的基因表达数据选取10412个共有基因。
①识别正常造血细胞(two CD14 monocytes, two dendritic cells, two CD56 NK cells, two CD4 T-cells, two CD8 T-cells and two CD19 B-cells)与正常细胞的差异基因:1222个正常造血细胞中显著上调(正常造血细胞相关基因),9190其他基因。
403个有白细胞甲基化数据的TCGA OV样本,高甲基化白细胞scores样本(scoress排序,定义为高于97%的样本,N=14)与低甲基化白细胞scores样本(低于3%的样本,N=14)识别差异基因,447个在高免疫浸润组(高甲基化scores)上调基因,即免疫浸润相关基因
③激光捕获显微切割后,将卵巢癌、乳腺癌、结直肠癌样本划分出基质部分,识别肿瘤和基质差异基因,1147个基质中上调基因,其中338个基因至少在两套数据集中被识别,即基质相关基因。
④排除肿瘤特异变化的基因。计算CCLE7个组织类型的451个样本的基因的中位数绝对偏差,定义MAD<0.5为低变化的基因,最终识别172个与基质相关基因交叠的稳定变异基因。
⑤脑部肿瘤是由非上皮细胞衍生的,所以在一些基质相关的markers在脑肿瘤中会高表达。所以计算所有基因在胶质瘤干细胞细胞系的表达均值,低于中值的为低表达基因,并且该类基因不受glioma stem like cell浸润的比例影响更适合作为Signature,其中有141个基质相关的基因,为最终基质特征基因
1222个正常造血细胞相关基因与447个免疫浸润相关基因有161个交叠基因。为了免疫特征基因与基质特征基因数目保持一致,对161个基因的显著性值排秩,选取top-rank141个基因,为免疫浸润特征基因。
⑦对基质特征基因和免疫特征基因计算单样本GSEA(ssGSEA),为免疫 scoress和基质scoresESTIMATE scores为二者加和。肿瘤纯度Tumour purity= cos (0.6049872018=0.0001467884*ESTIMATE scores)

 

 

2.评估基质和免疫signnaturs

三个ov肿瘤样本,分成肿瘤部分和非瘤部分,分成EpCAM-positive EpCAMnegativeEpCAM是一种广泛表达于上皮来源组织中的跨膜糖蛋白)。
a图,相比EpCAM阳,EpCAM阴的基质和免疫scores更高,说明这些特征与肿瘤中非上皮细胞相关。
b图,与肿瘤部分相比,基质部分的免疫和基质分数更高。
c图,三种癌型中肿瘤部分和基质部分的基质scores分布,在基质部分基质scores显著高
d图,三种癌型中肿瘤部分和基质部分的免疫scores分布,在基质部分免疫scores显著高

3. 评估基质和免疫scores与肿瘤纯度的关系

1)比较ESTIMATEABSOLUTE方法

ABSOLUTE是评估肿瘤纯度的常用方法,基于体细胞DNA拷贝数变异预测肿瘤纯度)

TCGA Agilent array-based 417个未用于之前的分析的卵巢癌样本。

a,b图,基质scoress和免疫scoressABSOLUTE评估的肿瘤纯度负相关。

c图,ESTIMATEABSOLUTE的相关性要高于单用基质scoress或免疫scoress

d图,基质scoress和免疫scoress正相关,样本纯度低时有高的基质scoress和免疫scoress

研究发现,在不同癌型中,基质scoress和免疫scoress的相关性不同,说明这两个特征不能评估相同亚型,反应了基质细胞和免疫细胞在不同癌型中的相关性是变化的。

f图,用ABSOLUTE预测肿瘤纯度,划分四组纯度范围,看在不同范围下基于ESTIMATE的预测情况。

TCGA 10个肿瘤类型的表达数据和DNA拷贝数数据,来源4个平台。
a图,四个平台数据的ESTIMATE的预测情况。

2)病理学评估

下图:评估在不同的scores下基质细胞、浸润白细胞的病理学评估的分布比例。

基质scores、免疫scoresESTIMATE scores与病理学相关性较弱。但ABSOLUTE也是弱相关。

 

 

二、ESTIMATE 预测肿瘤纯度

b图,7套独立验证集。ABSOLUTE预测肿瘤纯度,划分四组纯度范围,看在不同范围下基于ESTIMATE的预测情况。

c图,灰色点代表955TCGA样本的ESTIMATE 预测情况,黑色点是一个新样本的预测。

为了验证该打分的特异性,利用细胞系是无基质细胞和免疫细胞的环境的特点,在27癌细胞系样品GSE34211)的拷贝数和表达数据来评估纯度在该类样本中的低打分和标准差一致表明没有免疫和基质信号。接下来使用来自10个正常卵巢上皮样品的表达谱计算了ESTIMATE得分 ESTIMATE预测的肿瘤纯度为0.68±0.12,表明正常的卵巢上皮可能具有一些基质或免疫细胞成分
在所有类型的肿瘤中,免疫scoress与白细胞甲基化评分之间都具有高度相关性基质scoress与白细胞甲基化评分没有显着相关性。表明免疫scores与不同肿瘤类型中白细胞的存在密切相关。

 

 

三、在不同癌型中基质和免疫scores的模式

a,b图,TCGA和非TCGA10种不同肿瘤类型的数据集,每种肿瘤类型的基质和免疫scoress的分布。

如先前报道,与其他类型的肿瘤相比,肺腺癌的纯度较低透明细胞肾中发现的基质水平相对较高在高度浆液性卵巢癌中,高基质或免疫scoress反映了先前已报道的间质或免疫相关基因表达亚型的存在。透明细胞肾细胞癌被认为是免疫原性肿瘤,较高水平的免疫signature表达。肺鳞状细胞癌显示出相对较高的免疫细胞评分,最近与免疫调节疗法的易感性相关。需要进一步的研究来证明浸润性免疫细胞的存在是免疫疗法反应的生物标记。肺鳞状细胞癌和头颈部鳞状细胞癌之间的间质和免疫scores分布的相似性表明,这些肿瘤可能具有相似的基因组特征,但也具有可比的肿瘤细胞

 

 

四、体细胞突变对肿瘤纯度的影响

为了检查肿瘤纯度对检测基因改变的能力的影响,将每个肿瘤类型的样本分类,ESTIMATE scores在前25%是低纯度组,后25%是高纯度组。低纯度头颈部鳞状细胞癌和透明细胞肾细胞癌中,观察到每兆碱基的突变数量减少

测量两种类型的转换类型碱基取代A>G / G>AT>C / C>T)和四类颠换类型碱基取代C>A / A>C,C>G / G>CT>A / A>TT>G / G>T)的相对贡献来评估高纯度和低纯度亚组的突变谱。十个TCGA数据集中的两个数据集(头颈部鳞状细胞癌,肺鳞状细胞癌)显示,与高纯度组相比,低纯度组中的T>A替代比例显着降低。头颈部鳞状细胞癌的转变和颠换比例与纯度水平显著相关

小编总结:

影响肿瘤纯度的主要是免疫浸润和基质成分,从这个角度出发,本工作首先识别免疫signatures和基质signatures,通过ssGSEA建立打分ESTIMATE评估肿瘤纯度,接下来通过与ABSOLUTE预测方法和病理学作比较来评估,分析不同癌型中SCORES分布情况等。
文献解读

lncRNA在早期胰腺导管腺癌患者中潜在临床价值的研究

2020-8-27 21:38:55

文献解读

转录组数据-免疫微环境精品分析思路(二)

2020-8-27 23:50:13

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索