NMF:非负矩阵分解(算法)
LUAD:肺腺癌
免疫表型:免疫表型是通常所说的白细胞分化标志,现在已经发现多种白细胞分化标志。
一.研究思路本文分析了例LUAD患者的mRNA表达谱,如图1所示。将名来自TCGA的患者作为训练集,名来GEO的患者作为验证集。用细胞毒性T淋巴细胞相关蛋白4和PD-1阻滞剂治疗转移性黑色素瘤样本,预测免疫治疗的反应。使用NMF算法对训练集TCGA中的复杂肿瘤组织表达数据进行微观解剖,使用单样本基因集富集分析(ssGSEA)和最近模板预测(NTP)通过基因特征集对免疫表型的免疫状态进行分类。图1二.结果1.LUAD新免疫表型的识别
这里分析了例TCGA患者的基因表达谱,临床特征见表1。这些患者被用作使用NMF和ssGSEA算法的训练集,共获得了九种不同的基因表达模式(图1)。NMF鉴定出一种特殊的模式,表明免疫细胞和炎症反应之间存在着很强的相关性。通过分析该模式中排名靠前的基因,进一步验证了它们的免疫功能和相应的基因信号。使用排名靠前的基因对训练集进行一致性聚类,获得初步组。使用随机森林算法对初始组进行了优化,得到51%新免疫分子亚型。将此亚型定义为免疫类。属于免疫类别的患者具有显著丰富的免疫相关特征,包括免疫细胞,如B细胞、细胞毒细胞、T细胞和巨噬细胞、免疫转基因,如T/NK和B/P转基因、细胞溶解活性和6-IFN特征(均P0.)(图2A)。通过比较免疫亚群和非免疫亚群,确定了显著的差异基因。GSEA显著富集到KEGG通路的T细胞受体信号途径、KEGG自然杀伤(NK)介导的细胞毒性、炎症反应和IFNγ反应。
2.基于肿瘤微环境,免疫分类类由两个成分组成:激活亚型和衰竭亚型
如图2B所示,免疫类(67/)中有25%的患者被激活的基质基因标记识别,用于显示激活的炎症基质反应,而74%的免疫类(/)被认为缺乏这种激活。缺乏免疫类间质激活标记的患者与高免疫富集评分、IFN相关标记和M1巨噬细胞标记相关。相反,这里观察到显示高活性基质标记的患者呈现高基质富集分数和巨噬细胞标记(P0.05)。因此,本文分别定义了激活免疫类和衰竭免疫类两个子类。
图2
3.免疫分子亚型与预后的关系
免疫类LUAD患者预后较好,与研究一致,研究表明泛癌免疫分子亚型中C2(IFN-γ显性)和C3(炎症)表现为I型免疫反应。如图3A、B所示,在总生存率(OS)和无进展生存率(PFS)分析中,免疫组和非免疫组之间的生存曲线差异具有统计学意义(分别为P=.和P=.)。比较这三种分子亚型,主动免疫组在OS和PFS中的预后最好(图3C、D)。将衰竭类和非免疫类结合起来,与主动免疫类进行比较。结果表明,无论是OS还是PFS,主动免疫组和非主动免疫组的存活曲线差异仍然具有统计学意义(分别为P=.和P=.;图3E,F)。
图3
4.免疫分类与染色体畸变负荷、突变负荷和新抗原数的关系
利用训练集研究免疫类别与体细胞拷贝数变异(SCNA)、突变负担和新抗原之间的关系。对于SCNAs,免疫组的患者无论总体得失多少,都表现出较低的负荷(图4A、B)然而,所有三个亚组的患者在突变或新抗原方面均无显著差异(图4C,D)。衰竭免疫类、主动免疫类和其余病例的突变负荷中位数分别为、.5和.5,新抗原数中位数分别为35、31.5和36。可以发现主动免疫类往往有较低水平的新抗原数。总体来说,这些结果显示在LUAD中预测的新抗原率与T细胞反应之间没有相关性。而影响免疫活性,不是新抗原数量,而是新抗原的克隆性。
图4
5.新型免疫表型的验证用GEO数据库中另外两个独立的数据集来进一步验证免疫类中的特性。这里定义了个免疫类和非免疫类之间的差异基因作为免疫分类器。所有验证数据集的结果通常与训练队列一致。此外,本文还分析了分子亚型是否有能力预测免疫治疗反应,用亚类图谱法测量了接受免疫检查点抑制剂治疗的转移性黑色素瘤患者和训练集之间基因表达数据的相似性。正如预期的那样,免疫类,特别是主动免疫类,与转移性黑色素瘤患者对PD-1抑制的反应相似(图5)。
图5结语本文利用TCGA、GEO这些比较常用的公共数据资源,基于肿瘤微环境对肺腺癌进行编译表型识别,识别出三个免疫表型:激活免疫亚型、衰竭免疫亚型和非免疫亚型。很常见的一种基于NMF算法的套路文章,我们可以将这种思路在其他癌型中进行复现,发个3、4分的文章问题不大!
后台回复:5a,直接获取原文链接
信分析定制服务请扫描下方