关键词:
结直肠癌
单细胞多组学数据
转录调控网络
细胞分子特征
摘要:
目的探讨结直肠癌恶性转变过程中的分子特征及其调控网络扰动,深入剖析结直肠癌恶性转变的微环境异质性并识别潜在治疗靶点。方法首先从Gene Expression Omnibus(GEO)数据库中收集单细胞转录组测序数据,从欧洲分子生物学实验室(EMBL)收集单细胞ATAC测序数据。数据共涉及来自14例患者的70例样本,包含22例正常样本、43例息肉样本和5例肿瘤样本。首先对scRNA-Seq测序数据进行预处理,基于Seurat包筛除双细胞和低质量细胞,对scATAC-Seq测序数据使用10X Cell Ranger-atac进行原始数据处理,并使用Signac包去除低质量细胞,得到三个阶段的scRNA-Seq和scATAC-Seq细胞图谱。进一步数据整合,基于Pando R包推断T细胞和上皮细胞的转录调控网络,通过mfinder软件分析网络motif和拓扑属性,对转录因子进行分级分析。最后,基于随机森林算法进行细胞分子特征预测及预后分析。结果筛选出202465个scRNA-Seq测序细胞和136422个scATAC-Seq测序细胞。基于数据整合分析,构建不同癌变阶段的细胞图谱。结果发现,随着结直肠癌进展,肿瘤微环境组成发生显著变化,尤其是T细胞和上皮细胞在不同疾病阶段的比例有较大差异。基于单细胞多组学数据整合,利用Pando包推断结直肠癌不同阶段的转录调控网络,揭示了T细胞和上皮细胞中转录因子及其调控关系的动态变化。功能富集分析结果显示在T细胞和上皮细胞中,转录因子所调控的功能在不同的疾病阶段有明显差异。基于转录调控网络分析发现,T细胞和上皮细胞转录调控网络符合无标度网络特性。网络motif分析揭示了在不同阶段存在的特定motif模式,反映了网络拓扑结构的动态变化,且网络中大多数相互作用都具有阶段特异性。共享转录因子的层级在癌变过程中也会发生变化。最后基于转录因子调控网络构建的分类器可以成功识别T细胞和上皮细胞,表明其作为细胞分子特征的有效性。进一步识别出与患者生存显著相关的网络motif,揭示其在结直肠癌预后中的潜在作用。结论基于整合单细胞多组学数据构建转录调控网络,解析随结直肠癌的进展转录调控网络及其功能的动态变化,揭示了结直肠癌进展过程中的细胞分子特征及关键预后motif,为结直肠癌的分子机制及预后评估提供了深刻见解。