非肿瘤之scRNA-seq和bulk RNA结合思路
卖萌控的博客
点击这里进入电脑版页面!体验更好
非肿瘤之scRNA-seq和bulk RNA结合思路
2024-10-6 萌小白


近些年,单细胞思路是生信研究热点,非肿瘤的单细胞数据相对较少,因此巧妙地运用单细胞数据,是提高文章质量的关键。今天分享一篇非肿瘤相关的纯生信文章,将Single-cell和Bulk
RNA数据相结合,用常规的分析方法,发表在Frontiers in Immunology上,一起来看看吧。



阿尔兹海默症免疫相关基因的表达和潜在调控机制






开始这篇文章之前,我们先回顾一下单细胞RNA测序和Bulk RNA的区别:



单细胞测序是对单个细胞的RNA进行测序,我们之前所接触到的都是取肿瘤组织或血液样本等,对这 一群细胞混合RNA进行测序, 能够得到的是一群细胞的转录组的 平均数据,或者说是 代表性数据,细胞之间的异质性信息往往被掩盖。



举个例子,一块肿瘤组织, 肿瘤中心与肿瘤边缘的细胞表达情况一样吗?显然不一定,而如果想研究肿瘤微环境或免疫功能,这种细胞之间的异质性往往是不能忽略的。



单细胞转录组(scRNA, single-cell RNA)测序恰恰弥补了这一缺点,同时也解决了因样本量太少而无法进行常规测序的难题,为我们研究单个细胞的行为、机制提供了新的方向。



01



摘要



近些年,越来越多的研究表明神经炎症和神经系统免疫浸润是阿尔兹海默症(Alzheimer's Disease, 以下简称AD)发病的关键因素。由于血脑屏障的存在,中枢神经系统中很少见到外周血免疫细胞,但研究人员发现在AD患者的大脑中存在免疫细胞,且与发病密切相关。本篇文章的研究目的就在于探索AD患者免疫相关基因( Immune-Related Genes, 以下简称IRGs)的表达情况及可能的调控机制。



02



研究方法



研究共选取了3个GEO数据集,其中既有scRNA-seq数据,也有bulk RNA-seq数据;既有人类AD患者的数据,也有AD小鼠的数据,两种数据相结合是本文的亮点之一。



此研究采用常规的单细胞分析流程,用AUCell包评估免疫相关基因集在细胞中的活性,此外还有常用的功能富集分析和PPI网络等。



03



结果简述



3.1



数据来源



1. AD患者和正常人bulk RNA数据:(脑组织)



GEO数据库: GSE33000



2. AD患者和正常人单细胞数据:(外周血样本)



3. AD小鼠和正常小鼠单细胞数据:(脑组织)



3.2



单细胞数据分析



首先利用GSE181279数据集,用Seurat包进行 主成分分析(PCA)和t分布邻域嵌入算法( t-SNE)。基因数<200,>2500,或线粒体基因>5%的细胞被排除。共得到24679个细胞用于后续分析



PCA降维,得到15个PCs,用JackStrawPlot进行可视化(图1D)



FindClusters功能将细胞聚类,resolution为0.2



FindAllMarkers鉴定每个cluster的DEGs,将每个cluster的top10的DEGs用热图展示(图1E)。






基于每个cluster的DEGs和以往的研究来鉴定细胞类型。最终得到NK细胞、B细胞、CD4+T1/T2细胞等。并将AD患者聚类结果与对照组比较,结果显示NK细胞在AD患者中所占比例明显比对照组低(图2B、E、F)。因此NK细胞是研究的重点。



对每个cluster中的部分基因的表达情况进行展示(2C、D)



不要忘了,这是外周血样本。AD患者外周血中的NK细胞含量相对较低,为什么会低呢?我们就可以推测NK细胞或许是参与了神经系统的免疫浸润。






为了研究免疫相关基因的表达情况,作者结合 ImmPort数据库,与DEGs取交集得到212个IRGs。将此212个免疫相关基因看作一个基因集,用 AUCell包评估免疫相关基因集在各个细胞中的活性(图3A),AUC值越高说明活性越高,可以看出IRG基因集活性较高的细胞主要集中在NK细胞和DC细胞(图3B)。



将NK cluster的DEGs进行富集分析,主要富集在"Immune response"和"antigen processing"通路上 (图3C、D)






3.3



Bulk RNA分析



作者随后对AD患者脑组织的bulk RNA数据进行差异分析和富集分析,富集结果与上述NK cluster的DEGs的富集分析结果高度相似。






3.4



共同IRGs和关键转录因子



作者将NK cluster的IRGs和AD患者脑组织的IRGs取交集,得到70个共同的IRGs (下图A)



取top40进行展示,发现这些IRGs在NK细胞中均有明显表达(下图B)



另外,作者将NK cluster的DEGs、AD患者脑组织的DEGs、HumanTFDB(人类转录因子数据库)取交集,得到17个转录因子,其中13个上调,4个下调(下图C、D、E)



将17个转录因子进行PPI网络构建,结果显示STAT3为最关键的转录因子,因此可合理推测此基因对免疫相关基因的转录调控起关键作用(下图F)






3.5



AD小鼠验证NK细胞浸润



作者为了验证NK细胞在脑组织中的浸润,选取了小鼠脑组织的单细胞数据进行聚类分析,得到10个cluster(下图A、B)



对cluster中的部分基因进行展示(下图C、D)



SingleR和CelldexR对cluster进行注释,其中9个cluster被注释为NK细胞,1个cluster被注释为小神经胶质细胞,因此验证了在小鼠脑组织中有NK细胞浸润






小结



本研究将单细胞数据与bulk数据相结合,着眼于免疫相关基因和转录调控因子,思路值得借鉴。若将小鼠数据集验证部分提升为人类数据集或实验验证,可提高文章水平。除此之外也可将免疫相关基因替换为铁死亡相关基因等热点。

发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容