如何让别人觉得你看起来做了很多分析
卖萌控的博客
点击这里进入电脑版页面!体验更好
如何让别人觉得你看起来做了很多分析
2022-4-30 萌小白


大家好,今天和大家分享的是一月份发表在Front Aging
Neurosci(IF:3.633)杂志上的一篇文章,“Integrative Analysis of Hippocampus Gene
Expression Profiles Identifies Network Alterations in Aging and
Alzheimer’s
Disease”,文章中作者通过加权基因共表达网络分析以及加权蛋白互作网络分析,对GEO数据库中,海马体在年轻,年老以及阿尔兹海默症患者(AD)中的基因表达进行分析,为衰老和AD之间的复杂关系提供了新的见解。



Integrative Analysis of Hippocampus Gene Expression Profiles Identifies Network Alterations in Aging and Alzheimer’s Diseaser



海马体基因表达谱的综合分析确定衰老和阿尔茨海默氏病的网络变化



一、研究背景



阿尔兹海默症(AD)是一种神经退行性疾病,它会导致认知功能迅速下降最终导致痴呆,大多数AD病例为老年人。了解衰老和AD之间的关系,有助于获得与该疾病相关的标志物以及特定于细胞类型的识别方式。通过利用年轻人(20-50岁),老年人(70-99岁),AD患者的海马体基因表达谱进行分析,获得对衰老与AD关系更高层次的网络理解。



为何说本文看似做了很多的分析呢?我们简单来概括下:


1.WGCNA将数据分成了15个模块,常见的分析有“模块和临床变量相关性分析”。此外还用了5个数据集做进行验证模块的可重复性(中文翻译是模块保存分析,英文是module preservation analysis);


2.对不同模块间表达量在Young,Age和AD间做比较(柱状图,并无统计检验)


3.Young,Age和AD间进行差异分析后,对DEGs的数量用韦恩图可视化


4.不同模块间功能注释,注释后挑选一大堆的可能用于解释的通路


5.常见的PPI,鉴定出hub基因,并将这些hub基因的表达量变化(logFC)和Young,Age和AD联系起来


因此,基于上面的这些分析和可视化的方式,让本篇文章看起来格外“充实有料”!其实理清楚分析的思路,大概就是作者基于表达数据进行WGCNA,不仅使用5个GEO数据集验证了模块的可重复性,并且在各个模块中与临床变量,细胞,功能相联系,最后就是PPI来鉴定hub基因,然后将这些hub基因和Young,Age和AD相互联系。


二、研究思路






三、结果解析



1、加权基因共表达网络构建及模块—特征相关性分析



使用了18,754个基因来识别和描述与衰老和 AD 有关的模块,并 利用所有样本构建了一个独立于临床信息、年龄和性别的共表达网络。作者发现了15个共表达基因模块:







图2.模块特征基因表达值与各模块年龄,阶段以及AD的相关性



2、不同分组中的模特征基因(ME)表达值分析及差异基因分析



作者对不同分组样本之间的ME表达值进行了分析,结果显示,ME表达值存在组间差异。在AD与其他组别的比较中







图3.ME表达值跨样本分析 样本分为:年轻(绿色)-老化(黄色)-AD (蓝色)。



随后,作者对不同分组中的差异表达基因(DEGs)进行了模块映射,绘制了年轻与老年、年轻与老年与老年与AD之间的上下调DEGs重叠图






图4.DEGs上下调结果



此外,作者还对男女之间的ME表达差异进行了探究,研究发现







附图3.ME表达值跨样本分析(附加性别分组)



3、细胞型特异基因与模块的重叠



通过针对细胞型特异基因的分析,作者发现:







表1.细胞类型特异基因和模块之间的重叠



4、在多个GEO数据集中进行(module preservation analysis)模块保存分析



作者在这里使用利用 GSE1297、 GSE36980、 GSE84422、 GSE29378(包括 CA1和
CA3)和神经元丰富样本(GSE28146、
GSE5281)进行模块保存分析(用于验证WGCNA分析结果的迁移性,类似机器学习中的验证集),并使用Zsummary进行模块保存评分。







图5.利用海马数据集进行模块保存分析(Zsummary评分)



5、利用DAVID数据库进行GO基因富集分析



作者利用DAVID对生物过程和 KEGG 通路进行了功能富集分析。







表2.GO富集和KEGG通路与衰老及AD关联模块分析







附图4.不同分组的少突胶质细胞M1模块基因表达



6、基因表达定位到人蛋白质相互作用网络的图论研究



作者将不同分组的基因表达与PPI网络结合,得到加权的PPI网络。综合PPI网络用来确定交互作用以及关系的测量。只有关系边界介于2000和 adj p 值0.05之间的相互作用才被认为是改变的相互作用。并绘制了老化和AD的上下调基因子网络。




基于节点度,作者识别了老化和AD的PPI子网络中的枢纽基因及其相互作用。







图6.与衰老和 AD 相关基因的表达谱。(a)星形胶质细胞标记物、(b)神经保护基因(VEGFA、 HIF1A、 PIN1、 BDNF 和
ATXN1)、(c)14-3-3蛋白、(d) PRKC 亚型、(e) ephrin 受体、(f)突触和肌动蛋白细胞骨架基因(EGR1、
CDC42、 RAC1、 SNAP25和 SST)的折叠变化。Foldchange的变化基于年轻组的表达。




小结


这篇文章看上去很复杂,但如果了解了WGCNA以及PPI的相关分析方法后就会发现文章本质上并没有什么做起来的难点。作者通过一个数据库构建了基因共表达网络后,对不同分组中的ME表达进行了分析,随后将细胞型特异性和ME相关联,在多个GEO数据集中验证模块保存。随后作者使用DAVID数据库对基因表达进行富集分析,并根据既往文献结果进行论述。除此之外,作者还通过基因表达定位的PPI互作网络进行深入探究,使用R中的igraph包进行不同分组之间基因的关联进行评分度量,指示了部分AD与衰老之间的基因差别及对于发病机制的可能贡献,并同样依据既往的文献进行了进一步的讨论。
发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容