2022 06-29 KEGG富集分析从未如此简单 考虑到很多做实验的小伙伴对很多生物信息学概念不是很了解,受实验小白的委托,我给大家写了一个非常简单的工具:KEGG富集分析KEGG是干嘛的捏?我这么跟你说吧:人类的七千多个基因组都是有已知功能的,KEGG把这七千多个基因分成了300个类,就是我们通常说的kegg通路;比如,我现在做了个实验,发现某细胞系里面的两万个基因里面有300个基因变化了,那这300个基因会涉及到KEGG数据库的哪几个通路?这... 阅 读 全 部 >
2022 06-28 2022你必须要知道这些机器学习和数据科学的8大IDE,快来看看 如果您是数据科学家或机器学习工程师,那么您应该熟悉最高效的机器学习 IDE。IDE(集成开发环境)是 允许软件开发人员更轻松地编写、测试、调试和使用代码的工具。它的其他用途还有代码验证、文本编辑器、语法突出显示、补全、上下文建议、调试工具、方法和类规范、资源管理以及轻松访问帮助。IDE 通常具有广泛的功能集合。因此,它们也有利于数据科学编程。它们使程序员的生活变得更加轻松。...阅读全文>&... 阅 读 全 部 >
2022 06-28 神图-多组学通路富集的联合比较 使用Perseus软件进行1D和2D annotation enrichment分析某天,小编在某篇蛋白组学文献中看到这么一个分析,称为2D annotation enrichment的方法。作者使用2D annotation enrichment比较了自己的蛋白组数据集和先前研究中蛋白组数据集的蛋白表达的差异,并将这种差异关联到富集的通路上进行比较,以阐述二者的一致性和区别。图B是2D...阅读... 阅 读 全 部 >
2022 06-28 STRING:蛋白相互作用数据库的使用 昨天我们介绍了一些网络分析当中用到的一些基础的知识(相互作用网络分析基础 )。对于基因组数据分析而言的话,我们能用到网络分析的就是蛋白相互作用分析(protein-protein ineraction, PPI)分析了。蛋白相互作用分析的数据库有很多,至于为什么选择STRING,还是在于其强大的可视化,以及自定义功能。这样我们可以得到数据结果的同时,还可以得到相对好看的图。下面我们就来介绍一下ST... 阅 读 全 部 >
2022 06-28 大牛带你复现STRING数据库构建PPI,cytoscape软件筛选hub基因 你还在为找不到课题方案而焦虑吗,复现一篇论文吧!你还在为找不到研究思路而苦恼吗,复现一篇论文吧!你还在为找不到数据方法而悔恨吗,复现一篇论文吧预计阅读时间4分钟。。。。。刚来的小伙伴不要慌了哈,小助理选的一直是同一篇论文只不过用的是不同方法进行复现一千种方法练一次不如一种方法练一千次进步的第一步就是敲下...阅读全文>>... 阅 读 全 部 >
2022 06-27 干货篇|代谢组与微生物联合分析实战 微生物组测序 (主要指扩增子测序、全长扩增子测序与宏基因组测序)可提供细菌构成、基因丰度和功能性信息,可以解决“who is there”(那儿有谁)和“what are they doing”(在干嘛)的问题。而代谢组学是研究生物体中代谢产物变化的科学,可以解决“what have really happened”(究竟发生了什么)的问题。生物科学研究过程复杂,单独和片面的单一组学无...阅读全... 阅 读 全 部 >
2022 06-27 几种常见的数据标准化的方法总结! 一、标准化在进行数据分析时,数据具有单位是非常常见的,比如说GDP可以以亿作为单元,也可以以百万作为单位,那么此时就会出现由于单位问题导致的数字大小问题;这种情况对于分析可能产生影响,因此需要对其进行处理,但是处理的前提是不能失去数字的相对意义,即之前数字越大代表GDP越高,处理后的数据也不能失去这个特性。也或者计算距离,数字1和2的距离可以直接相减得到距离值为1; 另外一组数...阅读全文>... 阅 读 全 部 >
2022 06-27 从另一个视角看 R 语言的方言 Tidyverse 从另一个视角看 R 语言的“方言” Tidyverse,以及 RStudio 对 Tidyverse 的提倡。作者简介作者 Norm Matloff 为 UC Davis 计算机科学教授(曾任 UCD 统计学教授)。中文翻译及投稿至 COS 经过作者 同意 [1] 。文中的“我”为作者视角,但译文中存在的任何不妥之处当然很可能是由译者引入的,还望读者不吝 赐教 [2] 。...阅读全文>&g... 阅 读 全 部 >
2022 06-27 R语言自然语言处理:关键词提取与文本摘要(TextRank) 作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:[email protected]关于提取关键词的方法,除了TF-IDF算法,比较有名的还有TextRank算法。它是基于PageRank衍生出来的自然语言处理算法,是一种基于图论的排序算法,以文本的相似度作为边的权重,迭代计算每个文本的TextRa... 阅 读 全 部 >
2022 06-26 3分钟搞定GO/KEGG富集分析 在进行差异基因表达分析时,得到显著差异基因后,接下来就需要分析这些基因参与了哪些功能,常见的就是GO功能注释和KEGG通路富集分析,今天为大家介绍在线分析工具的使用——DAVID与KOBAS 3.0。DAVID是一个生物信息数据库,其整合了生物学数据和分析工具,为大规模的基因或蛋白列表提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。目前DAVID数据库主要用于差异基因的功能和通路...... 阅 读 全 部 >