2022 06-03 R语言数据处理方法~小结 文章目录1. R自带函数2. reshape2数据重构3. dplyr4. tidyr5. 字符串处理1. R自带函数1.1 转置使用函数t()可对一个矩阵或数据框进行转置,对于数据框,行名将变成变量(列)名。数列array进行维度转换 aperm1.2 整合数据aggregate在R中使用一个或多个by变量和一个预先定义好的函数来折叠(collapse)数据。调用格式为:其中x是待折叠的数据对象... 阅 读 全 部 >
2022 06-03 在线绘制PCA图和Heatmap,一键出图 主成分分析(PCA),是考察多个变量间相关性的一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。图1 主成分分析得分图在生物医学领域,生物样本存在于一个复杂的系统,容易受各种环境因素及自身基因、代谢等因素的影响,变量非常多。PCA可以从复杂的数据中找到最主要的元素,去除...阅读全文>... 阅 读 全 部 >
2022 06-03 技能|如何做出高颜值的SCI论文配图? 不少科研工作者,包括在读的博士生、研究生等可能都有这样的体会:千辛万苦得来的实验结果,不知道该如何展现给别人?曾经有位论文审稿人在自己的博文中就写道:“我审稿时看稿件的顺序是题目、摘要、图表、前言、参考文献和正文”。可见论文中图片的质量是非常重要的,处理一张图可能会花费大量的时间,图片质量的好坏一定程度上决定了论文能否被录用。而反过来,仔细分析大牛们的文章,不难发现,这些...阅读全文>&g... 阅 读 全 部 >
2022 06-03 标签糊成一坨?如何为图表添加“帅帅”的指引线? 在Seurat的输出结果中,有一个展示表达量变化最大10个基因的图表令人印象深刻,如下图。关于该图表的具体内容参考之前 《单细胞转录组学习笔记之Seurat 3.0(一)》 一文。那么,常规散点图能不能画成这样效果? 如果仍然使用针对单细胞数据高度定制的Seurat,显然是非常麻烦的。而使用ggplot2绘制类似这样的多标签图表,又容易出现“数据标签重叠”、超出绘图区域的标签“显示不全“和邻近数据... 阅 读 全 部 >
2022 06-03 玉米RNA-seq测序数据差异基因分析 huanying今天给大家分享一个非常棒的玉米转录组的流程分析。原文作者是cxge,首发于omicshare论坛,阅读原文可跳转至本文的帖子哦~软件及参考基因组BWA, Samtools, Hisat2, HTseq, gffcompare, Stringtie, Ballgown,RB73-V3, B73-V4(Enzampl database)流程protocol首先从原始...阅读全文>... 阅 读 全 部 >
2022 06-02 30 天学会R DAY 14:R语言必学包dplyr R语言非常讲究数据的整理,我们在7-13天的R语言学习内容中,着重都是关于R语言的整理,各种方法对数据进行整理,查看,对变量进行转换。dplyr包,主要也用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度。这个包对数据处理的方式相对之前的方法,更加简单,是医学数据分析必须要掌握的包。dplyr包存在着上百个函数来帮助进行数据的整理,由于篇幅的关系,本...阅读全文&... 阅 读 全 部 >
2022 06-02 甲基化分析实战,将你的数据用在刀刃上! 2020年4分+甲基化生信文章复现领悟生信文章逻辑之美,小伙伴们大家好呀,我是风间琉璃。上一周我们品读了2020年10月发表在《Frontiers in oncology》杂志上的文章“ A Novel Promoter CpG-Based Signature for Long-Term Survival Prediction of Breast Cancer Patients”。作者使用CHAM... 阅 读 全 部 >
2022 06-02 国自然基金申报书万能模板鉴赏,春交标书帮你先点评 新年第一问,你的标书写好了咩!!!马上3月20号就要结束申报了标书写的如何呢看大家过年都在埋头写写完我帮你看看吧临阵磨枪不亮也光赶在Deadline前交标书可以在联系小助理哦(*^__^*)以下是国自然申报书写万能模板 (来源网络) 报告正文A(一)立项依据与研究内容1、项目的立项依据XXX疾病及其研究进展XXXX疾...阅读全文>>... 阅 读 全 部 >
2022 06-02 收藏|零基础学R,数据框-单表操作来啦 小助理说:今天是你学习R的第4天,每一串代码都有它故事,从bug制造机到修改高手,你的每一步都是在成长。预计阅读时间3分钟文章目录1 按行操作1. 1 过滤1.2 排序1.3 添加新行2 按列操作2.1 过滤2.2 添加新列2.3 变量重命名3 管道操作通常我们将EXCLE表格或者分隔符分割的文本文件导入R中进行处理,这些数据在R语言称为数据框也可以叫做数据集,数据框中的行、列也分...阅读全文&... 阅 读 全 部 >
2022 06-02 宏基因组分析-基于binning 一、介绍宏基因组 ( Metagenome) 指特定环境下所有生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因。一般从环境样品中提取基因组DNA, 进行高通量测序,从而分析微生物多样性、种群结构、功能信息、与环境之间的关系等。宏基因组的分析目前主要包括三种方法:基于组装分析、基于reads分析、基于bin分析。下面我们介绍基于bin的分析方法。二、分析流程...阅读全文>>... 阅 读 全 部 >