2022
06-04
06-04
30 天学会R DAY 16:R语言数据整理大总结
在利用R语言统计分析之前,建议诸位复习数据清洗和整理方法,打好基础!今天,我着重对定量定性数据的转换功能进行总结,并推出tidyverse系列包供大家了解。1、 数值变量数据转为分类变量数据数值变量数据经常要转换为分类变量,由于本系列课程分类变量的转换,分散在各处,今天进行汇总。常见的方法如下:# 先读取数据集t1<-read.csv("elder1.csv")...阅读全文>>... 阅 读 全 部 >
R语言中,apply族函数是非常重要的函数,它在很多场景下,可以代替循环语句,简化程序写作过程,实现高效的统计分析,因此我们称之为批量处理函数。利用apply族函数可将某函数作用到一系列数据对象上,包括标量、向量、矩阵、多维数组、数据框、列表。我们可以同时纳入多个向量、数据库、列表、变量,进行变量的转换、统计描述。 此外,apply函数另外一个优势是它可以批量开展自编或者系统自带函数的运...阅读...
在所有计算机语言中,条件和循环语句占据着极其重要的地位,在统计软件比如SAS,条件语句在数据整理中的地位也举足轻重。R语言高级编程,条件和循环语句也类似如此。作为初级教程,今天我们就两语句在数据整理做简单的介绍。一、条件语句条件语句,最常见的是 if语句。If语句常见的形式有简单的ifelse 语句 和复杂的if –else if-else语句1. ifelse 语句...阅读全文>>...
缺失值是数据中普遍存在的现象,信息无法获取、遗漏、异常值都有可能造成数据的缺失。缺失值的存在会影响数据分析,导致结果存在偏差。R语言中,缺失值用NA和NaN表示,最常用的是用NA符号表示该数据遗失、不存在或异常。开始之前,我们先读入elder1、elder2这两个文件elder1<-read.csv("elder1.csv")elder2<-re...阅读全文>>...
日常数据整理需要添加变量,对变量进行计算转化。本章将给大家介绍在数据集对原变量进行计算并添加变量及对原变量的数据进行转化。开始之前,我们先读入elder1、elder2这两个文件elder1<-read.csv("elder1.csv")elder2<-read.csv("elder2.csv")一、添加变量数据集$新变量<-...阅读全文>>...
在数据进行前期处理中经常会涉及到数据集的合并,变量名、变量属性的更改及变量的排序,这一章就这四个方面给大家做一下简单介绍。开始之前,我们先读入elder1、elder2这两个文件elder1<-read.csv("elder1.csv")elder2<-read.csv("elder2.csv")一、数据集合并rbind(数据集1,...阅读全文>>...
当我们只需要对数据集中的部分数据进行分析,就需要用的数据的提取,这是日常最常用的命令。开始之前,我们先读入elder1这个文件elder1<-read.csv("elder1.csv")dim(elder1) #显示几行几列[1] 5846 12 显示5846行,12列一、 数据提取1. 子集的提取(行的提取)数据集子集提...阅读全文>>...
一、 工作空间工作空间,意味着,所有R的程序文件、数据集、其他相关资料都保存在某一个文件夹下面,十分方便提取。在一个R语言程序结束后,工作空间可以保存它的映像,在下次启动R时,该工作空间,包括历史代码就会自动重新加,非常方便。但没次使用的包需要重新加载。1.设置工作空间方法一,采用setwd()语句,设置工作空间,设置的文件夹需事先在硬盘中建立,R语言无法创建新的文件夹。...阅读全文>&g...
R语言主要分析的对象是数据集,R语言数据集主要是向量、矩阵、数据框、列表、数组等,我们主要介绍前4种。前面2文已经进行了4种对象的介绍,现在本文将4种对象的程序方法进行进一步总结和凝练。一、is和as系列函数is 和as系列函数涉及不同类型数据和对象的鉴定和转换。我们经常在R语言编程过程中需要了解某一种数据的类型,也可能进行转换方便计算,所以诸位要熟悉他们。is系列是判断某一个...阅读全文>...
tidyr包 用来处理宽数据和长数据,用来进行字符串变量的拆分和合并,在医学大数据领域用的较多,有兴趣的朋友可以了解下。本文将演示tidyr包中下述四个函数的用法:1. gather—宽数据转为长数据。2. spread—长数据转为宽数据。3. unit—多列合并为一列4. separate—将一列分离为多列tidyr包安装及载入i...阅读全文>>...