收藏|零基础学R之数据结构,标量、向量、矩阵、数组、数据框和列表
卖萌控的博客
点击这里进入电脑版页面!体验更好
收藏|零基础学R之数据结构,标量、向量、矩阵、数组、数据框和列表
2021-9-8 萌小白
预计阅读时间4分钟


R拥有许多用于存储数据的对象类型



包括标量、向量、矩阵、数组、数据框和列表



它们在存储数据的类型、创建方式、结构复杂度,



以及用于定位访问其中个别元素的标记等方面均有所不同。



下图是一张R语言数据结构图。






文章目录



快速检索,先看看哪部分感兴趣,查漏补缺~




向量



1.定义



用于存储数值型、字符型或逻辑型数据的一维数组



向量中的元素类型必须全为数值型或者字符型或者逻辑型。



向量中的单个元素称为标量,属于特殊的向量。



向量是R语言中最基础,也是最重要的数据类型。



2. 向量类型:



数值型向量:向量中的元素全为数字



字符型向量:向量中的元素既可以全为字符,也可以包含数字,但是这里的数字是字符串,并不是数值。



逻辑型向量:向量中的元素只有两种TURE或者FALSE



3. 向量的创建



数值型向量的创建









矩阵



1. 定义:




2. 矩阵的创建:






3. 矩阵下标的使用:












数组



定义:







数据框



1. 定义:




数据框是R中最常见的数据结构之一,一般数据处理都是基于数据框。






选取数据框的元素



数据框中常见的元素选择方法有三种



方法一: 和矩阵下标的使用一样,不再过多介绍。



方法二:变量名筛选






方法三:

















因子



在我们处理的数据中,通常将数据框中的列(成分)也称为变量或者属性,而行称为观测或者示例,在R中把数据框的列叫做变量更普遍。变量是统计学中的名词,在数据框中变量既可以是向量,也可以是因子。变量通常有三种类型,名义型(类别型)、有序型和连续型变量。



变量类型



名义型变量:性别有男女之分,体型有胖瘦之别,这些都是名义型(类别型)变量



有序型变量:癌症的分期有早期、中期和晚期,变量中的值有顺序之分,称为有序变量



连续型变量:人的体重就是连续型变量,表现为一定范围内的任意值,与数值型向量等价。



名义型变量和有序性变量在R中统称为因子






列表



定义:










处理对象的通用函数






数据转换






特殊数据








发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容