数据结构与类型
数据类型
数值型(Numeric)
用于存储实数,包括整数和浮点数(即小数)。
numeric_var <- 3.14 # <-表示赋值操作,和=相同;numeric_var为变量名字;
numeric_var <- 2 # 整数,包括正整数、0、负整数
字符型(Character)
用于存储文本数据,即字符串
character_var <- "Hello, R!"
逻辑型(Logical)
又叫布尔值,用于存储逻辑值,即TRUE
或FALSE
,可以用T
或者F
来代替。
logical_var <- TRUE
复数型(Complex)
用于存储复数。
complex_var <- 2 + 3i
整数型(Integer)
用于存储整数。
integer_var <- 42L
因子型(Factor)
用于表示分类数据的有序或无序因子。
gender <- factor(c("Male", "Female", "Male", "Female"))
日期与时间类型
用于存储日期和时间信息,包括Date
、POSIXct
、POSIXlt
等类型。
date_var <- as.Date("2022-01-01")
datetime_var <- as.POSIXct("2022-01-01 12:30:00")
列表型(List)
用于存储不同数据类型的元素。
my_list <- list(1, "two", TRUE, c(1.5, 2.5))
这些数据类型提供了灵活的数据存储和处理方式,使得R语言适用于各种数据分析和统计任务。在R中,你可以使用函数class()
来检查对象的数据类型。例如,class(numeric_var)
将返回字符串 "numeric"。
数据结构
R语言中有多种数据结构,每种都适用于不同的数据处理和分析任务。以下是R语言中常见的数据结构:
向量(Vector)
向量是R语言中最基本的数据结构,其特点是所有元素必须是相同类型的。如果由不同的数据类型组成,则会强制修改为同一类型,通常为字符型
有两种类型的向量:数值型向量和字符型向量。
# 数值型向量
numeric_vector <- c(1, 2, 3, 4, 5)
# 字符型向量
character_vector <- c("apple", "orange", "banana") #索引的时候从0开始,即numeric_vector[0] 表示1
列表(List)
和向量不同,列表可以包含不同类型的元素,包括向量、矩阵、数据框等。
列表的元素可以是任何R对象。
my_list <- list(numeric_vector, character_vector)
矩阵(Matrix)
矩阵是一个二维的数据结构,可以包含相同类型的元素。
矩阵的元素通过行和列进行索引。
my_matrix <- matrix(c(1, 2, 3, 4, 5, 6), nrow = 2, ncol = 3)
数组(Array)
数组是多维的数据框,可以包含相同类型的元素。
数组可以看作是矩阵的推广,可以有更多的维度。
my_array <- array(c(1, 2, 3, 4, 5, 6), dim = c(2, 3, 1))
数据框(Data Frame):
数据框类似于表格,是一种二维的数据结构。
数据框中的列可以包含不同的数据类型,比如数值、字符、因子等。
my_data_frame <- data.frame(Name = c("Alice", "Bob", "Charlie"),
Age = c(25, 30, 22),
Score = c(90, 85, 95))
因子(Factor)
因子用于表示分类数据,具有固定的水平或类别。和向量相比,占用内存更小,特别是向量中的值数量很多,但值重复性高的情况下
gender <- factor(c("Male", "Female", "Male", "Female"))
表(Table)
表是一种用于存储统计摘要信息的数据结构,通常用于频数分布表。
my_table <- table(c("A", "B", "A", "C", "B"))
这些是R语言中常见的数据结构,选择合适的数据结构取决于你的数据和分析需求。
除非注明,文章均为原创,转载请以链接形式标注本文地址
本文地址:http://colorfulbiolife.com/baseability/r/%e6%95%b0%e6%8d%ae%e7%bb%93%e6%9e%84%e4%b8%8e%e7%b1%bb%e5%9e%8b/