数据框约等于表格 数据框不是文件 每一列只允许一种数据类型 一列就是一个向量 一个向量被视为一个整体 可以有重复值
#(1)用 c() 结合到一起
#(2)连续的数字用冒号“:”
#(3)有重复的用rep(),有规律的序列用seq(),随机数用rnorm()
#(4)通过组合,产生更为复杂的向量。
paste0(rep("x",times=3),1:3)
"x1" "x2" "x3"
c不建议作为向量名称 因为c是生成向量的函数
空格 - 都是特殊字符 空格用_代替
向量中的每个数据 称为元素
重复:从左往右第二次出现的元素 第一次出现的不算重复
max(x) #最大值
min(x) #最小值
mean(x) #均值
median(x) #中位数
var(x) #方差
sd(x) #标准差
sum(x) #总和
length(x) #长度
unique(x) #去重复
duplicated(x) #对应元素是否重复
table(x) #重复值统计
sort(x) 从小到大排序
sort(x,decreasing = T) 从大到小
两个向量的计算是等位 一对一的计算
paste0(a,b)=paste(a,b,sep = "")
intersect(x,y) xy的交集
union(x,y)xy的并集并去除重复
setdiff(x,y) 返回在x里面存在,y里面不存在的 字符型
x %in% y x里面的每个元素在y中是否存在(T,F) 是用x的一个元素在整个y里面比较 逻辑型
x == y 是x里面的元素与y一一对应进行比较
代码写在同一行要用;分开
[] 将TRUE对应的值挑选出来,FALSE删除
xx<1 将 x中x<1的取出 中括号里面是取逻辑值的语句
xn 将x中的第n个元素选中, -n去掉第n个, n是元素的下标 表示第几个。
n: x>7,1:5,c(1,4,5)
R语言里面所有的修改都要进行赋值
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。