title: "noteDay1-2"
output: html_document
date: "2023-09-07"
##ctrl+alt+i
##R markdown语法快捷键
2.1 向量生成
2.1.1 用c()逐一放到一起
c(1,2,3,4,5)
## [1] 1 2 3 4 5
#字符串记得加引号哦
c('a','b','c','d')
## [1] "a" "b" "c" "d"
2.1.2 连续数字用冒号':'
1:8
## [1] 1 2 3 4 5 6 7 8
2.1.3 重复rep()、生成规律数字seq()、生成随机数rnorm()
rep('WY',times = 5) #规范写法
## [1] "WY" "WY" "WY" "WY" "WY"
rep('WY',5) #熟练后可以简写提高效率
## [1] "WY" "WY" "WY" "WY" "WY"
seq(from = 3,to = 15,by = 3) #规范写法
## [1] 3 6 9 12 15
seq(3,15,3) #简写
## [1] 3 6 9 12 15
rnorm(n=3) #规范写法
## [1] -1.6723864 -0.6788951 0.8172239
rnorm(3) #简写
## [1] -0.8698553 1.0545989 -0.4180826
#没记错的话,小洁老师课堂里提到过,随机数大家每次运行的结果极大概率是不相同的,但是通过一定操作可以让出现过的随机数重现(尽管大部分情况没啥必要)。
#课外拓展:现在所谓的随机数其实都是‘伪随机数’,真正的随机数可能需要量子计算机问世之后才会出现。因此通过一些特定代码,保留“随机状态”,就能使随机数重现啦。
2.1.4 通过组合之后可以生成更复杂的向量
paste0(rep('WY',times = 5),1:6) # 2.1.2 + 2.1.3 规范写法
## [1] "WY1" "WY2" "WY3" "WY4" "WY5" "WY6"
paste0('WY',1:6) # 学习了循环补齐后的简写
## [1] "WY1" "WY2" "WY3" "WY4" "WY5" "WY6"
2.2 对单个向量进行操作
2.2.1 赋值
x <- c(1,2,3,4,5) #规范的赋值符号,这辈子可能就敲两次(一次课上,一次在这)
x = c(1,2,3,4,5) #简写
(x = c(1,2,3,4,5)) #赋值加输出
## [1] 1 2 3 4 5
x = c(1,2,3,4,5);x #多行代码写一行(不止是赋值和输出哈)
## [1] 1 2 3 4 5
2.2.2 简单数学运算
#加减乘除、一些针对数字类型的函数都可以
x+1
## [1] 2 3 4 5 6
log2(x)
## [1] 0.000000 1.000000 1.584963 2.000000 2.321928
sqrt(x) #开方
## [1] 1.000000 1.414214 1.732051 2.000000 2.236068
2.2.3 根据条件进行判断,生成逻辑值向量
#以前听一位计算机老师说过,逻辑判断是所有编程语言的核心(后面的筛选就是建立在这个基础上)
x > 3
## [1] FALSE FALSE FALSE TRUE TRUE
x == 3
## [1] FALSE FALSE TRUE FALSE FALSE
2.2.4 初级统计
#一些基础的函数,就算记不住百度下或者help下就行
max(x) #最大值
## [1] 5
min(x) #最小值
## [1] 1
mean(x) #均值
## [1] 3
median(x) #中位数
## [1] 3
var(x) #方差
## [1] 2.5
sd(x) #标准差
## [1] 1.581139
sum(x) #总和
## [1] 15
length(x) #长度(返回数字,向量元素个数)
## [1] 5
# 这四个函数中文上都与重复有点关联,因此放一起记忆
x = c(1,1,1,2,2,2,2,3,3,3,3,4,4,4,5)
unique(x) #去重复(以这边的x为例,返回数字,长度发生变化,这取决于你向量中非重复元素的个数)
## [1] 1 2 3 4 5
## [1] 1 2 3 4 5
duplicated(x) #对应元素是否重复(返回逻辑值,长度不发生变化)
## [1] FALSE TRUE TRUE FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE FALSE
## [13] TRUE TRUE FALSE
## [1] FALSE TRUE TRUE FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE
## [12] FALSE TRUE TRUE FALSE
table(x) #重复值统计(每个元素的出现次数会一一对应)
## x
## 1 2 3 4 5
## 3 4 4 3 1
## x
## 1 2 3 4 5
## 3 4 4 3 1
2.2.5 默认思想
#老师是以sort()为例子
sort(x)
## [1] 1 1 1 2 2 2 2 3 3 3 3 4 4 4 5
sort(x,decreasing = F) # decreasing 降序,默认情况下的完整写法
## [1] 1 1 1 2 2 2 2 3 3 3 3 4 4 4 5
sort(x,decreasing = T) # decreasing的参数可以修改成T,这样就是升序啦
## [1] 5 4 4 4 3 3 3 3 2 2 2 2 1 1 1
##2.2.6 能用函数搞定的事情,就别自己数
# 一道课堂练习题:生成向量,内容为:"student2" "student4" "student6" "student8" "student10" "student12" "student14"
#解题思路:
#1.字符-数字的交联想到paste0() #2.观察:字符均为‘student’,使用rep(),重复次数利用函数length();数字具有一定规律,想到seq()
#顺理成章写出
a = seq(2,14,2)
paste0(rep('student',length(a)),a)
## [1] "student2" "student4" "student6" "student8" "student10" "student12"
## [7] "student14"
#以下仅个人理解:代码不是越短越好,因为大项目都需要合作,你的代码可能会给很多人看,当然也不需要过分详细。
paste0('student',seq(2,14,2)) #最简代码(循环补齐)
## [1] "student2" "student4" "student6" "student8" "student10" "student12"
## [7] "student14"
##paste和paste0的区别
#这边直接复制的Help文档,paste默认两个元素之间的连接存在空格(这个参数可以修改),paste0则无。
##两个向量长度不一致时,便会发生循环补齐
x = c(1,3,5,6,2)
y = c(3,2,5)
x == y
## Warning in x == y: longer object length is not a multiple of shorter object
## length
## [1] FALSE FALSE TRUE FALSE TRUE
#上述这种情况便会发生循环补齐,y = c(3,2,5)会变成y = c(3,2,5,3,2)
#返回与较长向量相同元素个数的逻辑值哦(这边就是5个)
#循环补齐可以在一定程度上简化代码,上文已经提到,这边就不写了
##2.3 对两个向量的操作
x = c(1,3,5,1)
y = c(3,2,5,6)
# 1.比较运算,生成等长的逻辑向量
x == y;y == x #两者等价
## [1] FALSE FALSE TRUE FALSE
## [1] FALSE FALSE TRUE FALSE
# 2.数学计算
x + y #一一对应相加
## [1] 4 5 10 7
# 3.连接
paste(x,y,sep=",")#由于数字之间不存在分隔符号的话容易存在混淆,因此这边一般使用paste而非paste0
## [1] "1,3" "3,2" "5,5" "1,6"
# 4.交集、并集、差集
x = c(1,3,5,6,2)
y = c(3,2,5)
intersect(x,y)#交集
## [1] 3 5 2
union(x,y)#并集
## [1] 1 3 5 6 2
setdiff(x,y) # 差集,x里有,y里没有的
## [1] 1 6
setdiff(y,x) # 差集,y里有,x里没有的
## numeric(0)
# 5.补集(小洁老师的课堂作业)
#补集的定义:setdiff(全集,交集)
setdiff(union(x,y),intersect(x,y)) #一组合就完事啦
## [1] 1 6
# 6.重点 %in%
x %in% y #x的每个元素在y中存在吗,返回的是逻辑值
## [1] FALSE TRUE TRUE FALSE TRUE
y %in% x #y的每个元素在x中存在吗
## [1] TRUE TRUE TRUE
##2.4 向量筛选(取子集)
##2.4.1 通过逻辑值
x = 8:12
x[x == 10]
## [1] 10
x[x < 12]
## [1] 8 9 10 11
x[x %in% c(9,13)]
## [1] 9
##2.4.2 根据位置
x = 8:12
x[4]#要第4个
## [1] 11
x[2:4]#要2-4个
## [1] 9 10 11
x[c(1,5)]#要第1个和第5个
## [1] 8 12
x[-4]#不要第4个
## [1] 8 9 10 12
x[-(2:4)]#不要第2-4个
## [1] 8 12
##2.4.3 xx %in% y可以帮助你从一堆信息中获取你想要的
##2.5修改向量中的某个/某些元素:取子集+赋值
x = 8:12
x[4] = 40 #改一个元素
x[c(1,5)] <- c(80,20) #改多个元素
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。