前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Day6-李泽平-R包学习

Day6-李泽平-R包学习

原创
作者头像
用户11040033
发布2024-03-28 09:58:16
610
发布2024-03-28 09:58:16

R包

一、安装和加载R包

(一)镜像设置

options("repos"= c(CRAN="HTTPS://mirrors.tuna.tsinghua.edu.cn/CRAN/")) options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")

(二)安装

install.packages(“包”)或者BiocManager::install(“包”)

(三)加载

使用library或者require

示例

install.packages("dplyr") library(dplyr)

二、dplyr 五个基础函数

(一)mutate().新增列

代码语言:R
复制
> test <- iris[c(1:2,51:52,101:102),]
> mutate(test, new = Sepal.Length * Sepal.Width)
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species   new
1            5.1         3.5          1.4         0.2     setosa 17.85
2            4.9         3.0          1.4         0.2     setosa 14.70
51           7.0         3.2          4.7         1.4 versicolor 22.40
52           6.4         3.2          4.5         1.5 versicolor 20.48
101          6.3         3.3          6.0         2.5  virginica 20.79
102          5.8         2.7          5.1         1.9  virginica 15.66

(二)select(),按列筛选

1、按列号

示例1

代码语言:R
复制
> select(test,1)
    Sepal.Length
1            5.1
2            4.9
51           7.0
52           6.4
101          6.3
102          5.8

2、按列名

代码语言:R
复制
> select(test,Sepal.Length)
    Sepal.Length
1            5.1
2            4.9
51           7.0
52           6.4
101          6.3
102          5.8

(三)filter()筛选行

代码语言:R
复制
示例
> filter(test, Species == "setosa")
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa

(四)arrange(),按某1列或某几列对整个表格进行排序

示例

代码语言:R
复制
> arrange(test, Sepal.Length)#默认从小到大排序
  Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
1          4.9         3.0          1.4         0.2     setosa
2          5.1         3.5          1.4         0.2     setosa
3          5.8         2.7          5.1         1.9  virginica
4          6.3         3.3          6.0         2.5  virginica
5          6.4         3.2          4.5         1.5 versicolor
6          7.0         3.2          4.7         1.4 versicolor

(五)summarise():汇总

代码语言:R
复制
> summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差
  mean(Sepal.Length) sd(Sepal.Length)
1           5.916667        0.8084965

三、dplyrl两个使用技能

(一)管道操作 %>%

示例

代码语言:R
复制
> test %>% 
+     group_by(Species) %>% 
+     summarise(mean(Sepal.Length), sd(Sepal.Length))
# A tibble: 3 x 3
  Species    `mean(Sepal.Length)` `sd(Sepal.Length)`
  <fct>                     <dbl>              <dbl>
1 setosa                     5                 0.141
2 versicolor                 6.7               0.424
3 virginica                  6.05              0.354

(二)count统计某列的unique值

示例

代码语言:R
复制
> count(test,Species)
     Species n
1     setosa 2
2 versicolor 2
3  virginica 2

暂时先学习这么多


四、参考来源

微信公众号生信星球

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • R包
    • 一、安装和加载R包
      • (一)镜像设置
      • (二)安装
      • (三)加载
    • 二、dplyr 五个基础函数
      • 三、dplyrl两个使用技能
        • 四、参考来源
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档