首选是构造一份数据集 image.png 数据是excel存储,读取数据使用R包readxl中的函数read_excel() 读取数据 library(readxl) df<-read_excel...("20210910.xlsx") 删除行 library(tidyverse) df %>% rows_delete(tibble(var="AAA")) 设置因子水平 library...image.png 指定列大小写转换 df %>% mutate_at("var",toupper) 欢迎大家关注我的公众号 小明的数据分析笔记本 小明的数据分析笔记本 公众号 主要分享:1、R语言和
函数和参数图片写函数的函数functionjimmy 使用的代码...找到R包的使用规律R包的位置:CRANinstall.packages("tidyr")R包的位置:bioconducterBiocManager::install("ggplot2")R包的位置:githubdevtools...安装后加载library(stringr)require(stringr)library("stringr")#library() 检查包是否安装成功的唯一标准国内镜像# 清华镜像# http://mirrors.tuna.tsinghua.edu.cn...="http://mirrors.ustc.edu.cn/bioc/")已经安装的R包可以用::快速调用里面的函数pheatmap::pheatmap()常见疑问图片图片图片更新一个包:重新安装或者先删除后重新安装...require(stringr))install.packages("stringr")图片看看包里面有哪些函数ls("package:stringr")图片图片
生信技能树-数据挖掘课程笔记 函数与参数 #查看函数使用方法 ?...rep() 函数的帮助文档: 函数分为形式参数和实际参数 形式参数由函数作者指定,使用者输入实际参数时可省略实际参数 函数的自定义 #自定义函数 cal = function(a,b,c = 2){(a...相当于library(BiocManager)和install() R包安装常见问题 package not available R包名输入错误 安装命令使用错误 R语言版本与R包要求不符(极少情况)...R包过时,被作者删除 加载某一R包,报错提醒另一R包不存在 安装所需的依赖包 更新所有安装包 not writable / permission denied 权限问题,管理员方式打开Rstudio...require(stringr))install.packages("stringr") #载入stringr,若未安装,安装stringr #列出R包中所有的函数和数据 ls("package:stringr
我一直认为编程语言的能力取决于它的软件库,因此本文将着重介绍我经常使用的一些关于机器学习算法的 R 包和 Python 中的替代包。...即便如此,Python 的绘图功能已经趋于成熟了,如果你喜欢 ggplot 风格的代码,你可以尝试 Yhat 开发的 ggplot ;如果你倾向于绘制统计图,那么你可以使用 seaborn;如果你想体验一些更高级的功能...stringr -> nothing R 语言自带的字符串操作函数非常难用,每次当我需要处理字符串时,我都会做以下两件事: 向大神 Hadley Wickham 表示感谢 导入 stringr stringr...但是对于 Python 来说,它本身就能够非常快速地处理字符串数据,所以我们不需要类似于 stringr 的第三方软件包!...sqldf -> pandasql sqldf 是 SQL 用户在 R 中轻松操作数据的一个好方法。在我刚开始喜欢使用 R 语言的时候,我经常利用 sqldf 来处理数据。
为什么使用 Python 我喜欢用 Python 来处理机器学习问题的一个重要原因是 Python 吸取了 R 社区的优点,同时还将其进行了优化打包。...我一直认为编程语言的能力取决于它的软件库,因此本文将着重介绍我经常使用的一些关于机器学习算法的 R 包和 Python 中的替代包。...stringr -> re+string R 语言自带的字符串操作函数非常难用,每次当我需要处理字符串时,我都会做以下两件事: 向大神 Hadley Wickham 表示感谢 导入 stringr stringr...但是对于 Python 来说,它本身就能够非常快速地处理字符串数据,所以我们不需要类似于 stringr 的第三方软件包!...sqldf -> pandasql sqldf 是 SQL 用户在 R 中轻松操作数据的一个好方法。在我刚开始喜欢使用 R 语言的时候,我经常利用 sqldf 来处理数据。
stringr包是Hadley Wickham大神贡献的R包之一,主要用于字符串的处理。对于经常需要对数据进行预处理的分析人员来说,简直是一把“利器”,可谓是上能屠龙,下能剔牙。...其用法相比于R自带的函数,更加简单明了。stringr包在我工作中,是属于频繁使用的R包之一。简单的用法也是深入我心,强烈推荐使用该包进行字符串的预处理。...接下来,根据我在工作中使用到的stringr包的场景,介绍一下这些函数的用法。 字符拼接 场景:在读入csv或者xlsx格式文件时,根路径一般不一致,然后我一般使用全名路径。...#根路径wd 去空格 场景:在Excel中,使用查找筛选时,字符串后面的空格往往对结果无影响,但是在R中,却会出问题,所以在匹配之前,先将空格删除。...#大小写转换r.letter 检测 场景:常跟ifelse函数配合使用,对某一列字符串进行判断是否匹配。
清洗得当的数据是可靠分析的基础,而在R语言中,有许多强大而灵活的工具可以帮助我们高效完成数据清洗。本文将全面介绍R语言数据清洗的常见技巧,并配以具体的代码示例。...TIPS R语言数据清洗常用工具 1. Base R R语言自带的base包提供了许多内置函数用于数据清洗,例如is.na()、duplicated()等。...4. stringr stringr专注于字符串处理,适合清理文本数据。 5. 其他工具 根据需求还可以使用lubridate处理日期时间数据,janitor快速清理变量名等。...TIPS 使用示例 缺失值处理:缺失值处理是数据清洗的第一步。可以选择删除、填充或插值的方法。...data_unique % distinct() 修正异常值:通过计算分位数或使用业务规则修正数据中的异常值。
近期写R代码,经常用dplyr::case_when结合stringr::str_detect进行条件判断。...) 使用示例: 初始表tibble(fruit=stringr::fruit) 想实现字母a开头为’starts with a’,字母e结尾为’ends with e’ 等若干条件。...'(an)|(ch)','contains an or ch' ) 或者写在Excel里, 然后复制单元格,用conditions R...2. allCaseWhen走起 tibble(fruit=stringr::fruit) %>% mutate( category= allCaseWhen(fruit,...如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
(1)R包安装 按需索取,目的不是学会某个具体的R包,而是找所有R包使用的规律。 不需要安装所有的R包,需要哪一个,装哪一个。...例如:install.packages("stringr") 安装后需要加载,加载的时候加不加引号都可以, 两个都是加载,load是加载数据,library是加载R包 library()...require(stringr))install.packages("stringr") require(),library() 两个都是安装完R包之后的加载,但是library() 只是单纯的加载,而...R包不符 可能原因4:包过时了 2)是否更新 图片 3)加载A包,报错B包不存在 先安装B包,成功后再安装A包 4)依赖包的版本不够新 图片 更新一个包:重新安装,或先删除再重新安装 更新所有的包:update.packages...stringr这个包。
结构化数据可以使用关系数据库(RDBMS)存储,可以使用二维表来逻辑表达实现的数据(R和Python中的数据框类型数据)。...3 R与Python字符串函数 R语言中推荐使用stringr包里面的函数进行字符串处理,Python中有正则表达式库re和内置的字符串string包。...4 字符串函数--基于R R语言中自带的字符串函数操作起来非常难用,而且函数名字经常记不住,因此这里介绍stringr包,提供了大部分字符串处理函数(如果发现很难使用stringr包中函数实现,可以考虑使用...stringr包中函数按照是否使用正则表达式分为使用正则表达式函数和其他函数,函数参数中有pattern参数的则为使用正则表达式函数。...制定删除的位置,both:两端的空格都删除;left:删除左边的空格;right:删除右边的空格 text <- " Flash WorkingNotes \n\t\n"str_trim(text,
R包里自带的,无需赋值即可使用(不全是数据框哦)irisclass(iris)#顺便了解一下其他数据结构的内置数据heatmap(volcano)class(volcano)class(volcano)...#R包介绍3、R包镜像引自生信技能书使用镜像,加快R包的下载,不用从大洋彼岸去下载4、R包的安装与来源(1)CRAN网站(2)Bioconductor...网站(3)github# 低版本R语言备用的镜像:西湖大学,如果要使用记得去掉下一行代码的井号#options(BioC_mirror="https://mirrors.westlake.edu.cn/...sdlibrary(limma)browseVignettes("limma") #不是每个包都有ls("package:limma")5、R包的安装和使用逻辑引自生信技能书引自生信技能树练习题4-1#...6、R包如何使用——获取逻辑(1)快速查看帮助文档函数出自哪个包Description,Usage,Arguments,Examples(2)找R包介绍页面R包名字加oackage,在国际版Microsoft
1.R包的安装图片option是设置图片1.R包安装和使用的逻辑:安装包-加载包-使用包里的函数2.用library()检查是否安装成功——唯一标准3.已经安装的包用::快速调用里面的函数4.常见疑问1...)没有error就忽略2)package not available包名写错;命令写错;R语言版本和包要求版本不同;包过时被剔除图片3)是否更新:建议选n,除非一直报错;不想回答安装命令参数:update...=F, ask=F4)加载A包,报错B包不存在:缺啥补啥;当依赖包的版本不够高,更新包:重新安装或先删除后安装,更新所有包:update.packages()5)网络问题 connection url...require(stringr))install.packages("stringr")6.R包如何使用-获取帮助1) 快速查看函数帮助文档?...sd 2)找R包介绍页面3)browsevignettes('') 在线教程7.补充常见的R语言符号图片中括号前是数据框或者矩阵两个中括号前是列表library括号里的是包文件名称出现在代码里,必然在实际参数的位置上带引号
." ### 6.字符删除 x ## [1] "The birch canoe slid on the smooth planks." str_remove(x," ")#删除第一个空格 ## [1]...要按顺序排列数据框,请使用arrange()函数。...R语言中,select函数用于选择数据框中的列,可以使用列名或者向量来指定要选择的列。...,str_to_lower()函数是由stringr包提供的函数,而tolower()函数是R的基础函数之一。...可以使用可选参数n来指定要显示的行数。
作为同属于tidyverse 大家庭的一份子,stringr 也为R 的一般字符串处理,献上了一份自己的力量!...(其实R 也提供了nchar 的方法) 拆分与组合 拆分 需要注意的是,提取拆分后的元素需要使用 [[]] 双括号选择。...> length(x2) [1] 8 合并 collapse 设定合并向量中内容使用的分隔符。...str_c(x2,1234,sep = "+") sep 参数设定某两个分隔的元素连接,使用某符号。...str_sort(x2) 空白处理 stringr::str_trim(string, side) 返回删去字符型向量 string 每个元素的首尾空格的结果,可以用 side 指定删除首尾空格("both
╮(╯▽╰)╭ ” Hadley Wickham,一个R圈如雷贯耳的人物,仅仅列举几个他开发的R包你就能知道他的分量了:ggplot2、dplyr、stringr、plyr、purrr、lubridate...……如果作为R的使用者你说自己与Hadley无关,那几乎只有一种原因——你用着他写的包却不自知。...(为什么我突然想到了谢耳朵……)Charlotte在DataCamp.com上了一门教大家如何使用stringr包的课程(讲得很好,强烈推荐),而在这门课的最后,Charlotte自然近水楼台先得月,对...写了这个包,把base R中的正则表达式函数全都用统一的名称给命名了一遍,它也就成了stringr的基础。很自然的,在第二次上这门课的时候,我就使用stringr教学生了。...你在使用其它tidyverse包的过程中也许已经接触了这些规范。我推崇这些规范,是因为他们真的在你的工作中起作用。就stringr而言,我认为以下两种这样的“规范”是最值得一提的。
可以认为sqldf是我的R”辅助轮子”。 sqldf让你在R数据框上执行SQL查询。来自SAS的人会发现它非常熟悉,任何具有基本SQL技能的人都可以轻松的使用它—sqldf使用SQLite语法。...3. plyr 当我第一次使用R时,我用基本的控制运算来操纵数据(for, if, while, etc.)。我很快知道这是一个业余的做法,并且有更好的方法去实现。...我发现R基础库的字符串功能使用起来非常困难和麻烦。...Hadley Wickham编写的另一个包, stringr,提供了一些非常需要的字符串运算符。很多函数使用那些做基础分析时不常用的数据结构。 stringr 非常易于使用。...它很容易使用,可以进行监督学习或者无监督学习,它可以与许多不同类型的数据集一起使用,但最重要的是它的高效率!这是它在R中的使用方法。
数据信息检索可以看到GSE28623是 芯片数据,因此可以使用GEOquery包下临床信息,然后从网页下载 原始的基因表达数据用 R 标准化处理使用GEOquery包下载 临床 数据BiocManager...limma::backgroundCorrect(x, method = "normexp") %>% limma::normalizeBetweenArrays(method = "quantile")删除...Isdup, ]获取表达量数据fdata 删除样本名中的路径字符串 GSE28623/GSM709520_251485039549_1_4.txt -> GSM709520colnames...pdata$Sample)fdata=fdata[,common_samples]fwrite(as.data.table(fdata,keep.rownames="Feature"), file = stringr...geo_accession}_fdata.csv.gz"))pdata %% dplyr::filter(Sample %in% common_samples)fwrite(pdata, file = stringr
安装R包 # R包安装 options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/")) options(BioC_mirror...') BiocManager::install("ggplot2") #使用bioconductor安装 install.packages('devtools') devtools::install_github...R包中存在依赖包,有时候安装R包报错了因为没有安装依赖包 图片 图片 网络问题可能会影响R包的安装 图片 因为权限问题无法安装 图片 图片 # 分情况讨论 if(!...require(stringr))install.packages("stringr") 学习使用R包 browseVignettes('stringr') ##部分R包可以打开网页版的学习文档 ls...("package:stringr") #列出R包中的函数,使用前需要先安装及加载这个R包 R语言中的符号 图片
默认参数图片补充知识 Plot绘图函数分割画板:par(mfrow = c(2,2)) 把画板分成四块,两行两列#如果报错,把右下角画板拉大一点即可1.3 编写函数的函数图片当一个代码需要复制粘贴多次,就应该写成函数或使用循环...实现需要学会的是R包的使用规律,并非某个R包的具体用法2.2 R packages的安装2.2.1 镜像的设置镜像的作用是加快访问速度1.CRAN的镜像设置:options("repos"=c(CRAN...require(stringr))install.packages("stringr")if()里面逻辑是F则跳过后面的代码,T则运行后面的代码图片已经安装的包可以用::快速调用里面的函数,e.ppheatmap...::pheatmap(volcano)2.4 R packages的常见问题2.4.1 package not available图片原因1:包名写错原因2:安装命令使用错误原因3:本机的R语音版本与包所要求的版本不符...stringr3.3 浏览Package作者的在线教程browseVignettes("stringr")不一定每个作者都会写3.4 罗列指定packages中的所有函数ls("package:stringr
迫不得已) • fpkm、rpkm:转换为tpm,用limma做差异分析(迫不得已) https://mp.weixin.qq.com/s/_DtkxSfLGQHcRju66J4yTQ • RSEM:三大R包都可...https://www.jianshu.com/p/46b048220b88 其他来源的转录组数据和TCGA的转录组数据的差别 整理输入数据的过程不同,差异分析无差别 示例数据:GSE150392 使用数据前的要点...GSE150392_Cov_Mock_Raw_COUNTS.csv.gz", data.table = F)# 保留symbol ,去重复,再设为行名library(stringr...$V1,"PAR_Y_")dat$V1[24]b = dat$V1 %>% str_split("_",simplify = T)#36850以后是异常数据,检查dat$V1[36850]# 删除ERCC...str_starts(dat$V1,"ERCC-");table(k)dat = dat[k,]library(stringr)b = dat$V1 %>% str_split("_",simplify