首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R」数据操作(三):高效data.table

接「R」数据操作(一)和「R」数据操作(二) 使用data.table操作数据 data.table提供了一个加强版data.frame,它运行效率极高,而且能够处理适合内存大数据集,它使用[]...使用下面命令进行安装: install.packages("data.table") 载入: library(data.table) #> #> 载入程辑:'data.table' #> The...首先,我们仍然载入之前用到产品数据,不过这里我们使用data.table提供fread()函数,它非常高效和智能,默认返回data.table。...,by所对应组合值是唯一,虽然实现了目标,但结果没有设置键: key(type_class_test0) #> NULL 这种情况下,我们可以使用keyby来确保结果data.table自动将...("volume") #> year average #> 1: 2015 4000 #> 2: 2016 4003 我们可以利用此专门语法创造一个列数动态变化组合,并且组合列是由动态变化名称决定

5.9K20
您找到你想要的搜索结果了吗?
是的
没有找到

R语言数据分析利器data.table —— 数据框结构处理精讲

版权声明:本文为博主原创文章,转载请注明出处     R语言data.table是自带data.frame升级版,用于数据框格式数据处理,最大特点快。...会将非数字转化为字符 data.table数据框也可使用dplyr管道,这里不作阐述。...将一个R对象转化为data.tableR可以时矢量,列表,data.frame等,keep.rownames决定是否保留行名或者列表名,默认FALSE,如果TRUE,将行名存在"rn"行,keep.rownames...链接符合表达式 DT[v>1, sum(y), by=v] #对v列进行分组后,取各组v>1行出来,各组分别对定义y求和 DT[, .N, by=x] #用by对DT 用x分组后,取每个分组总行数...参考文献 data.tablemanual:https://cran.r-project.org/web/packages/data.table/data.table.pdf

5.6K20

ChAMP R安装事故

ChAMP 提供了完整分析illumina甲基化芯片pipeline, 和普通Bioconductor 安装一样,代码只有简单两行 source("http://bioconductor.org.../biocLite.R") biocLite("ChAMP") 我用电脑是windows 操作系统,64位R-3.4.3,安装过程除了网速较慢,花费一点时间安装之外,并没有出现任何问题。...dll 文件就是windows操作系统下动态链接库,在加载R过程,如果这个R有对应动态链接库,那么就会加载进来。...解决方案就是设置环境变量R_MAX_NUM_DLLS, 不管是什么操作系统,R语言对应环境变量都可以在.Renviron文件中进行设置。...ChAMP功能确实是更加强大和完整,同时也意味它依赖会特别的多,从而出现dll文件达到上限错误。本文记录解决方案,适合于任何操作系统,希望可以帮助到大家。

2.1K20

R︱高效数据操作——data.table(实战心得、dplyr对比、key灵活用法、数据合并)

由于业务接触数据量很大,于是不得不转战开始寻求数据操作效率。于是,data.table这个就可以很好满足对大数据量数据操作需求。...(参考来源:R高效数据处理dplyr和data.table,你选哪个?) ?...(ID)] 三种数据筛选方式,dplyr、base基础data.table。其中,dplyr是select语句,data.table要注意.()表达方式。...data.table,还有一个比较特立独行函数: 使用:=引用来添加或更新一列(参考:R语言data.table速查手册) DT[, c("V1","V2") := list(round(exp(V1...参考文献: 些许案例,代码参考自以下博客,感谢你们辛勤: 1、R语言data.table简介 2、超高性能数据处理data.table 3、R语言data.table速查手册 4、R高效数据处理

7.7K43

data.table使用应该注意一些细节

因此对于不是非常巨大文件,建议设置为1,不要使用全部核心 freadsep是自动检测   所以在循环读入文件过程,就算不同文件分隔符不同,也可以循环一次性方便读入; 还有就算后续改变了文件分隔符...as.data.table函数同样有一个rownames参数,设置为T可以将行名保留下来作为data.table一列 不建议set和for循环一起使用   虽然set可以在内存上直接改变数值,但在R...0.6就不等于0.6, 虽然很费解,但这是因为计算机在存储浮点数时出现一些问题。...  类似于集合运算,data.tablefintersect, fsetdiff, funion,fsetequal函数能对不同数据框行求交集,差集,并集等 可以直接对列按分隔符进行分割   应用...分隔,分割成c1,c2两列 支持类似于SQLs分组运算   带有rollup, cube, groupingsets函数 参考资料 data.table 1.11.2 manual:https://cran.r-project.org

1.5K10

Bioconductor R 安装教程(续一)

这是《Bioconductor R 安装教程》第二篇,完整文章可以点击阅读原文查阅。...安装新版本 Bioconductor R Bioconductor 是与特定版本 R 绑定,正常来说当 Bioconductor 都来自同一版本时,它们效果最佳。...以 DiffBind 为例,DiffBind==3.4.0 是基于 Bioconductor==3.14(对应 R-4.1)开发;我们在 Bioconductor==3.13(对应 R-4.0)执行...源码方式安装 如果想要在 Bioconductor==3.13(对应 R-4.0)安装 DiffBind==3.4.0,可以直接通过源码方式安装: > packageurl <- "http://...,我这里用是清华大学,第二行,设定 install.packages 从 CRAN 和 Bioconductor 搜索,其实你还可以让它支持比如 R-Forge 以及各种第三方仓库。

6.7K10

R安装

3次,就应该写成函数或使用循环 3、默认参数 作者可以为参数设置默认值,不是所有的参数都要出现在代码里,没有出现是默认值 二、R 1、定义:多个函数打包存放“容器”,包括函数、数据、帮助文件、描述文件等...2、作用:实现特定功能,你需要什么功能,安装相应R就行。说人话就是使用智能手机,需要使用微信与人聊天,你就按照微信APP,需要上腾讯视频看电视剧,你就安装腾讯视频APP。...R,使用 “BiocManager::install()来安装 (3)github网站,是R作者写,没有经过审核,使用”devtools::install_github...几乎不使用,使用时需要写明R作者,就是指明选择谁写R。...说人话,智能手机安装腾讯视频,只要你不卸载,就一直在你手机里,需要看电视剧是打开APP,看完电视了你退出APP,再次看电视时还需要再次打开APP。所有“加载”R就相当于打开APP。

77520

如何在Redhat安装R及搭建R私有源

1.文档编写目的 ---- 继上一章如何在Redhat配置R环境后,我们知道对于多数企业来说是没有外网环境,在离线环境下如何安装R,能否搭建R私有源对R进行管理。...本文档主要讲述如何在Redhat安装R及搭建R私有源。...搭建需要注意,PACKAGES文件记录了所有描述信息,且每个只有一个版本。...(如果是自己制作R,同理在PACKAGES末尾添加描述信息也是可行,未做验证有兴趣朋友可以验证下告诉Fayson)。...4.配置R使用私有源 ---- 1.在$R_HOME/ lib64/R/etc目录下增加配置文件Rprofile.site 在Rprofile.site文件增加如下内容: [root@ip-172-31

4.2K70

疑难杂症-RRwordseg安装

一、通过install.packages安装 步骤: 1、在R先装rJava install.packages(“rJava”) 2、没有装JDK要到这里去下载: http://www.Oracle.com...二、通过Rwordsegzip进行离线安装 不出意外,大部分版本R都可以通过以上方式安装好Rwordseg。 我在帮小伙伴安装时候,也确实遇到过疑难杂症,按照步骤,依旧搞不定,不断报错。...如果您电脑或者目前正在使用R版本实在无法通过install.packages在线方式安装Rwordseg。...当然不用苦恼,有更便捷方式,就是直接下载Rwordsegzip,在R中加载zip进行离线安装,只需几秒钟即可。...方法:在程序中选择(install packages from local files),离线安装zip即可。 ? 我将Rwordseg压缩包上传至了资源,大家可以下载进行离线安装。

1.3K80

关于data.tablei, j, by都为数字理解

以mtcars这个R自带数据集为例,我们知道mtcars[1]运行结果,是选择这个数据集第一行,结果如下: ? mtcars[1,1]运行结果,是选择第一行第一列元素,结果如下: ?...首先,我们单独看i只有一个1情况下是什么运行结果,为了让运行出来代码被认定是data.table格式,我们在j中加入.SD(不清楚.SD用途小伙伴可以查看data.tablemanual,或者查看笔者上一篇推送用...可见,在DTi输入一个数字和用一般提取符号`[`只输入一个数字结果完全一样,就是提取这个数据集中某一行。...最后,我们将j1添加进去,代码与结果如下: mtcars[1, 1, 1] ?...结 果分析 从这样一段拆解当中,我们大致就可以明白为什么会出现这样结果了,整体运行思路就是:首先选出了第一行,而后在by以一个变量名默认为NA变量为基准,最后在j中生成了一个默认变量名为V1变量

1.2K30

R语言入门之R安装

R语言是一个强大数据分析工具,其强大之处在于有各种各样R帮助其实现各种各样功能。...通常来说,R安装主要有四种方法,包括:1)从R语言官网上直接下载相关R并安装;2)从Bioconductor上下载R并安装;3)从Github上下载R并安装;4)手动安装R。...接下来我将和大家分享R具体安装: 1)首先获取下载R名字,比如下载metafor这个R,可以先在官网(https://www.r-project.org/)上找到这个,了解一下这个详细内容和使用说明...') 这里需要注意是,下载BioconductorR需使用BiocManagerinstall函数。...,githubR需要在其前面加上该所在库名,否则无法进行下载安装。

3.6K30

R深入解析

当我们在使用很多R时候总会有些里面的函数引发我们好奇心,总想去看看他们具体怎么实现,今天我们就来讲下如何去解析一个别人写好R。 1....我们先知道我们想去解析R名字,比如“InformationValue”。 2. 打开R语言官网R列表,然后利用浏览器检索检索下我们找位置,然后进入R详细介绍页面。 ? 3....在R详细页面我们可以看到图中标出位置,那就是R源代码文件,下载源代码问价,解压后文件结构如下图: ? 4. 接下来就是激动人心时刻了,进入R/目录,迎面而来是R语言代码文件了。 ? 5....我们首先打开主函数文件“Main.R”,然后就可以在R文件检索我们想要主函数名称。 ? ? 6. 当然,我们有时候并不满足于看看主函数,更想深入看其子函数程序,那也是没问题,如图: ?...至此,我们便可以在R/目录下随心所欲查看R所有源程序。

94420

R语言windows环境下R构建与.gz导入

那么,作为神一样R语言简直无所不能,他们开发了Rtool,这个工具不仅是为创建R,同时也可以让那些以gz结尾R可以安装在windows环境下。...今天我们就来介绍下R语言与Rtool结合后是如何玩转R。...data文件夹保存数据(本例对应d),R文件夹保存函数(本例对应f和g),man文件夹存放.Rd文件,用来生成帮助文件。...接下来就是编译R,编译R前我们需要先验证时是不是Rcmd所在文件夹已经在环境变量否则直接调用Rcmd会出错如图 ?...接下来将是见证奇迹时刻了,填充好title后再次运行编译程序: ? 那么我们R建好了,当然R也是gz结尾,意味着只有Linux下是好用

2.3K40
领券