data.table: i中的逻辑条件馈送列表

data.table是一种用于处理大型数据集的高效的R语言包。它提供了一种快速、灵活和内存高效的方法来进行数据操作和计算。

在data.table中，i是一个用于筛选数据的逻辑条件。逻辑条件可以是一个向量、一个表达式或一个函数。i中的逻辑条件馈送列表是指将多个逻辑条件组合在一起，以便同时筛选数据。

使用i中的逻辑条件馈送列表，可以根据多个条件对数据进行筛选。例如，可以使用逻辑运算符（如&和|）将多个条件组合在一起，以便同时满足这些条件。这样可以更精确地选择需要的数据。

data.table的优势包括：

高速处理：data.table使用了一些优化技术，如按引用复制数据、使用二进制索引等，以提高数据处理的速度。它可以在处理大型数据集时比其他包更快。
内存高效：data.table使用了一种内存高效的数据结构，可以在有限的内存中处理大型数据集。这使得它非常适合处理需要大量内存的任务。
简洁的语法：data.table提供了一种简洁而直观的语法，可以轻松地进行数据操作和计算。它使用了一些特殊的符号和函数，使得代码更加简洁和易读。
并行计算：data.table支持并行计算，可以利用多核处理器来加速数据处理过程。这对于处理大型数据集和复杂计算任务非常有用。

data.table在许多领域都有广泛的应用，包括数据分析、数据挖掘、金融建模、科学研究等。它可以处理各种类型的数据，包括结构化数据、时间序列数据、文本数据等。

对于使用data.table进行数据处理的用户，腾讯云提供了一些相关产品和服务，如云服务器、云数据库、云存储等。这些产品可以帮助用户在云环境中高效地进行数据处理和计算。具体的产品介绍和链接地址可以在腾讯云官方网站上找到。

相关·内容

关于data.table中i, j, by都为数字的理解

写在前面本期还是由村长来为大家供稿，这期讲一个村长遇到的关于data.table比较有趣的问题，希望大家支持！！问题：i, j, by同时输入数字会怎样？...在往期的公众号文章，都提到了data.table的主要语句DT[i, j, by], 简而言之，i 用来选择或者排序，by 用来分组，j 用来运用函数进行处理。...首先，我们单独看i只有一个1的情况下是什么运行结果，为了让运行出来的代码被认定是data.table的格式，我们在j中加入.SD（不清楚.SD用途的小伙伴可以查看data.table的manual，或者查看笔者上一篇推送用...可见，在DT的i中输入一个数字和用一般的提取符号`[`只输入一个数字的结果完全一样，就是提取这个数据集中的某一行。...最后，我们将j中的1添加进去，代码与结果如下： mtcars[1, 1, 1] ?

1.2K3 0

关于领域对象业务逻辑中条件判断的最佳实践

这篇文章其实是大健康行业直销系统的番外篇，主要给大家讲讲如何在领域逻辑中，有效的处理业务逻辑条件判断的最佳实践问题。大家都知道，聚合根、实体和值对象这些领域对象都自身处理自己的业务逻辑。...在业务处理过程中，通常会有一些条件判断，当满足这些条件时，会进行不同的后续处理。...无法对多个条件在不同需要的地方进行灵活的组合。为了更好的组织业务逻辑中关于业务条件的判断，最佳实践方式是将业务条件拆分得足够细，并用语义化的方式表示。...举个例子：酒店业务中，房间领域对象会处理预定房间的领域逻辑和退房的领域逻辑，在预定房间时，我们需要保证房间没有被其他人预定并且房间没有正在维护这两个业务条件同时满足；在退房时，我们需要保证房间里没有物品损坏或已经进行了损坏赔偿这两个业务条件中的任意一个...在房间领域对象的预定房间与退房的领域逻辑中，组合使用上述4个条件规则 //预定房间 public Room Reservation() { var roomisnotconfirmedspec

8464 0

关于领域对象业务逻辑中条件判断的最佳实践

1.3K5 0

Excel公式技巧20：从列表中返回满足多个条件的数据

在实际工作中，我们经常需要从某列返回数据，该数据对应于另一列满足一个或多个条件的数据中的最大值。如下图1所示，需要返回指定序号（列A）的最新版本（列B）对应的日期（列C）。 ?...IF子句，不仅在生成参数lookup_value的值的构造中，也在生成参数lookup_array的值的构造中。...原因是与条件对应的最大值不是在B2:B10中，而是针对不同的序号。而且，如果该情况发生在希望返回的值之前行中，则MATCH函数显然不会返回我们想要的值。...B10,0)) 转换为： =INDEX(C2:C10,MATCH(4,B2:B10,0)) 转换为： =INDEX(C2:C10,MATCH(4,{4;2;5;3;1;3;4;1;2},0)) 很显示，数组中的第一个满足条件的值并不是我们想要查找的值所在的位置...： =INDEX(C2:C10,1) 得到： 2013-2-21 这并不是满足我们的条件对应的值。

8.7K1 0

R语言学习笔记之——数据处理神器data.table

data.table 1、I/O性能： data.table的被推崇的重要原因就是他的IO吞吐性能在R语言诸多包中首屈一指，这里以一个1.6G多的2015年纽约自行车出行数据集为例来检验其性能到底如何，...DT[i,j,by] 如果这个过程是SQL中是由select …… from …… where …… groupby …… having 来完成的，在R的其他基础包中起码也是分批次完成的。...，无需加表明前缀，这一点儿数据框做不到,而且i,j,by三个参数对应的条件支持模糊识别，无论加“,”与否都可以返回正确结果。...(carrier,tailnum)] #但心里要清楚列索引接受的条件是含有列表的列表，而且这里的列表作为变量给出，而非data.frame时代的字符串向量。行列同时索引毫无压力。...这里的执行逻辑是这样的： by=.

3.6K8 0

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

事实上，为了使计算结果更符合业务逻辑，上述的代码还要继续加工才行。总结：aggregate函数勉强可用，但在性能和方便性上存在不足，代码的写法、计算结果、业务逻辑这三者不一致。...##对于数据框 x是对象，subset是保留元素或者行列的逻辑表达式，对于缺失值用NA代替。 Select 是选取的范围，应小于x。...5、which定位函数功能：返回服从条件的观测所在位置（行数），有一定的排序功能在其中。...(iris$setosa)] #按照照setosa的大小，重排Sepal.Length数据列四、dplyr与data.table data.table可是比dplyr以及python中的...data.table包提供了一个非常简洁的通用格式：DT[i,j,by]，可以理解为：对于数据集DT，选取子集行i,通过by分组计算j。

20.7K3 2

懒癌必备-dplyr和data.table让你的数据分析事半功倍

在编程语言里面，说语法简单，意味着编程语言与我们正常人的逻辑思维是一致的。它相对于R自带的筛选方法会更高效，我们不需要花很多时间去等待机器反应。...找到合适的packages并学习使用它，绝对会让我们数据分析工作事半功倍！我们有没有发现dylyr包中函数使用的一些规律？有的！...DT<-data.table() DT[i,j,by] take DT,subset rows using i,then calculate j grouped by by 我们在横轴上过滤数据...使用i DT[3：5] #选取3到5行的数据 class(DT) [1] "data.table" "data.frame" DT[v1=="A"] #基于条件的选择 DT[v1 %in% c("A",...以上讲的这些只是我工作中data.table用得最多的功能，它的强大之处还远远不止这些！如果你想深入，可以去官网下载文档，你绝对值得拥有！

2.4K7 0

R语言数据分析利器data.table包 —— 数据框结构处理精讲

将一个R对象转化为data.table，R可以时矢量，列表，data.frame等，keep.rownames决定是否保留行名或者列表名，默认FALSE,如果TRUE,将行名存在"rn"行中，keep.rownames...i 决定显示的行 DT = data.table(x=rep(c("b","a","c"),each=3), y=c(1,3,6), v=1:9) #新建data.table对象DT DT[2]...=FALSE] 和x[, .SD, .SDcols=cols]一样 mult 当有i 中匹配到的有多行时，mult控制返回的行，"all"返回全部（默认），"first",返回第一行，"last"返回最后一行...roll 当i中全部行匹配只有某一行不匹配时，填充该行空白，+Inf(或者TRUE)用上一行的值填充，-Inf用下一行的值填充，输入某数字时，表示能够填充的距离，near用最近的行填充 rollends...SD就包括了页写选定的特定列，可以对这些子集应用函数处理 allow.cartesian FALSE防止结果超出nrow(x)+nrow(i)行，常常因为i中有重复的列而超出。

5.8K2 0

「Workshop」第五期：使用data.table操作数据

data.table 查看代码[1] data.table的基本框架 ?...按相同的列内容进行data.table组合 ?...输出R环境中名为dt的数据框为.csv文件 foverlaps() foverlaps() 格式 foverlaps(x, y, by.x = if (!...其他 nomatch = NULL 返回匹配得上的部分 setkey() 设置匹配索引参数which = TRUE 是只返回两个数据框匹配情况的行号参数mult = "first" 是返回x中第一次匹配上的行...对应y中列的名称数据的拆分和合并 melt() dcast() > reshape_dt <- data.table(kinds = c(rep("peach", 2), rep("grape",

3.3K5 0

「R」数据操作（三）：高效的data.table

data.table的基本语法是dt[i, j, by]，简单说就是使用i选择行，用by分组，然后计算j。接下来我们看看data.table继承了什么，增强了什么。...中，by所对应的组合中的值是唯一的，虽然实现了目标，但结果中没有设置键： key(type_class_test0) #> NULL 这种情况下，我们可以使用keyby来确保结果的data.table自动将...的动态作用域我们不仅可以直接使用列，也可以提前定义注入.N、.I和.SD来指代数据中的重要部分。...(year = year(date))] } 这里我们使用.SD[[x]]提取x列的值，这跟通过名字从列表中提取成分或元素相同。.../wiki查看完整功能列表。

6.2K2 0

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

由于业务中接触的数据量很大，于是不得不转战开始寻求数据操作的效率。于是，data.table这个包就可以很好的满足对大数据量的数据操作的需求。...data.table可是比dplyr以及Python中的pandas还好用的数据处理方式。...data.table包提供了一个非常简洁的通用格式：DT[i,j,by]，可以理解为：对于数据集DT，选取子集行i,通过by分组计算j。...2、按条件行筛选从前用subset的方式进行筛选比较多， new=14,select=a:f) （1）单变量现在data.table与dplyr from_dplyr =...nomatch参数用于控制，当在i中没有到匹配数据的返回结果，默认为NA，也能设定为0。

8.3K4 3

R语言基因组数据分析可能会用到的data.table函数整理

因此，在对大数据处理上，使用data.table无疑具有极高的效率。这里主要介绍在基因组数据分析中可能会用到的函数。...转换前转换后当然，上述过程也可以用data.table[ i , j ,...by ]语法做但是如果我要将上述DT中的v3作为一个影响因素，作为tag，先按v1、v2汇总，再将对应的v4值分为v3=1和v3=2两类，查看v1、v2取值相同v3不同对应v4的情况，这个时候用dcast...[ i , j , by ]语法也可以看个人需要吧，各种各样不同的方法都了解了以后，当你真正需要用到达到某个目的时，你的脑海里就会自动匹配上最佳的处理方法。...="id"； between 是data.table i 语法的扩展功能，between等同于x >= lower 并且 x <= upper 当incbounds设置为TRUE的时候，

3.3K1 0

「Workshop」第二期：程序控制与数据操作流

这一次的内容太多了，我讲了 2 小时都没讲完，后续再放视频吧。有一段还忘记录了。。。...one_of matches 行筛选 slice, filter, sample_n, sample_frac, top_n, distinct 列筛选 select 排序 arrange 行列增加/更新基本的数学和比较逻辑运算符...fwrite data.table 语法 dt[i, j, by] 数据过滤与合并等操作与 R 基础语法一致，也可以使用 tidyverse 处理整数索引逻辑索引命名索引进一步的学习参考小抄、...文档和《R 语言编程指南》后几期主题本期未讲述的内容？？？...正则表达式与字符串处理：base 与 stringr 列表处理与迭代计算：purrr 统计建模：stats 与 broom 绘图：graphics 与 ggplot2 函数编程：apply家族和purrr

1.6K3 0

开放地址法散列开放地址法代码实现

开放地址法开放地址法是另一种（相对于分离链接法）解决散列冲突的方法。适用于装填因子（散列表中元素个数和散列表长度比）较小（小于0.5）的散列表。...开放地址法中索引的计算方法为$$h_{i}(x) = (Hash(X) + F(i)) % TableSize$$，其中： Hash(x)为索引的计算方法 F(i)为冲突的解决函数，有F(0) = 0，...i为已经尝试计算索引的次数 F(i)一般有：线性探测法：$$F(i) = i$$，即每次冲突则向下寻找1个位置，直到找到不冲突的位置，容易产生“一次聚集”的现象（数据集中在某一个地址区域）平方探测法...：$$F(i)=i^{2}$$，每次冲突按平方寻找下一个位置，直到找到不冲突的位置双散列：$$F(i) = i\cdot hash_{2}(x)$$，即发生冲突后使用第二个散列函数计算下一个位置代码实现...:= range data.table { data.table[i] = *newTableNode("", tableData{}) } return data }

1.4K12 0

35行代码搞定事件研究法（下）

注意 I，本代码主要使用data.table包完成，关于data.table包的相应知识会在涉及的时候进行讲解。在以后的课堂中，我们会重点介绍data.table这个包。...用data.table包处理多个事件日本期课堂的核心代码只有下面5行（应用了data.table包的语法）： > car <- event[, { > ns <- which(event.flg...此处，我们没有添加任何条件，因此默认选中event的所有行。对选中的变量进行操作（第二行代码）。此处，所有的操作都用大括号{}包裹了起来。对event按照stk.id进行分组（第三行代码）。...在上一讲中，我们已经给出了函数 do_car() 用来求单个事件日的超额收益，因此很自然的，我们希望对于事件日向量 ns 中的每个元素，都应用一遍 do_car()这个函数。...在测试中，大猫设置了一个极端条件：模拟2500个股票（差不多是A股股票数），每个股票拥有1000个交易日的记录（差不多有4年的时间），平均50个交易日出现一个事件（模拟盈利公告这类事件的出现频率）。

1.2K4 0

R语言利用vcf文件计算等位基因频率和连锁不平衡（LD）R方

首先使用beagle做基因型填充 beagle gt=smoove_filtered.vcf out=smoove.filtered.impute nthreads=2 读取vcf文件 library(data.table...library(tidyverse) dat.map<-fread("smoove.filtered.impute.vcf.gz",skip = "#CHR") 把 0|1 这种基因型拆分成两列 gt<-data.table...这个符号，暂时没有搞明白这个写法是什么意思，可以一直把列添加到一个数据框里以下代码把数据框转化成了一个列表 gt %>% t() %>% as.data.table() %>% unclass...)){ p[[i]] <- table(gt.list[[1]])/n } 自定义计算LD的函数 library(compiler) calcLD <- cmpfun(function(x,pa...} } return(R2) }) 整个函数的逻辑还看不明白这里自定义函数还用到了compiler这个R包，有什么作用暂时不太明白函数是输入两个位点的等位基因和等位基因频率 calcLD(

1940 0

R语言：以多列标准筛选特定行

问题提出在data.table语句中，i是用来进行行选择的重要组成部分，很多情况下我们都需要以很多列的同一个特殊值进行行的选择，大多数情况下，我们可能会针对所有的变量逐一写出条件，例如a==1&b==...在这里如果对每一个条件进行输入，需要输入20多个变量的判定，而且这里的变量名非常的脏，不利于变量名的输入。...外层代码下面来看外层代码: rowMeans(clinic[, 31:52] == "醛固酮") > 0 这里运用了R语言中非常关键的一个知识点：对逻辑判断值进行四则运算时，TRUE会被当做1，FALSE...这样我们把这两个条件合并在一起，然后配套上data.table的语句，就成了我们一开始出现的那条代码： clinic <- clinic[rowMeans(clinic[, 31:52] == "醛固酮...= "继发性醛固酮") == 1] 写在结尾应用好对象格式是R语言编程中的精髓之一，在这个例子中就很好的利用了对象格式里面的格式性质，做了一些适当的变通处理，让数据处理过程变得更加巧妙和方便，这点大家可以在以后的数据处理中做更多的尝试和思考

1.9K4 0

For循环与向量化（Vectorization）

Vectorized（向量化）根据Hadley Wickham在其著作Advanced R中第一章所涉及到的内容，R最底层的数据结构只有两种：向量（vector）和列表（list），其他所有的数据格式都是通过这两种最基本的数据结构衍化而来...由于我们需要做的是向量中某一个元素与前一个元素的处理结果，那么只需要将元素往后进行移位，与原来的向量进行一一对应的处理即可，这样便达到了以向量进行处理的模式。...关于For循环和Vectorization的深入思考 Vectorization在更多包的拓展现在有很多的R包会对底层的一些函数进行优化，也即是对向量化的进一步优化，我们选择效率较为强大的data.table...通过运行结果可以发现，Rcpp调用的底层循环略优于data.table的向量化，运行时间在0.03s左右。...利用data.table进行数据操作有着比R本身向量化更好的效率表现，如果自身对效率的要求更高，可以利用更底层的语言接口进行编写。最后还有一点需要注意：向量化并不能解决一切问题。

1.8K3 0

十、文件读写

soft.csv的文件，并且刚好与数据框soft中的内容一样， 6).将soft保存为Rdata并加载。...save(soft,file = "soft.Rdata") ###load的结果是让Rdata中的变量出现在环境中 rm(list = ls()) ###上一步刚把文件保存，soft.Rdata...###小技巧：图片 # data.table 读取任何形式的文件，包括问题文件 soft = data.table::fread("soft.txt",data.table = F) #正常文件...读取后是列表，然后对列表取子集。...但是y中有字符型向量，有数值型向量，所以本身文件有问题，平时自己处理文件的时候直接输出为数据框、列表都可以。不保存为矩阵。

1.8K4 0

R语言tryCatch使用方法：判断Warning和Error

R中判断warning和error状态的函数，我没有找到。一个玩Java的同事说，try.....catch多经典的方法，你怎么不用呢？ ❝我知道R中有tryCatch这个函数，但是没有具体用过。...「tryCatch的整体逻辑：」 tryCatch({ 命令 }, warning = function(w){ # 这里是出现warning状态时，应该怎么做，可以用print打印出来，可以执行其它命令...首先看一下R中warning的报警信息：「warning」 # 示例数据 library(data.table) dd = data.frame(ID = 1:10,y= rnorm(10)) dd...可以看到，代码执行成功了，但是会给出Warning message 然后我们看一下Error的报警信息，假定R中没有aaaaa的对象，你直接打印出来，会报错： # error aaaaa > # error...「warning处理代码」在代码中，写下warning的语句，在warning的条件下，返回2 在代码中，写下error的语句，在error的条件下，返回3 re1 = tryCatch({ dcast

8512 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

data.table: i中的逻辑条件馈送列表

相关·内容

关于data.table中i, j, by都为数字的理解

关于领域对象业务逻辑中条件判断的最佳实践

关于领域对象业务逻辑中条件判断的最佳实践

Excel公式技巧20：从列表中返回满足多个条件的数据

R语言学习笔记之——数据处理神器data.table

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

懒癌必备-dplyr和data.table让你的数据分析事半功倍

R语言数据分析利器data.table包 —— 数据框结构处理精讲

「Workshop」第五期：使用data.table操作数据

「R」数据操作（三）：高效的data.table

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

R语言基因组数据分析可能会用到的data.table函数整理

「Workshop」第二期：程序控制与数据操作流

开放地址法散列开放地址法代码实现

35行代码搞定事件研究法（下）

R语言利用vcf文件计算等位基因频率和连锁不平衡（LD）R方

R语言：以多列标准筛选特定行

For循环与向量化（Vectorization）

十、文件读写

R语言tryCatch使用方法：判断Warning和Error

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐