腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
使用
data.table
的
逻辑
行
对
数组
进行
子集
?
r
、
data.table
、
subset
我基本上想做这样
的
事情: all_factors <- c('f1', 'f2', 'f3', 'f4' , 'f5' , 'f6') } I get: Error in all_factors[factor_permsj,]:无效
的
下标类型'list‘<
浏览 23
提问于2021-04-30
得票数 1
回答已采纳
1
回答
当您需要按变量分组时,是否有直观
的
解释说明为什么
data.table
操作比tidyverse操作更快?
r
、
data.table
我从优秀
的
资源、和了解到,
data.table
使用
自动索引(创建一个key,即增压
行
名)和基于二进制搜索
的
子集
,而tidyverse依赖于向量扫描。我理解向量扫描需要扫描每一
行
和创建nrow(dataset)长度
逻辑
向量,重复这样做并不是那么有效。也就是说,是因为
data.table
自动索引group_by列并将其分解为分组
子集
并在每个
子集
上运行操作,而向量扫描方法需要生成多个
逻辑
浏览 2
提问于2020-04-20
得票数 6
回答已采纳
1
回答
R's
data.table
对
大数据因子
子集
的
冲击
r
、
data.table
我有一个相对较大
的
data.table
(大约10亿
行
,30列),并试图
对
其
进行
子集
,以删除一些我不感兴趣
的
类别。category变量是一个有大约30个标签
的
因素。然而,当我这样做
的
时候,我
的
会议总是被扼杀。有什么方法可以对
data.table
进行
子集
吗? 考虑到我
的
data.table
是dt,引起崩溃
的
原因是
浏览 4
提问于2020-05-13
得票数 0
回答已采纳
3
回答
如何
动态地从
data.table
中提取几个随机
行
r
、
data.table
、
sample
我有一个很大
的
data.table
(大约24000
行
,而且还在不断增长)。我希望根据几个条件
对
该数据表
进行
子集
设置,并从该
子集
中(最终约为3000
行
)中随机抽取4
行
数据。我不想创建一个命名为3000左右
的
行
data.table
,计算它
的
行数,然后根据行号
进行
采样。我怎样才能在飞行中做到这一点?或者,我应该通过创建表,然后处理它,
对</e
浏览 0
提问于2014-07-11
得票数 32
回答已采纳
2
回答
您将
如何
将其翻译成R中
的
data.table
包语言?
r
、
data.table
我正在尝试用R学习
data.table
包。我有一个名为DT1
的
数据表和一个数据框DF1,我想根据
逻辑
条件(析取)
对
一些实例
进行
子集
。$c2==1,] #the data.frame way with the
data.table
DT1 在
的
第5页上,作者给出了一个类似的例子,但有一个连接(在上面的第二
行
中用&替换| ),并评论说这是
对
data.table
包
的
错误
使
浏览 3
提问于2012-05-22
得票数 5
1
回答
根据键
行
的
聚合返回
行
的
子集
r
、
key
、
data.table
、
aggregate
、
subset
我想根据
行
子集
上
的
聚合函数,在每个
子集
内
对
R中
的
数据表
进行
子集
。例如,对于每个键,返回所有大于仅针对
子集
中行计算
的
字段平均值
的
值。示例:t=
data.table
(Group=rep(c(1:5),each=5),Detail=c(1:25))library14 #
浏览 2
提问于2016-08-24
得票数 1
1
回答
当变量也是
data.table
中
的
列时,
如何
使用
变量
子集
R
data.table
?
r
、
scope
、
data.table
我通常希望
使用
一个变量(也是中
的
列名)来
子集
data.table
。例如,假设我有一个名为“
data.table
”
的
列。我还在我
的
环境中定义了一个变量“性别”(例如,sex = "male")。如果我想
使用
我
的
data.table
变量
对
sex
进行
子集
,dt[sex==sex]将返回
data.table
中
的
所有<
浏览 2
提问于2022-07-22
得票数 1
回答已采纳
1
回答
Data.table
:与j一起
使用
的
方括号
r
、
data.table
因此,我正在尝试学习
data.table
,并在网上备忘表中引用了.SD符号。因此,该示例
使用
方括号和.SD
对
行
进行
子集
。但是为什么不只是用i来
子集
行
呢?因此,.SD[c(1, .N)]
对
行
进行
了分类,
对
吗?为什么我要像这样划分行呢?library(
data.table
) DT <-
data.table
(A = letters[c(1, 1, 1, 2, 2)],
浏览 0
提问于2019-05-23
得票数 2
回答已采纳
2
回答
对
多个
子集
进行
重新编码
的
最佳实践
r
、
data.table
我很好奇是否有更好
的
方法根据
子集
逻辑
对
data.tables
进行
重新编码。在下面的设计示例中,我希望避免将其除以0: V2 = sample
浏览 1
提问于2015-09-30
得票数 1
回答已采纳
1
回答
循环中
使用
data.table
优化
子集
r
、
loops
、
data.table
我有一个关于
如何
优化以下代码
的
基本问题。这是我代码
的
一个非常简略
的
版本。基本上,我有一个大
的
data.table
(> 50M
行
),我希望经常对数据
进行
子集
(比如10000次),并在
子集
上运行一些函数(显然比下面示例中显示
的
函数更复杂,也就是说,我需要
子集
的
所有列,函数返回一个新
的
但是,我感兴趣
的
是
如何
优
浏览 2
提问于2017-11-14
得票数 5
回答已采纳
1
回答
R数据表-简洁地表示多个子设置条件
r
、
data.table
as.data.table(matrix(sample(c(0,1),n*p,replace = TRUE), n, p) )我希望将数据表
子集
为只包含列d、e、f都大于0
的
行
。我可以
使用
以下代码来完成这一任务:但是,当我试图表示相同
的
子设置条件时,它会给出一个错误: cols <- c("d", "e", &qu
浏览 1
提问于2017-04-19
得票数 4
回答已采纳
1
回答
data.table
时间
子集
与xts时间
子集
r
、
benchmarking
、
data.table
、
xts
嗨,我正在寻找一些按时间细分
的
数据
子集
。我通常
使用
xts做一些类似这样
的
事情:xts.min.obj[subset.string] 获取每天上午10点到下午1点(含)之间
的
所有
行
速度很快,并且擅长
对
大型数据集
进行
子集
划分,所以我想知道是否可以结合fasttime包来处理快速
的
POSIXct创建,是否值得创建一个像
浏览 0
提问于2013-06-27
得票数 5
回答已采纳
2
回答
按条件查找最后值
r
、
subset
、
tail
我有一个非常大
的
数据框架,我需要根据最后
的
值
进行
子集
。我知道
data.table
库包含last()函数,它返回
数组
的
最后一个值,但我需要
的
是根据id中
的
最后一个值
对
track中
的
每个单独值
进行
子集
。id中
的
值是连续整数,但每个track
的
最后一个值都不同。43.26124 4 0 3 -79.90733 43.2612
浏览 6
提问于2016-12-26
得票数 0
回答已采纳
1
回答
在tidyverse
的
循环中分组
r
、
tidyverse
更大
的
任务是用NA替换分组变量,如果在这个组中几乎没有观察到。我想将小组合并成一个NA组。 但是,下面的代码不允许我
使用
group_by(x),其中x是循环变量。
浏览 3
提问于2018-12-08
得票数 1
回答已采纳
1
回答
2
对
向量
的
子集
/滤波
data.table
r
、
data.table
我
如何
接受一个
data.table
对象,并将它有条件地由另一个表中
的
两个配对向量在两列上
进行
子集
。:subDT 我希望在flights中找到和
子集
那些原点为"EWR",目标完全是"IAH"<em
浏览 3
提问于2015-11-16
得票数 4
回答已采纳
1
回答
向
data.table
传递一个以R为索引
的
向量
r
、
data.table
如何
使用
向量subz
对
iris_dt
进行
子集
,并获得与上行相同
的
结果 library(
data.table
) setindex(iris_dt
浏览 13
提问于2020-09-04
得票数 0
回答已采纳
3
回答
使用
条件删除R中组类别中
的
观测值
r
当我研究R时,我有了一个新
的
问题。你能告诉我,我有商品类别吗?每个类别的商品都有price.Is,可以将字符串写在R中,这样,如果观察值超过该商品类别中该组
的
平均值超过500000,则该obs。也就是说,我需要从所有商品类别(分组变量)中删除观测值,这些观测值超过该组平均值
的
500000。
浏览 2
提问于2017-04-17
得票数 2
2
回答
以列名作为变量
的
r
data.table
行
子集
r
、
dataframe
、
data.table
让我们首先在r中创建一个简单
的
data.table
。dt=
data.table
(x1=1:5,如果我们想用
行
的
条件
对
data.table
进行
子集
,可以简单地这样做,例如现在我
的
问题是:如果列名是一个变量怎么办eval
使用
以下示例:如果我们想按名称(即变量)获取某些列。 dt[x1==1,eval(var),with=F]
浏览 2
提问于2021-08-26
得票数 1
回答已采纳
2
回答
基于类型列表列值
的
子集
data.table
r
、
list
、
data.table
、
subset
所以我现在有一个
data.table
的
例子,它有一个类型为list
的
列。此列表可以包含不同
的
值,NULL和其他可能
的
值。我尝试
对
data.table
进行
子集
,以只保留该列
的
值为NULL
的
行
。DT[is.null(ColofTypeList)] 它会给我一个Empty
浏览 7
提问于2019-12-05
得票数 1
回答已采纳
1
回答
在变量
的
唯一组合之间
对
观测次数
进行
细分
r
我有一份这样
的
数据: testout <- data.frame(descriptionout,dilutionout,conditi
浏览 1
提问于2017-05-03
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
好强一个Julia!CSV数据读取,性能最高多出R、Python 22倍
LeetCode#891 子序列宽度之和
在VBA中如何使用动态数组,以及利用动态数组去除重复值的方法
关于data.table中i,j,by都为数字的理解
NumPy基础:多维数组
活动推荐
运营活动
广告
关闭
领券