腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
快速
获取
大
data.table
中
每个
指标
取值
最大
的
行
、
、
我得到了一个很大
的
data.table
,例如 n <- 79999999: 268678 e 8371.433 10000000: 730810 i 10150.311 我想创建一个
data.table
,对于指示器id_1
的
每个
值只有一
行</e
浏览 26
提问于2019-07-04
得票数 0
回答已采纳
2
回答
数据表
中
的
最大
行数
、
我在一个
data.table
中有一个包含8,000,000
行
和100列
的
数据集,其中每列都是一个计数。我需要找出每一
行
中
的
最大
计数,以及这个
最大
计数在哪一列。我可以使用下面的命令
快速
获得每行
中
哪一列
的
值
最大
但是尝试使用以下命令
获取
实际
最大
值 dt
浏览 0
提问于2015-02-13
得票数 9
回答已采纳
2
回答
根据包含列名
的
变量从不同
的
列中选择值
、
我有一个这样
的
data.table
:1 4 55 col1 334 35 col2我想填充另一个列matched_value,它包含来自new列
中
给出
的
相应列名
的
值:3 34 35 col2 34
浏览 3
提问于2015-10-23
得票数 12
回答已采纳
1
回答
具有条件
的
.N在
data.table
中
的
应用
、
、
我试图用条件数多个.N来表示
data.table
SD =
data.table
(x=c(1,1,1,1,2,2,2,2), y=c("a", "a", "b", "b","a", "a", "b", "b"), z= c("x", "x", "y","
浏览 4
提问于2020-10-13
得票数 1
回答已采纳
3
回答
检查两个
指标
是否相同
、
、
、
我得到了一个
大
的
数据表,它有两个
指标
:ind1和ind2,可能有重复。例如。set.seed(1) ind2 <- c("a","b","c")[ind1] 现在我想检查一下,这两个
指标
是否以相同
的
方式对数据分组,即 两
行
具有相同
浏览 0
提问于2019-07-16
得票数 1
回答已采纳
1
回答
setkey和:=运算符,
data.table
,R
、
、
、
在使用
data.table
包时,我有点不确定什么时候需要setkey()。例如,当使用带有by选项
的
:=运算符时,即使我没有设置关键点,事情似乎仍然非常快。如果在使用by调用:=之前不是必需
的
,那么
data.table
包怎么会这么快,因为它可能必须通过执行顺序搜索而不是二进制搜索来做与标准data.frame R
中
的
apply相同
的
事情,因为它不知道我
的
data.table
是否真的是通过by
的
参数进行排序
的<
浏览 0
提问于2012-07-21
得票数 18
回答已采纳
2
回答
使用
每个
实例
的
实例
指标
进行aws Sagemaker自动缩放
、
、
、
我正在尝试使用实例
指标
(CPUUtilization、MemoryUtilization或DiskUtilization)作为sagemaker端点自动缩放
的
指标
。这些是这里定义
的
预定义
指标
:当前运行
的
实例数为5,则CPUUtilization
的
取值
范围为0到500%
浏览 1
提问于2019-12-16
得票数 1
4
回答
R group by key
获取
多列
的
最大
值
、
我想做这样
的
事情: a b c2: 1 2 14: 2 1 16: 2 3 38: 3 2 1 如果键是列a,我希望
每个
唯一
的
a返回具有
最大
b
的
行
,如果存在多个唯一
的
最大
b,则
获取
具有
最大
c
的
行</e
浏览 1
提问于2018-03-08
得票数 3
3
回答
R:合并重复
的
意见?
、
我有一个
大
的
数据框架,大约有50万个观察(由“ID”标识)和150+变量。有些观察只出现一次,而另一些则出现多次(超过10次)。我想“折叠”这些多个观察,以便
每个
唯一ID只有一
行
,并且连接列2:150
中
的
所有信息。我不需要对这些观察结果进行任何计算,只需要
快速
地咀嚼一下。我试过:还包括:dt =
data.table</
浏览 6
提问于2017-05-04
得票数 0
回答已采纳
3
回答
慢速group_by()和case_when()函数
的
data.table
替代
、
、
在我
的
数据
中
,我有客户i,订单日期和一个指示器,如果一个订单包含一种类型
的
产品。我想给
每个
客户一个
指标
,如果他
的
第一个订单包含这种类型
的
产品。但是因为我
的
数据非常
大
,所以我不能使用group_by和case_when,因为它太慢了。我想我可以通过使用
data.table
来加
快速
度。 你能给我指个解决方案吗?到现在为止我还没有和
data.table
有过任何联系。
浏览 27
提问于2019-03-13
得票数 1
回答已采纳
1
回答
展开数据表,添加新
行
并按组替换NA值
、
我尝试基于列(在下面的示例Month
中
)展开数据表,并按组填充空值(Group)。以下面的dt为例; set.seed(0) dt<-
data.table
(ID=c(1:10),Month=sample(1:10,replace = F),Group=c("A","B","C","AGroup都有10
行
,这样每一
行
的
Month列
的
值从1到10。其余
的
列(Income、Tax、Birth)应该根据
浏览 7
提问于2020-06-15
得票数 0
回答已采纳
1
回答
大数据
的
聚类度量
我有一个包含150 k
行
和10列
的
数据集。在集群之后,我想获得集群度量。下面是我想要use>
的
指标
列表我有个问题。我尝试过使用clusterCrit (来自R)和sklearn (从python)
获取值
,但是当我尝试使用clusterCrit
获取<
浏览 0
提问于2019-05-16
得票数 0
1
回答
如何在一天
中
的
给定时间内找到
data.table
中
列
的
最大
值或最小值
、
因为我将要处理一些
大
的
系列,所以我正在学习使用
data.table
,而且我还不太习惯用
data.table
的
方式思考。在我导入到
data.table
中
的
数据
中
(为了简单起见,我们在这里称它为DT ),除其他与这个问题无关
的
内容外,我还得到了一个名为Date
的
YYYYMMDD格式
的
列,一个名为Time
的
HH:MM格式
的
列我想要做
的
浏览 2
提问于2017-03-19
得票数 1
回答已采纳
1
回答
条件
data.table
与.EACHI合并
、
我一直在玩更新
的
data.table
条件合并功能,它非常酷。在这种情况下,我有两个表,dtBig和dtSmall,当条件合并发生时,这两个数据集中都有多个
行
匹配。http://Rdatatable.github.io/
data.table
")创建一个包含50
行
(
每个
ID为10个值)
的
“
大
”表。
每个
ID有2个值) dtSmall <-
data.table</em
浏览 4
提问于2017-04-02
得票数 7
回答已采纳
2
回答
如何使用
data.table
与sqldf进行比较来获得相同
的
分组结果?
、
、
、
我尝试使用sqldf和
data.table
实现SQL查询。不幸
的
是,我不能使用
data.table
产生相同
的
结果。library(sqldf)HasPet <- c(0,0,1,1) Posts <-
data.table
(Id, HasPet, Age
浏览 4
提问于2021-04-26
得票数 0
回答已采纳
4
回答
从当前数字中低于常量
的
计数数。
、
、
、
、
假设我有一个数字列表(即
data.table
/data.framework
中
的
数字列)。51012 对于列表
中
的
每个
数字,需要计算有多少唯一
的
数字,它们比特定
的
数字+ 5 低。这一切都是假设我们已经得到了附加条件,即该数字不仅必须低于current_number + 5,而且它在列表
中
的
索引必须是current_number
的
>=。这种情况
的
结果
浏览 3
提问于2020-02-14
得票数 6
回答已采纳
1
回答
在R
data.table
中
,根据具有多种条件
的
其他列
中
的
元素有条件地删除
行
、
如何根据
data.table
中
的
行
删除
data.table
中
的
行
?可复制示例:library(
data.table
) DT <-
data.table
(Subject=c("A","A","B","B"), Test=c), Date=as.Date(c("
浏览 5
提问于2022-09-08
得票数 -1
1
回答
data.table
:对以列为输入
的
大型
data.table
执行高效
的
逐行操作。
、
、
、
我有一个非常
大
的
data.table
,它有1.6x10^8
行
,我想在exposure列和exposure.before.index列之间执行逐行操作,如下面的示例所示。我创建了TI列(即治疗强化),它是一个指示当前药物/药物( exposure )上是否存在非ID
的
指标
,与
每个
ID
的
第一
行
exposure.before.index上
的
任何药物不同。library(
data.table
) D
浏览 3
提问于2020-04-06
得票数 2
回答已采纳
2
回答
使用
data.table
的
fread BY GROUP从CSV读入行
、
、
、
我有一个包含数百万行
的
非常
大
的
CSV文件,它是来自多个源
的
组合数据集。我有一个字符列/变量来指示
行
/观察值
的
来源,并且我希望使用
data.table
的
fread从
每个
组
中
读入行
的
子集。现在,我尝试读取20,000
行
来测试我
的
代码,但是前几百万行都来自一个源,所以我不能从多个源
获取
行
。有没有办法从
每个<
浏览 51
提问于2021-11-18
得票数 1
1
回答
对满足所有可能条件
的
条件
的
所有值求和
、
我有一个如下所示
的
data.table
: colour t
浏览 0
提问于2012-08-13
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深度解析微服务高并发热点参数限流:热点参数限流功能的实现
TensorFlow 篇 | TensorFlow 2.x 基于 HParams 的超参数调优
一行Python代码,损失了$1,147,277,68美刀,这个程序员还活着吗
肝了3天,整理了90个Pandas案例
故障定位场景下的数据可视化实践
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券