腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1338)
视频
沙龙
1
回答
存在
lubridate
interval
对象
列
时
的
data.table
子集
行数
、
我收到一条错误消息,其中包含一个我不理解
的
data.table
。我有一个主
data.table
,它是基于ID变量
的
子集
。一旦我有了第二个
data.table
,我又想用一个行索引向量将其
子集
。不幸
的
是,我不能分享我
的
数据,也不能用另一个数据集重现错误。很抱歉,我不能提供比这更多
的
细节。有人能说出这些有限
的
信息是怎么回事吗?> class(auth) [1] "
data.tabl
浏览 11
提问于2021-05-19
得票数 1
1
回答
data.table
工程中润滑油期
的
不当分配
、
、
最近,我发现了
data.table
的
赋值运算符:=
的
一种奇怪
的
行为,当我想将
lubridate
的
period
对象
赋值给
列
时
,它只将第一个句点分配给所有单元。library(
data.table
) ][x == 4,p #
浏览 2
提问于2018-06-22
得票数 2
1
回答
在
data.table
R中遍历
列
、
、
我试图在R.中
的
data.table
包中循环列,我在
子集
datatable
时
尝试获取for循环以准确地输入列
时
遇到了困难。data <-
data.table
(va=c(1,0,1), vb=c(1,0,0), vc=c(1,1,1)) names <-
浏览 4
提问于2020-01-17
得票数 1
回答已采纳
3
回答
取使用为每一行生成
的
布尔向量选择
的
行
子集
的
平均值。
、
我可以使用sapply执行以下操作,但是我希望dplyr也可以这样做,或者如果它是dplyr范围之外
的
问题。1)获取值日期3)使用此布尔向量对整个原始数据进行
子集
4)取此数据
的
平均值。5)将值存储在一个名为mean_for_Date
浏览 0
提问于2018-03-10
得票数 2
回答已采纳
1
回答
Data.table
:创建新变量,按日期周期细分,按第二个变量x分组,并按每个x
的
最终日期聚合结果。
、
我对
data.table
完全陌生,所以请容忍我。在下面的示例中,我想在dataset中创建两个新
列
:每个客户ID在两个不同时间段内
的
总购买价格。 然而,当我试图对数据进行
子集
时
,我会陷入困境。我想要
子集
的
数据,以便每一行代表一个独特
的
客户ID,连同他们
的
最终购买价格,最后购买日期,期间1购买价格总额,和他们
的
第二个采购价格总额。我认为
data.table
可以在对应于每个客户
的
所有行
浏览 1
提问于2016-10-12
得票数 0
回答已采纳
1
回答
data.table
中
的
Interval
类
、
、
我
的
问题将在下面的可重现
的
例子中得到解释。 首先,让我们加载所需
的
包并创建一个POSIXct和一个
data.table
对象
。
对象
的
新
列
。:第一个是POSIXct
列
的
函数,第二个是
Interval
列
的
函数。然后,当我对
Interval
列
的
列
函数执行相同
的
操作
时
浏览 17
提问于2018-02-02
得票数 4
2
回答
格式化24小
时
时间变量以捕获不同范围内
的
观测结果
、
、
我目前有一个包含Start.Time
列
的
数据框架(从*.csv文件导入),格式为24小
时
格式(例如,20:00:00等于8 8pm)。我
的
目标是以不同
的
间隔(例如9:00:00到10:00:00)捕获具有起始时间
的
观察,这也符合其他标准。但是,似乎R对这个“字符”变量
的
排序方式与我们
的
一天
的
运行方式不一致(例如,14:00:00被认为是一个比9:00:00低
的
值)。例如,下面是一行按预期工作
的
代码,
浏览 0
提问于2021-09-16
得票数 0
回答已采纳
2
回答
将S4
对象
存储在data.frame或
data.table
中
、
、
、
、
我正在尝试将复杂
的
S4
对象
(使用Seurat包生成)放入
data.table
(我读到不可能使用list或data.frame,但我没有发现任何关于
data.table
与S4
对象
的
兼容性
的
信息)这些
对象
都来自我编写
的
函数中称为dataset
的
一个更大
的
对象
: nclust=
d
浏览 2
提问于2020-02-28
得票数 0
3
回答
从时间序列数据创建间隔
、
Access times可以是复制
的
。我正在尝试创建一个列表,其中包含分组并按命名为--给定
的
时间间隔,例如年份。22:00:00 314 2015-04-05 18:00:00 1我
的
代码示例已经创建了按年份分组
的
用户列表我
的
问题是,在这种方法中,我需要修改--表,这将成为一个百万条目表
的
问题。), class = "data.frame"
浏览 0
提问于2018-10-10
得票数 2
回答已采纳
2
回答
如何在
data.table
中以编程方式选择
列
?
、
、
我有以下
data.table
(DT):我想通过使用存储相关变量名称
的
对象
,以编程方式(动态地)选择变量
的
子集
例如,我想选择存储在变量"keep“中
的
两
列
"V1”和"V3“。keep <- c("V1", "V3") 如果我们从data.frame中选择"keep“<
浏览 1
提问于2013-04-25
得票数 23
回答已采纳
1
回答
在PostgreSQL表中插入/更新R
data.table
、
、
我已经设置了一个PostgreSQL数据库,其中包含一个已经定义好
的
表和
列
。表
的
主键是(Id, datetime)
列
的
组合。我需要定期将不同Ids
的
数据从R
data.table
插入到数据库中。但是,如果特定(Id, datetime)组合
的
数据已经
存在
,则应对其进行更新(覆盖)。如何使用RPostgres或RPostgreSQL包完成此操作?当我尝试插入一个已经
存在
一些(Id,datetime)行
的</em
浏览 8
提问于2019-08-12
得票数 3
1
回答
sample()命令在R中太慢
、
我想创建一个非常大(大约200万行)
的
data.table
df
的
随机
子集
。数据表有一个权重
列
wgt,它指示每行代表多少个观察值。为了生成我想要提取
的
行号
的
向量,我按照以下步骤进行:ns<- length(df$wgt)lines<-round(0.3*ns)pr<-df$wgt/s
浏览 2
提问于2015-07-21
得票数 1
1
回答
计算日期范围间隔
的
部分重叠数
、
、
、
、
我需要在一个大约15万行
的
数据帧上运行一个循环。但是,循环需要检查每一行,并检查数据集中每隔一行检查一次
的
条件。我
的
代码对于玩具数据集工作得很好,它产生了正确
的
值,但是对于我
的
实际数据集来说太慢了。所以我希望有人有更好
的
想法来解决这个问题。我尝试为包含日期范围作为数值
的
每一行创建列表元素,然后检查是否
存在
重叠,我使用%in%运算符来比较未列出
的
范围 我使用lapply函数(这里没有显示)做过类似的事情,但同样
的
问题是
浏览 3
提问于2019-03-26
得票数 2
回答已采纳
1
回答
有没有办法加快对较小
的
data.frames
的
细分
、
、
、
我必须频繁地对data.frame序列进行
子集
(每次运
行数
百万次)。data.frames大约大小为200行x30
列
。根据不同
的
状态,data.frame中
的
值从一个迭代到下一个迭代。因此,在开始
时
做一个
子集
是行不通
的
。 与问题形成对比
的
是,我正在寻找data.frame/
data.table
的
给定大小
的
子集
的
加速设置。下面的最小可重现
浏览 4
提问于2017-04-10
得票数 1
回答已采纳
2
回答
R使用.SD
时
data.table
聚合速度较慢
、
我正在
data.table
上做一些聚合(很棒
的
包!)我发现.SD变量在很多方面都非常有用。但是,当有许多组
时
,使用它会显著降低计算速度。下面是一个示例:x =
data.table
(id=sample(1e4,1e5,replace=T), code我应该避免使用.SD而支持单个
列
吗?提前谢谢。
浏览 3
提问于2013-03-07
得票数 15
回答已采纳
1
回答
当数据表没有
列
时
,DT::renderDataTable中
的
formatCurrency
、
、
、
、
我在我漂亮
的
应用程序中使用renderDataTable来显示
data.table
$content4表
的
内容,该表是一个reactiveValues。可能会发生这样
的
情况: vals$content4table等同于一个没有
列
的
datatable。在这种情况下,我在使用formatCurrency
时
出现错误,因为它搜索不
存在
的
列
。有没有办法检查datatable中是否有使用ifelse
的
列
浏览 19
提问于2020-09-16
得票数 2
1
回答
使用doParallel从多个文件中分离大量数据集
的
有效方法
、
、
、
我有大量
的
文件,我需要读到R中,把它们放到一个数据框架中,然后被一个特定
的
列
("pracid")分割。计算将在集群上执行。我
的
代码正在处理数量较少
的
文件,但是使用所有文件
时
的
数据量对于R来说太大了。
Data.table
::rbindlist中
的
错误(Dat):列表中
的
总
行数
为3479242206,比最大
行数
(当前为21474833647 )要大。 我还必须在另一
浏览 0
提问于2020-09-11
得票数 0
回答已采纳
2
回答
从两个不同
的
数据表中获取等号行
的
索引。
、
、
lapply(1:2,function(x) seq(S.min[x],S.max[x],S.disc[x]))Actions <-
data.table
Actions,c("k1","k2","i","l1","l2"))作为一个R初学者,我很难将这个示例扩展到所有
列
。在我
的</e
浏览 5
提问于2020-04-02
得票数 0
回答已采纳
1
回答
R条件计算日期差异
、
、
我需要找出一种快速
的
方法来有条件地找到数据表中两个日期之间
的
差异,单位是天。我设法用"ifelse“语句做到了这一点,但它在大型
对象
上速度很慢,所以我
的
问题是,有没有一种更快、更优雅
的
方法来实现同样
的
目标,也许可以使用像":=”之类
的
data.table
命令。谢谢。J. library(
lubridate
) a <-
浏览 22
提问于2021-11-22
得票数 0
2
回答
使用dplyr在两个数据流中匹配时间戳
、
、
、
所以我有这样
的
数据ID timestamp value1 2018-08-0108-02 07:59:00 2018-08-02 08:50:00 2因此,我想使用mutate创建一个新
的
列
,它会变异DF2,告诉我在startTime和endTime之间是否有任何时间出现在与ID匹配
的
DF1中。-08-02 8
浏览 2
提问于2020-07-01
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
好强一个Julia!CSV数据读取,性能最高多出R、Python 22倍
R语言必学包之dplyr
从具体实践出发,手把手教你 TDengine 最佳建模方式
软件测试笔记|Python编程基础|Pandas 知识精要
肝了3天,整理了90个Pandas案例
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券