腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3247)
视频
沙龙
1
回答
Python
-按
时间
间隔
合并
数据
(
R
data.table
模仿
?)
python
、
r
、
date
、
time-series
、
data.table
我正在学习
python
,并且有一个关于按
时间
集成
数据
帧的问题。例如,假设我有2个独立的
数据
帧,
时间
间隔
不规则,但
按
study_id分组。我想加入彼此相隔2小时内的行。在此之前,我在
R
中使用了
data.table
包。下面是此代码的一个示例。date_df2`, units="hours") <= 2 & difftime(`date_df1`, `date_df2`, units="hours
浏览 19
提问于2019-03-03
得票数 0
3
回答
在
python
中有类似于
R
data.table
的东西吗?
python
、
r
、
data.table
我是一个
R
用户。我试着把我的
R
习惯翻译成
python
。在
python
中有类似于
R
data.table
的东西吗?
浏览 3
提问于2020-08-21
得票数 0
1
回答
在同一个操作中聚合和连接同一个表-
python
python
、
r
、
merge
、
aggregate
在
R
中,您可以在一行中轻松地聚合和连接到同一个
data.table
上。我想知道
Python
中是否有类似的东西,我可以不用在表上单独聚合,然后
合并
它。这相当于
R
:> DT =
data.table
(Col1 = c('A','A','A','B','B','B'), Col2 = c(1,2,3,
浏览 1
提问于2021-08-17
得票数 1
回答已采纳
1
回答
合并
流中重叠区间的摊销复杂性
algorithm
、
merge
、
stream
对于
合并
数据
流中的
间隔
的问题,一种方法是将每个传入
间隔
存储在最小堆中(
按
间隔
的开始排序)。如果需要,每个add(interval)都会向堆中添加
间隔
,并将其与重叠的
间隔
合并
。据说,每个add的复杂度可能比logn差,但摊销
时间
将被指定为logn。 对于为什么这是真的,我无法真正发展出直觉。我知道,如果
合并
是必要的,add(interval)可能会比logn花费更长的
时间
,因为我们需
浏览 5
提问于2022-04-16
得票数 0
回答已采纳
1
回答
绘制有约束的
时间
序列
r
我有一个很大的
数据
集,我想绘制zizi与hour的关系图,但只针对每个小时,而变量如下所示: [1] 23 23 23 23 23 23 23 23每个
数据
之间只有5分钟的
间隔
。我该怎么做这个图呢? Thx
浏览 1
提问于2016-04-22
得票数 0
1
回答
参考传递H2O帧
r
、
h2o
我正在处理一个非常大的
数据
集,我希望尽可能多地将
数据
保存在H2O中,而不将其带入
R
。 我注意到,每当我将H2O Frame传递给函数时,对框架所做的任何修改都不会在函数之外反映出来。我的
数据
集是30 My 100 My。因此,希望确保传递它们不会导致内存问题。
浏览 4
提问于2016-01-09
得票数 0
回答已采纳
1
回答
使用
R
中的
data.table
在
时间
戳和
时间
间隔
上
合并
数据
datetime
、
r
我需要加入两个dataframes (x和y),条件是x中的
时间
戳在y中两列的
时间
间隔
内。我使用
data.table
::foverlaps()实现了这一点,我在这个stackexchange问题中修改了一些代码),但是为了让它在我的
数据
上工作,我必须设置key of
data.table
x如果是这样的话,我们欢迎关于如何完成这个
数据
合并
任务的新想法。library(
data.table
)x <-
浏览 0
提问于2019-07-22
得票数 3
回答已采纳
2
回答
将Google股票
数据
中的
时间
戳转换为适当的日期
时间
r
、
datetime
、
split
、
data.table
、
unix-timestamp
我正在尝试将股票
数据
中的
时间
戳从转换为一种更有用的日期
时间
格式。我使用
data.table
::fread读取
数据
1: a1497619800完整的
时间
戳由前面的“a”表示。就像这样:a1092945600。“a”后面的数字是Unix
时间
戳。..。 没有前导a的数字是“
间隔
”。因此,例如,下面的<e
浏览 3
提问于2017-08-26
得票数 2
回答已采纳
2
回答
通过最接近的匹配连接两个
数据
帧
r
、
merge
、
match
、
numeric
、
approximate
我有两个大型
数据
集,它们唯一的共享特征是数字
时间
戳。我想
按
这个
时间
戳
合并
数据
帧,但
数据
收集的频率不完全匹配,所以我需要允许它与最近的可能匹配
合并
。start2", "end2", "start1", "end1", "start2", "end2") c<-c("A","A","A&quo
浏览 3
提问于2021-07-04
得票数 1
2
回答
R
时间
间隔
数据
类型
r
、
types
、
timedelta
R
中是否有
时间
间隔
数据
(变量)类型?我有一个带有日期、
时间
和
时间
间隔
列的CSV文件。datetime列的
数据
类型可以是POSIXlt,但我不知道如何为另一列设置
时间
间隔
数据
类型。这是可能的,或者什么是处理
R
中
时间
惰性的最佳方法?CSV文件中的
时间
间隔
值类似于以下<number of days> %H:%M:%S
浏览 4
提问于2016-08-12
得票数 0
回答已采纳
1
回答
在
data.table
中寻找
间隔
r
、
data.table
、
intervals
我有一个
data.table
A:B =
data.table
(firmID = c("89031", "89031"), STARTdate = c("20170403"
浏览 0
提问于2018-11-26
得票数 0
回答已采纳
2
回答
R
-在
时间
期限/
间隔
内
合并
两个
数据
集
r
、
dplyr
我仍然在学习
R
,在尝试
合并
来自两个不同
data.table
的两个
数据
集并在
时间
间隔
内匹配它时遇到了困难。1/1/2018 22:30 23:30 目标是将运行在start_time表的"end_time“和”table2_watch“之间的程序
合并
起来,并每次添加一个人在这段
时间
间隔
内观看的程序。HBO 1/1/2018 22:30
浏览 0
提问于2018-07-11
得票数 4
回答已采纳
1
回答
条件
data.table
与.EACHI
合并
r
、
data.table
我一直在玩更新的
data.table
条件
合并
功能,它非常酷。在这种情况下,我有两个表,dtBig和dtSmall,当条件
合并
发生时,这两个
数据
集中都有多个行匹配。这里有一个可重复的例子,试图
模仿
我想要完成的事情。设置环境## install.packages("
data.table
", type = "source",repos = "
浏览 4
提问于2017-04-02
得票数 7
回答已采纳
2
回答
.&.)在
R
中
r
我希望加快
R
中搜索与table2匹配的表1元素的行#的一小段代码(见下文)。注意,哪个条件有一个&,因为我需要两个元素x&y是相同的,以便选择行。 我的
数据
集很大,这个循环非常慢。
浏览 1
提问于2019-01-11
得票数 0
回答已采纳
2
回答
根据ID将所有
数据
除以另一个data.frame
r
我想将SkinTemp
数据
除以每个ID的最小值:structure(list(id = c("1", "1", "1", "1", "1", "1", "1", "34.754, 20.57, 22.879)), .Names = c("minID", "x"), row.names = c(NA, 6L), class = "data.f
浏览 2
提问于2017-01-11
得票数 0
回答已采纳
1
回答
Group by with
data.table
using sum
r
、
group-by
、
data.table
我有一个
数据
框,我想
按
用户分组,并求出数量的总和。library(
data.table
)"dates_d" "user" "p
浏览 34
提问于2018-09-13
得票数 -1
2
回答
将带
时间
戳的
数据
与另一个
数据
集中最近的
时间
进行匹配。正确矢量化了吗?更快的方式?
r
、
match
、
apply
我在一个
数据
帧中有一个
时间
戳,我试图将其与第二个
数据
帧中最接近的
时间
戳进行匹配,以便从第二个
数据
帧中提取
数据
。-01 14:06:00 3 7这种方法工作得很好,只是速度非常慢,因为在我的实际应用程序中,引用
数据
帧相当大
浏览 47
提问于2015-06-29
得票数 24
回答已采纳
1
回答
为什么字典中的
数据
通过网络在
R
中的行为与独立的
数据
from有所不同?
python
、
r
、
pandas
、
dataframe
、
reticulate
我正在使用
R
内部的网状,并试图将熊猫
数据
从字典转换为
R
数据
,但我发现转换不起作用,我不知道为什么?我希望能够使用
R
语法(即$)访问dataframe列。当我在
Python
中生成一个独立的
数据
文件并将其返回给
R
时,我没有问题。在
Python
中 b=pd.DataFrame(np.ones(a)*x) return['
浏览 1
提问于2019-08-21
得票数 3
回答已采纳
2
回答
使用
data.table
按
组计算和格式化行间
时间
差
r
、
diff
、
data.table
我对
data.table
的“场景”很陌生,所以如果我的问题过于简单,我很抱歉。我一直处于需要应用一些分析或子集的位置,一些
数据
按
唯一ID分组。通常,每个唯一ID有大约1000行,大约有30个唯一ID。因此,我被建议切换到
data.table
,而不是试图找出lapply或sapply或plyr包。因此,要采取Time2-Time 1,
按
个人(在本例中为ID)获取每个连续位置之间的小时和分钟。因为我不理解
data.table
是如何处理
时间
的。一旦我将
数据
分
浏览 3
提问于2013-12-12
得票数 3
回答已采纳
1
回答
使用spark作业写S3和雅典娜进行查询时如何使
数据
高可用
apache-spark
、
amazon-s3
、
pyspark
、
amazon-athena
我存储了一个
数据
流,通过firehose传输到S3,并在雅典娜中创建了表来查询这些
数据
。S3中的
数据
是根据clientID、date等字段进行分区的。spark作业正在处理这些以固定
时间
间隔
传入的
数据
。在每次运行时,spark作业获取
数据
(增量-针对该
时间
间隔
),将其与S3中该分区中已有的基本
数据
合并
(在存在重复记录的情况下
按
上次修改
时间
合并
),
浏览 2
提问于2020-02-07
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
CSV数据读取,性能最高多出R、Python 22倍
微软送你两个月DataCamp订阅啦!
R语言必学包之dplyr
到2025年,这些优秀技术的地位仍将保持不变
如何用 Python 编写你喜爱的 R 函数
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券