将Pandas DataFrame重新采样为每小时使用小时作为中点_熊猫将每小时OHLC重新采样为每日OHLC_将每日数据重新采样为每小时数据帧并复制内容 - 腾讯云开发者社区

、

我试图使用Pandas从一个相当大的数据集的一分钟数据中计算每小时的平均值。我的数据集存储为.csv，如下所示： ,timestamp_local,pm25 0,5/30/2022 16:59,2.2802 1,5/30/2022 16:58,2.7055 2,5/30/2022 16:57,1.6602 3,5/30/2022 16:56,1.5924 4,5/30/2022 16:55,2.2792 5,5/30/2022 16:54,2.2219 我尝试将.csv文件读取为Pandas DataFrame，然后将每小时的方法存储在一个新的DataFrame中，然后导出： import p

浏览 11提问于2022-07-21得票数 0

回答已采纳

1回答

使用Pandas获取最接近时间戳的值

、

我使用pandas从具有15分钟采样间隔的数据集中获取每小时一次的数据。我在使用resample('H', how='ohlc')方法时遇到的问题是，它会提供该小时内的值，而我希望得到最接近小时的值。例如，我想取一个在2:55采样的值，而不是3:10采样的值，但是我不知道如何找到最接近的值，如果它出现在被评估的时间戳之前。任何帮助都将不胜感激。

浏览 2提问于2013-11-06得票数 1

2回答

对时间序列数据进行重采样

、

我有一些随机的每小时时间序列数据(让我们编造一些)，我如何为每日最大值重新采样，以及为记录的每日最大值所在的小时创建单独的df列？ import pandas as pd import numpy as np from numpy.random import randint import os np.random.seed(10) # added for reproductibility

浏览 25提问于2020-03-03得票数 3

回答已采纳

1回答

在R中将xts转换为ts对象时了解频率参数

、、、

下面频率的含义是什么；当我将我的xts对象转换成ts对象并尝试打印ts对象时，我得到了下面的信息。我的数据是每小时的数据。但我不能理解这个低于频率是如何计算的。我希望确保我的ts对象将我的数据视为每小时的数据。 Time Series: Start = 1 End = 15548401 Frequency = 0.000277777777777778 (how this is equivalent to hourly frequency?) 因此，我的数据帧最初如下所示： y 1484337600 19.22819 14843

浏览 9提问于2017-07-13得票数 1

回答已采纳

1回答

将minut数据转换为30分钟/小时

、、

我正试图将以分钟为单位收集的数据转换为每隔30分钟1小时的一次。Dataframe是： dateTime stepsDaily 2019-11-11 11:58:00 0 2019-11-11 12:00:00 7 2019-11-11 12:01:00 27 2019-11-11 12:08:00 0 2019-11-11 12:13:00 0 ... ... 2020-07-26 14:04:00 0 2020-07-26 14:07:00 0 2020-07-26 14:08:00 0 2020-07-26 14:09:00 0 2020-07-26 14:10

浏览 3提问于2020-08-01得票数 0

回答已采纳

4回答

如何对每列应用不同功能的数据进行重采样？

、、、

我在一只熊猫dataframe里有一个关于温度和辐射的倍数系列。按规则步骤计算，时间分辨率为1分钟。 import datetime import pandas as pd import numpy as np date_times = pd.date_range(datetime.datetime(2012, 4, 5, 8, 0), datetime.datetime(2012, 4, 5, 12, 0), freq='1min') tamb = np.random

浏览 3提问于2012-04-04得票数 47

回答已采纳

2回答

在缺少时间框架的情况下，将NaN值填充到连续时间序列数据

、、、、

我问题的一个例子处理每小时变化的时间序列数据，其中包含从2016-01-01 00:00到2016-01-07 23:00的日期时间，以及与每个时间框架相对应的一些功能。理想情况下，将有涵盖所有时间段的7x24行数据。但有时，每小时的数据可能会因某种原因而中断(例如，捕捉每小时的天气信息，但网站在特定时间内被破坏)。我的dataframe现在包含所有相同的数据，而不缺少一个小时。我的数据长度为7 *24 - 5，这意味着每小时有5个数据丢失。日期时间以201601010100表示2016-01-01 01:00:00的格式保存。我的尝试。我尝试生成包含连续每小时日期时间的长度为7*

浏览 3提问于2016-12-17得票数 1

回答已采纳

2回答

如何实现与how中的用户计数相同的吞吐量？

、、

我怎么能低于每小时的交易。我试着只使用一次控制器来控制登录，但是每小时的事务处理仍然超过70次。怎么处理这个？用户总数为70 登录每小时交易-主页每小时70笔交易- 100

浏览 5提问于2020-10-26得票数 0

回答已采纳

2回答

Pandas计算机每小时平均值，并设置在时间间隔的中间

、、

我想要计算风速和风向的时间序列的每小时平均值，但我想将时间设置为半小时。因此，从14:00到15:00的值的平均值将是14:30。现在，我似乎只能在区间的左边或右边得到它。这是我目前所拥有的： ts_g=[item.replace(second=0, microsecond=0) for item in dates_g] dg = {'ws': data_g.ws, 'wdir': data_g.wdir} df_g = pandas.DataFrame(data=dg, index=ts_g, columns=['ws','wdir&#

浏览 0提问于2016-11-05得票数 4

1回答

对时间序列进行重采样

、、、、

我有一个40年的时间序列，格式为stn;yyyymmddhh;rainfall，其中yyyy= year，mm = month，dd= dd=，hh= hour。该系列的分辨率为每小时一次。我通过下面的groupby方法提取了每年的最大值： import pandas as pd df = pd.read_csv('data.txt', delimiter = ";") df['yyyy'] = df['yyyymmhhdd'].astype(str).str[:4] df.groupby(['yyyy'])[&#

浏览 2提问于2021-04-29得票数 0

1回答

在Pandas中，如何计算在特定时间范围内出现的次数？

、、

我正在查看急诊室的数据，并希望为每小时到达急诊室的患者数量建立一个时间序列。我的数据集在一列中有患者到达的日期和时间(因此，第1行可能是'1/12/13，19:21:12'，但转换为pandas日期范围。数据集本身存储在pandas DataFrame中。DataFrame中的日期列存储为系列。我该如何汇总和存储每小时到达的患者数量，并将它们绘制在时间序列中？我希望每个数据点都是“1月15日下午1点到2点之间的5个病人”。

浏览 1提问于2014-06-24得票数 0

3回答

数据聚合和分割的列车测试样本

、、、

我正在从事一个数据科学项目，该项目的目标是根据建筑物的一些特点(例如，大小、位置等)预测建筑物的日耗电量。以及天气特征(例如，温度、湿度、风、雨、太阳辐射)。我的一些天气特征(温度、湿度、风)是每小时一次，另一些是在每天的间隔(雨，太阳辐射)。我的目标(每日用电量)也是每小时一次。我的目标是预测每天的消费，所以我需要将我的输入数据集中在一个每日间隔(消费的24个值之和，平均24个温度，.)。我的问题是:我是否必须在分割列车/后测试之前汇总数据? 如果我先进行聚合，我将只考虑那些有24个值的日子(每小时一次)，为了不引入偏见，我会丢弃其他值，然后我将拆分训练/测试。因此，基本上，我将清理我

浏览 0提问于2018-09-19得票数 1

回答已采纳

1回答

使用Python和ggplot绘制平均值

、、、、

下面的代码生成了下面的图形： from pandas import * from ggplot import * plot = ggplot(data, aes('x','y')) \ #from dataframe 'data', columns x and y + geom_bar(stat='bar', fill='blue') + ggtitle('Graph of X and Y') \ +scale_x_continuous(name="X-Axis", br

浏览 1提问于2015-01-28得票数 1

2回答

从Snowflake卸载数据并每小时更新JIRA API的有效方法

、、、

我们有一个当前的设置，python应用程序将通过它从SQL中提取数据，将它们放到pandas dataframe中，检查业务逻辑并更新JIRA问题的字段。 issue.update(fields=update_dict) 我正在尝试构建相同的应用程序来从表中卸载Snowflake数据并更新JIRA问题的字段。我考虑的设计方法是将Snowflake数据卸载到S3。使用python应用程序将s3文件加载到pandas数据帧并更新JIRA。 JIRA每小时需要更新一次。有没有更好的方法来通过从Snowflake获取数据来每小时更新一次JIRA问题？请给我建议。

浏览 25提问于2021-07-13得票数 0

1回答

按每小时索引聚合数据帧列

、

所以我有一个pandas数据帧，它每10分钟接收一次输入/输出接口流量。我想将这两个时间序列聚合到每小时一次的存储桶中进行分析。看似简单的事情实际上对我来说却是相当具有挑战性的！只需要把桶放到每小时的垃圾桶里 times = list() ins = list() outs = list() for row in results['results']: times.append(row['DateTime']) ins.append(row['Intraffic']) outs.append(row['Outtr

浏览 9提问于2019-08-09得票数 0

2回答

如何整天定义CustomBusinessHour？

、、、、

我分析了每天24小时工作的设备每小时(但不是全年)的运行情况，但我在以下方面有错误： from pandas.tseries.offsets import CustomBusinessHour Use=CustomBusinessHour( start='00:00', end='24:00', weekmask=(1,1,1,1,1,1,0) ) 或 Use=CustomBusinessHour( start='00:00', end='00:00', weekmask=(1,1

浏览 4提问于2020-05-03得票数 3

回答已采纳

2回答

使用重采样对datetime索引的pandas数据帧进行数值积分。()

、、

我想将5分钟的间隔整合为1小时。有没有办法在熊猫身上做到这一点？类似于如何使用重采样来缩小和平均？我想要缩小比例，并使用5分钟数据返回每个1小时周期的积分。 import pandas as pd np.random.seed(1234) df = pd.DataFrame(np.random.rand(300,4), columns=list('ABCD'), index=pd.date_range('2017-01-01 09:00:00', periods=300, freq='5min')) df=df.resample('1h&

浏览 19提问于2017-02-07得票数 2

1回答

Python/Pandas将行合并为一行，并决定在每一列中执行什么操作

、、、

我有一个Pandas DataFrame (数据)，列有“日期”(日期时间)、“工时”(时间增量)、“薪资”(浮动)、“每小时薪资”(浮点数)、“距离”(浮动)、“最低工资”(浮动)。如何根据对所有列相同的列值将行组合为1行，但如何分配如何计算其他列的值？，我希望基于相同日期的['Date'].dt.date组合行。并为每一列分配不同的操作。例如，对于“工作时数”(sum)、“工资”(sum)、“每小时薪资”(平均)、“距离”(sum)、“最低工资”(最低工资)] 我根据date：data[data['Date'].dt.date.duplicated()]

浏览 9提问于2022-04-28得票数 1

1回答

修改潘达斯每小时时间轴上的蜱数

、、、、

如果我有以下使用的Python代码示例： import pandas as pd from datetime import datetime ts = pd.DataFrame(randn(1000), index=pd.date_range('1/1/2000 00:00:00', freq='H', periods=1000), columns=['Data']) ts['Time'] = ts.index.map(lambda t: t.time()) ts = ts.groupby('Time').mea

浏览 6提问于2013-11-16得票数 2

回答已采纳

1回答

取Pandas DataFrame的某些特定日期和时间的值

、、

我正在尝试从csv文件创建一个表，其中该表必须只包含2016-02-19的数据，并且每小时只能包含一行数据。例如，对于dataframe：我已经有了2016-02-19年间的数据，但我无法过滤1小时的时间增量。结果必须是2016-02-19 00:00:00,2016-02-19 01:00:00,2016-02-19 02:00:00等的数据。 train.set_index(pd.to_datetime(train.timestamp)) df = train["02/19/2016"] 到目前为止，我已经这样做了，如果有人也知道如何按小时过滤，这将是非常有帮

浏览 8提问于2022-02-14得票数 -1

1回答

太阳能光伏-如何将每日GHI转换到倾斜的表面？

、

我正在尝试仅从每日GHI估计光伏输出。有没有办法将每天的温室气体指数转换为倾斜表面上的总辐射，即太阳能电池板？或者，我是否必须使用模型转换为每小时的GHI值，然后计算光束和漫射值等？我正在使用的GHI数据在这里。( ) 谢谢

浏览 9提问于2020-07-30得票数 2

1回答

如何从Python 3.5中的数据框中找到最大值的确切位置- modified

、、

我在Python3.5中有一个DataFrame，例如： In [1]:tway5new.info() <class 'pandas.core.frame.DataFrame'> Index: 44 entries, to VOI Columns: 43802 entries, 2011-01-01 00:00:00 to 2015-12-31 23:00:00 dtypes: int64(43802) memory usage: 14.7+ MB 此Dataframe的列名为： In [2]:tway5new.columns Out[2]: Datet

浏览 1提问于2016-05-25得票数 1

3回答

熊猫每日数据重采样，没有日期时间索引

、、、

我有以下形式的熊猫资料： timestamps light 7 2004-02-28 00:58:45 150.88 26 2004-02-28 00:59:45 143.52 34 2004-02-28 01:00:45 150.88 42 2004-02-28 01:01:15 150.88 59 2004-02-28 01:02:15 150.88 这里请注意，索引不是时间戳列。但我想重新整理(或以某种方式储存数据)，以反映每分钟、每小时、每一天光柱的平均值。我已经研究过熊猫提供的resample方法，它要求dataframe有一个数据索引才能工作

浏览 3提问于2016-06-15得票数 11

回答已采纳

1回答

用Python将每小时的信息与每月的信息相乘，最有效的方法是什么？

、、

我有以下代码： import pandas as pd import numpy as np np.random.seed(0) rng_H = pd.date_range(start='1/1/2024', end='31/12/2050', freq='H') df_H = pd.DataFrame({'Date': rng_H, 'Val': np.random.randn(len(rng_H))}) rng_M = pd.date_range(start='1/1/2024', end=

浏览 19提问于2021-04-01得票数 0

回答已采纳

2回答

如何使用python从SQL表中获取每小时的前一小时数据？

、

基本上我有一个带有名称、CustomerID、PurchaseDateTime列的SQL表。每小时我都有一个模型，它必须基于python中的这三列运行，它应该获取前一个小时的数据。在python中，我用来获取前一小时数据的select脚本如下所示，它将存储在Pandas dataframe中并用于模型。 def CustomerData(): sql = "SELECT Name, CustomerID, PurchaseDateTime FROM XYZ table WHERE (PurchaseDateTime between '' and '&#

浏览 2提问于2020-05-19得票数 0

3回答

在Pandas DataFrame上迭代以提取数据

我有一个DataFrame，它在列中包含小时间隔，在行中包含员工ID。我想迭代每一列(每小时间隔)，并仅当该列包含数字1 (1表示在该小时内可用，0表示不可用)时才将其提取到列表中。我已经尝试了iterrow()和iteritems()，但这两种方法都没有给出我想要从这个DataFrame中看到的东西这是一个新列表，名为可用= 0800、0900、1000、1100 然后，我可以提取最小值和最大值来创建计划。如果我对Python3和Pandas很陌生，我很抱歉

浏览 22提问于2021-05-18得票数 0

回答已采纳

2回答

如何根据时间值对CSV中的数据进行分组，以便可以计算每个小时的频率？

、、、

这是我的数据集我想按照“时间”和“类型”对数据集进行分组，这样我就可以得到每小时的“名称”频率。每小时有多少种类型，它们的名字是什么。我的第一个要求是根据“时间”-每小时对数据集进行分组。我在Python中使用Pandas。

浏览 0提问于2018-07-19得票数 0

回答已采纳

1回答

作为Pandas中的索引的每日计划

、、、、

我想表示一个日程表，最初作为CSV文件提供，作为Pandas DataFrame。明细表中每行的关键字是一天中的每小时范围。范围不重叠。例如： 00:00, 01:00, some data 01:00, 03:00, some more data 03:00, 04:30, some other data 如何创建一个具有表示开始到结束小时范围的一级索引的数据框？

浏览 1提问于2015-02-08得票数 0

1回答

Python Pandas重采样不重采样

、

我在熊猫有一个时间序列，有频繁的条目(+-每十秒)。我尝试重新采样到每小时条目，取平均值，但没有效果。我错过了什么？来源： import pandas as pd tempfile = pd.read_csv("test.txt",";",squeeze=True) tempfile["datetime"] = pd.to_datetime(tempfile["datetime"]) tempfile = tempfile.set_index('datetime') tempfile.resample(&#

浏览 25提问于2021-02-11得票数 0

1回答

将日期时间00:00:00更改为24:00:00

、、、

我有每小时的数据，每天从00到23小时。我想要做的就是把前一天的00切换到24。下面是一个数据示例： import pandas as pd data = {'datetime' : ['19DEC08:22:00:00', '19DEC08:23:00:00', '20DEC08:00:00:00', '20DEC08:01:00:00', '20DEC08:02:00:00'], 'entry' : ['a','b'

浏览 70提问于2019-01-25得票数 0

4回答

一群熊猫的计算平均值

、、

我有一个关于twitter的非常大的数据集。我希望能够计算用户每小时发布的平均tweet。我能够按每个用户每小时的推文进行分组，但现在我如何计算每小时的平均时间呢？我无法编写所有的代码，因为数据集已经进行了大量的预处理。在数据集中，我有列user_id和created_at，这是发布的tweet的时间戳，所以我按created_at排序，直到几个小时都是按群排序。 grouped_df = tweets_df.sort_values(["created_at"]).groupby([ tweets_df['user_id'], tweets_d

浏览 9提问于2022-11-04得票数 1

回答已采纳

3回答

ec2现货完整价格历史

我正在使用API来获取ec2现货价格历史，但除了最近90天左右之外，我无法获取任何信息，并且无法指定观察频率。有没有办法获得现货价格的完整历史，最好是每分钟或每小时的频率？

浏览 1提问于2013-01-19得票数 9

1回答

Pandas设置依赖于另一个数据帧的元素样式

、、

当我写这个问题的时候，我想出了一个实现。我决定仍然发布它，因为样式是相对较新的，并且还没有太多的问题，所以我希望它可以被证明对其他人有用。我希望不会得到任何反对票，并将很高兴接受别人的实现。我在meta和中通读了，所以我希望我是清楚的。如果需要，我可以在下面提供我的实现。我有一个按日均值分组的每小时时间序列。如果每小时数据中的某个值满足某个阈值，我希望突出显示分组数据中的单元格。例如，如果我的日平均值是1，阈值是values < -1，我想突出显示每小时值小于-1的日平均值。我的每小时数据： import pandas as pd import numpy as np from d

浏览 2提问于2017-12-21得票数 1

3回答

我怎样才能得到上午/下午的日期格式？

、、

我有这样的代码： arr=pd.date_range(start='1/1/2021', end='12/31/2021 23:00:00', freq='h') df = pd.DataFrame({'year': arr.year}) dg = pd.DataFrame({'month': arr.month}) dh = pd.DataFrame({'day': arr.day}) di = pd.DataFrame({'hour': arr.hour,'minut

浏览 9提问于2022-11-14得票数 0

2回答

谷歌核心报告应用编程接口v4:每小时获取结果？

、、、、

在使用Google Core Reporting API时，您可以使用v4查询。现在我想按小时查询，而不是按天查询，以便在发生采样的情况下更深一层。现在我知道这可以通过添加维度DateTime来完成，但是，这给我留下了一个不能再使用的维度槽。这是一个问题，因为它被限制为7。另外，如果我考虑一下，添加ga:hour维度可能会给我更多的结果，因为它创建的是同样的报告，其中包含更多的详细信息。它不会在“一个小时”内获得数据。我知道在使用谷歌UI.The问题时可以获得每小时的数据:如何从谷歌核心报告v4 (yyyy-MM-dd-HH)获得每小时的数据？

浏览 20提问于2017-07-25得票数 1

回答已采纳

3回答

如何选择每小时一次的随机时间

、

假设我想每小时运行一次任务，但是在一小时内的不同时间运行一次。它不一定是真正随机的；例如，我只是不想在每个小时的顶部做它。我只想每小时做一次。这就消除了几种明显的方法，比如在30到90分钟之间随机睡一段时间，然后再睡一次。任务有可能(也很有可能)连续运行几次，睡眠时间略高于30分钟。我正在考虑的方法看起来像这样:每小时，散列该小时的Unix时间戳，并将结果修改为3600。将结果添加到小时的Unix时间戳中，这就是任务应该运行的时刻。在伪代码中： while now = clock.tick; do // now = a unix timestamp hour = now - now

浏览 0提问于2013-02-12得票数 1

1回答

每小时爬行1M的资源

、

我正在寻找关于我应该为爬虫贡献多少资源(主要是CPU和RAM )的迹象，以便能够每小时平滑地爬行大约1M个页面。我在单个节点上运行所有内容，并使用ES实现持久性。我在1M域中做了一个递归抓取。谢谢!

浏览 12提问于2018-01-12得票数 0

回答已采纳

1回答

从string构建Pandas pd.tseries.offsets

、、、

熊猫为DataFrame和名为resample的时间序列提供了一个方法。请参阅和此方法有一个名为rule的参数。因此，我们可以这样做(用2小时的采样周期重采样)： ts2 = ts.resample('2H', how='mean') 我正在寻找一种将这个'2H'字符串参数转换为Pandas pd.tseries.offsets的方法 (因为 In [10]: ts2.index.freq Out[10]: <2 * Hours> 和 In [11]: type(ts2.index.freq) Out[11]: pandas.

浏览 4提问于2014-11-15得票数 0

回答已采纳

2回答

在Python中将年度数据作为函数插入到每小时一次。

、、、

我希望每年的人口数据，并插入到一个小时的时间序列。我正在尝试创建一个函数，它为给定的样本年的每小时人口的每个唯一名称生成一个时间序列。我已经包括了下面的代码以及示例数据： import pandas as pd import random from scipy.interpolate import interp1d name = ['RI', 'NH', 'MA', 'RI', 'NH', 'MA','RI', 'NH', 'MA','RI&

浏览 2提问于2021-10-01得票数 0

回答已采纳

2回答

如何使用Pandas找到具有特定日期的所有行？

、

我有一个简单的Pandas DataFrame，包含'valid_time'和'value'列。抽样的频率大约是每小时一次，但不规律，而且有一些很大的差距。我希望能够有效地提取给定一天的所有行(即在日历日内)。我怎样才能使用DataFrame.where()或其他什么工具来完成这个任务呢？我天真地想做这样的事情(显然不起作用)： dt = datetime.datetime(<someday>) rows = data.where( data['valid_time'].year == dt.year and

浏览 5提问于2014-01-30得票数 0

回答已采纳

3回答

如何重新采样/减少不规则的时间戳列表？

、、、、

SImple问题，但我还没有找到一个简单的答案。我有一个数据列表，它以秒为单位计算事件发生的时间： [200.0 420.0 560.0 1100.0 1900.0 2700.0 3400.0 3900.0 4234.2 4800.0 etc..] 我希望计算每小时发生多少个事件(3600秒)，并创建这些计数的新列表。我知道这叫做下采样，但我能找到的所有信息都与传统的时间序列有关。对于上面的示例，新列表如下所示： [7 3 etc..] 任何帮助都将不胜感激。

浏览 5提问于2015-02-10得票数 3

回答已采纳

1回答

Pandas Dataframe输出到JSON

、、

我有一个带有DateTimeIndex的Pandas Dataframe和带有每小时对象的列，我想将单个列转换并输出到一个JSON文件中，该文件由每小时值的每日数组组成。一个简单的例子：如果我有Dataframe： In [106]: rng = pd.date_range('1/1/2011 01:00:00', periods=12, freq='H') df = pd.DataFrame(randn(12, 1), index=rng, columns=['A']) In [107]: df Out[107]:

浏览 1提问于2013-03-08得票数 5

回答已采纳

1回答

在azure ML中过滤TabularDataset

、、、、

我的数据集是巨大的。我正在使用Azure ML notebooks，并使用azureml.core读取日期集并转换为azureml.data.tabular_dataset.TabularDataset。无论如何，我会过滤tabularDataset中的数据，而不是转换为pandas数据帧。我使用下面的代码来读取数据。由于数据量巨大，pandas数据帧正在耗尽内存。我不需要将完整的数据加载到程序中。仅需要子集。有没有办法在转换为pandas数据框之前过滤记录 def read_Dataset(dataset): ws = Workspace.from_config() ds

浏览 69提问于2021-01-06得票数 1

1回答

如何将每分钟数据的表格转换为小时数据的表格？

、、

我有一个包含分钟数据的表格。此表中缺少某些行。 import pandas as pd df = pd.DataFrame([ ("2019-02-15 17:56:00", 11, 10), ("2019-02-15 17:57:00", 22, 10), ("2019-02-15 18:00:00", 33, 20), ("2019-02-15 18:01:00", 44, 20), ("2019-02-15 18:02:00", 55, 20), ("2019-02-16 10:01:00"

浏览 53提问于2019-05-16得票数 1

回答已采纳

1回答

熊猫将每小时的时间序列重新采样为每小时的比例时间序列

、、

我正在处理每小时的时间序列(日期，时间(hr)，P)，并试图计算每个小时的每日总‘金额’的比例。我知道我可以使用Pandas‘resample('D'，how=' sum ')来计算P (DailyP)的每日总和，但在相同的步骤中，我想使用每日P来计算每个小时的每日P的比例(因此，P/DailyP)，从而得到每小时的时间序列(即，与原始频率相同的频率)。我不确定这是否可以被称为熊猫术语中的“重采样”。这可能从我的术语使用中很明显，但我在Python或编程方面是一个绝对的新手。如果有人能提出一个这样做的方法，我将非常感激。谢谢!

浏览 0提问于2013-05-05得票数 4

回答已采纳

2回答

重新采样到DatetimeIndex会引发错误

、、

我创建了一个DatetimeIndex，并希望使用该索引对数据进行重新采样。当我这样做的时候，我得到了一个异常： Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/local/lib/python2.7/dist-packages/pandas-0.8.1-py2.7-linux-i686.egg/pandas/core/generic.py", line 188, in resample limit=limit, b

浏览 0提问于2012-10-25得票数 0

1回答

如何使用DataFrame划分Pandas DataFrame

、

我正在编写一个Python脚本来从我的数码相机中导入图片，并且我正在使用Pandas来帮助对输入的图像进行簿记。我使用EXIF数据标记个别图像的信息，如相机模型，图像模式，图像格式和时间戳时，图像被获取的图像。这些数据用于将图像分隔到目录结构中。我正在苦苦挣扎的是如何使用Pandas来根据一组时间戳对图像进行分组，例如，这些时间戳都是在每小时半小时内完成的。举个例子，假设我有六张照片，其中三张是在九分钟内拍摄的，另外三张也是在九分钟内拍摄的，但一小时后。 import pandas import datetime rawdata = [{'filename': '

浏览 5提问于2014-11-13得票数 3

回答已采纳

1回答

熊猫重获最后一排

、、

我想重新整理一次每小时一次的数据，包括最后一年。我怎么能有效地做到这一点呢？我有以下数据： df2 = pd.DataFrame({'col' : [2, 3]}, index=['2018', '2019']) df2.index= pd.to_datetime(df2.index) df2 col 2018-01-01 2 2019-01-01 3 现在，我每小时重新整理它，并用相应的年值填充一年中每小时的值。 df2=df2.resample('h').f

浏览 1提问于2019-07-20得票数 2

回答已采纳

2回答

可以像iOS5天气应用程序那样向UITableView添加行吗？

、、

有没有一种方法可以在UITableView中添加行，方法是点击一行，然后表格动画显示一些“隐藏”的数据行？就像你可以在iOS 5天气应用程序中点击最近的一天，并显示每小时一次的天气视图一样？

浏览 0提问于2011-12-30得票数 2

1回答

基于日期范围计算和

、

我的DataFrame是这样的 df= pd.DataFrame({'Date':['2007-01-01 07:14:00','2007-01-01 07:25:00','2007-01-01 08:00:00', '2007-01-01 09:14:00','2007-01-01 09:33:12'],'sent':[0.32,0.34,0.45,0.7,0.22]}) 现在，我想根据每小时的日期范围添加新的列sum，例如，2007-01-01 07:00:00到2007-01-

浏览 2提问于2018-12-26得票数 1

回答已采纳