如何在熊猫数据帧上找到一天中几个小时的记录数量趋势？

、

我有一天中任何时候都有的记录。我想找出交通流量大的时段。数据帧有一个用于聚合的时间戳列。

浏览 24提问于2021-08-28得票数 1

回答已采纳

1回答

LSTM -如何实现假日特性

、、、

我的问题涉及如何在LSTM模型中实现固定假期，如这里所见，它不包含任何需求，因此导致突然强烈的1天偏离平均值。我特别不是指12月到1月之间的趋势变化。例如，Arima模型可以很好地处理这样的日子。在互联网上搜索了几个小时后，我所能找到的就是如何应对趋势的变化。但事实并非如此，走势不变，只暂停一天。我希望这里有人有一篇论文或一种

浏览 4提问于2021-11-20得票数 2

2回答

火花流-等待窗口聚合的数据？

、

我有数据的格式{主机?米制的值?值?时间戳}。我们有世界各地的主机报告指标。对于使用窗口操作(例如，1小时)来处理这样的数据，我有点困惑。我可以告诉我的窗口什么时候开始，还是它只是在应用程序启动时启动？例如，我想确保我正在汇总一天11小时的所有数据。如果我的窗户在10:50开始，我只会得到10:50-11:50而错过10分钟。即使是完美的窗口，数据</e

浏览 6提问于2017-06-27得票数 2

回答已采纳

1回答

利用熊猫创造变量的变化率

、、

我有一个熊猫数据集，它查看一个实例随时间变化的n案例的数量。我已从第一个记录日期按升序对数据集进行排序，并创建了一个名为“change”的新列。但是，我不确定如何从列n中获取数据并将其映射到“change”列，以便“change”列中的每个单元格表示与前一天的差异。例如，如果在第334天有n = 14000，在第335天有n = 14500情况

浏览 4提问于2022-02-19得票数 0

回答已采纳

2回答

从RDD中的Pandas DataFrames创建Spark DataFrame

、、

我正在尝试将每个worker节点(每个元素都是Pandas DataFrame的RDD )上的Pandas DataFrame转换为跨所有worker节点的Spark DataFrame。sc.parallelize(filelist) rdd = rdd.map(read_file_and_process_with_pandas) 前面的操作可以工作，所以我有一个Pandas DataFrames的RDD在完成熊猫处理后，我如何将其转换为Spark DataFrame？我试着做rdd

浏览 31提问于2019-06-05得票数 0

回答已采纳

1回答

使用正则表达式从tweet中提取标签的更快方法

、、、

我有一个熊猫数据帧，其中包含100万条tweet的详细信息，包括tweet本身和各种其他属性。我正在尝试从tweet中提取一个标签列表。重要的是，列表仍然与每个推文相关联，而不是所有推文中的标签列表。我的推文数量意味着它需要几个小时/几天的时间才能运行。有没有像我已经尝试过的那样在我的pandas数据帧上</

浏览 7提问于2019-02-02得票数 1

回答已采纳

2回答

数据框:基于值应用于两列

、、、、

假设我有一个简单的数据帧，例如：df = pd.DataFrame(data)如

浏览 30提问于2018-10-18得票数 2

回答已采纳

3回答

每24小时至少统计一次熊猫每小时数据帧中超过阈值的天数

、、、、

我有一个数据帧(df2)，其中包含1929年到2016年每24小时的数据[datetime (yy/mm/dd HH:MM)]和[obs (float)]。1/1/1929 22:00 0.0711/2/1929 0:00 -0.14212/31 2016 23:00 1.02 我想确定数据帧中每年

浏览 29提问于2019-07-24得票数 1

2回答

镶木地板内饰& Spark

、、

我有一个由每日批处理创建的dataframe，它运行特定的一天，然后保存在HDFS (Azure Data Lake Gen 2)中。，我没有对数据帧进行分区，因为它只包含一个日期。因此，作为示例，第一天的第一个文件将存储在文件夹中交易/2019/08/25 然后第二天，它就会在文件夹里交易/2019/08/26 问题是，当所有数据都被放入时，日期<em

浏览 7提问于2019-09-09得票数 0

回答已采纳

1回答

如果过滤数据上的COUNTIFS()

、

H:H,E2)))=SUMPRODUCT(SUBTOTAL(3,OFFSET(Data!G:G,ROW(Data!G:G)-MIN(ROW(Data!G:G))+0)背景故事：我有一个用来做服务台<

浏览 1提问于2015-10-21得票数 0

回答已采纳

1回答

如何在pandas中使用不同的变量在groupby中迭代groupby？

、、、

我有一个巨大的数据集，记录了50+城市一天中每小时的温度。我想要获取每个城市的最高、最低和平均气温的数据帧。For例如数据集包含城市日期时间温度我想要每个城市的数据帧，其中包含最高，最低和每天的平均温度(如city1_df，city2_df)等。我在groupby中尝试过

浏览 9提问于2021-05-05得票数 1

1回答

将r中的多个数据帧合并为条形图竞赛

、、

我有大约15个数据帧，每个看起来像下面的例子。每个数据帧表示一台机器在2019年-07-01到2020-06-30这12个月的特定一天的故障次数。15 10 8 4 6 0 1 因此，基本上，我需要一个15行366列的数据帧(一列是机器数量

浏览 2提问于2020-11-13得票数 0

回答已采纳

1回答

将开始时间和结束时间转换为密度/占用

、

我有一个数据帧，其中包含城市中车辆行程的开始和结束时间(以秒为单位)。我想为这座城市的占领情况生成一个图表，换句话说，整个时间有多少辆车。所以我得到的是这样的：1 | 3.1 | 78.0 3 | 31.1 |112.4 我的最终目标是分析1小时(3600秒)模拟的数据，但

浏览 16提问于2021-06-16得票数 0

回答已采纳

2回答

在MongoDB中拥有大量的集合(需要模式设计建议)

、

我正在考虑MongoDB保存的图像元数据，从100个相机，记录将保存30天的每台相机。如果一台相机在一天内提供100,000张图像，那么我将保存(100 x 30 x 100000)图像(文档)在MongoDB中的最大值。我计划用以下三个选项来设计模式，并需要您的专家意见/建议，以找到最佳的出路； 1) 分小时收集：创建72000 MongoDB ，即每个摄像机每小时收集

浏览 1提问于2012-11-03得票数 2

回答已采纳

1回答

基于唯一ID的合并记录

我相信这之前已经问过很多次了，但不幸的是，我还没有找到答案的词汇表。经过几个小时的搜索，我用我知道的最好的方式来问它。 555-555-5555 | John Smith 555-555-5555 |

浏览 0提问于2017-03-15得票数 0

2回答

将数据帧中的观测结果添加到R中更大的数据帧中

、、、

我需要用更小的数据框架(b)每天更新几次大数据框架(a)。两个数据帧共享相同数量的变量和相同的列类结构。唯一的区别是观察的数量和观测本身的数量。我花了几个小时在这个网站和其他人试图找到一个解决方案。我终于让merge()工作在小数据帧(313个观察96个变量)。merge(a

浏览 1提问于2014-10-21得票数 0

1回答

带有动态查找表的火花流

、、、

现在可以从HBase和Hive访问HDFS上的数据集，这些数据集需要查找一些数据并进行转换，例如IP与机器名称和机器所有者之间的映射。星星之火应用程序预计将在我们的集群中运行一天，一天一天，几个星期没有重新启动。然而，这些参考表每隔几个小时更新一次。如果所使用的数据是稍微旧的，那么它是可以<

浏览 1提问于2015-02-01得票数 10

4回答

Python pandas根据条件将数据追加到下一列

、、

ID Description df100 Desc.100我在一个熊猫数据框中设置了它if type(df['ID'][x]) == str: df[&#x

浏览 3提问于2018-09-16得票数 0

2回答

数据表中不连续的每小时数据，是否可以插入缺失的小时日期时间值和数据雪崩的null？

、、、

问题是，我没有考虑到每小时的数据可能不是连续的. 这意味着可能有丢失的数据，这些数据不是以NULL形式存储在数据库中的。也有可能多天的数据可能会丢失，而不仅仅是同一天内的几个小时。我正在用HighStock通过HighCharts绘制这个数据，就像在这个例子中显示的<

浏览 5提问于2013-04-28得票数 0

回答已采纳

1回答

Pandas重塑日期框，groupby bins

、、、

我需要你的帮助来重塑熊猫的数据框架。我对熊猫还是个新手(虽然已经坠入爱河了)，但这个问题一直困扰着我。df = pd.DataFrame( {'date':['20151201','

浏览 1提问于2015-12-15得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

LSTM -如何实现假日特性

火花流-等待窗口聚合的数据？

利用熊猫创造变量的变化率

从RDD中的Pandas DataFrames创建Spark DataFrame

使用正则表达式从tweet中提取标签的更快方法

数据框:基于值应用于两列

每24小时至少统计一次熊猫每小时数据帧中超过阈值的天数

镶木地板内饰& Spark

如果过滤数据上的COUNTIFS()

如何在pandas中使用不同的变量在groupby中迭代groupby？

将r中的多个数据帧合并为条形图竞赛

将开始时间和结束时间转换为密度/占用

在MongoDB中拥有大量的集合(需要模式设计建议)

基于唯一ID的合并记录

将数据帧中的观测结果添加到R中更大的数据帧中

带有动态查找表的火花流

Python pandas根据条件将数据追加到下一列

数据表中不连续的每小时数据，是否可以插入缺失的小时日期时间值和数据雪崩的null？

Pandas重塑日期框，groupby bins

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐