首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用pandas.Grouper将datetime.time列拆分为时间范围

使用pandas.Grouper将datetime.time列拆分为时间范围
EN

Stack Overflow用户
提问于 2021-10-26 23:36:49
回答 1查看 374关注 0票数 1

我是从一个Excel文件中读取的,该文件有一个具有时间的列。因为我无法上传实际文件,所以我创建了变量timeIntervals来说明。

当我运行这个代码时..。

代码语言:javascript
运行
复制
import pandas as pd
import datetime
from pyPython import *

def main():
    timeIntervals = pd.date_range("11:00", "21:30", freq="30min").time
    df = pd.DataFrame({"Times": timeIntervals})
    grp = pd.Grouper(key="Times", freq="3H")
    value = df.groupby(grp).count()
    print(value)

if __name__ == '__main__':
    main()

我得到以下错误:

代码语言:javascript
运行
复制
TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'Index'

如何结合使用pandas.GrouperDataFrame.groupby将数据df“分组”成离散时间范围(3小时)?还有其他选择吗?

EN

Stack Overflow用户

回答已采纳

发布于 2021-10-26 23:52:43

以下几个问题:

window.

  • count计算列中的非NaN值,因此必须提供非NaN值,因为示例帧中没有剩余的列。

我们可以通过将time列转换为datetime来解决第一个问题:

代码语言:javascript
运行
复制
timeIntervals = pd.date_range("11:00", "21:30", freq="30min") # remove time here
df = pd.DataFrame({"Times": timeIntervals})

如果我们不是从date_range中创建这些值,我们可以简单地转换列to_datetime

代码语言:javascript
运行
复制
df['Times'] = pd.to_datetime(df['Times'], format='%H:%M:%S')

然后我们就可以分组计算:

代码语言:javascript
运行
复制
value = df.groupby(pd.Grouper(key="Times", freq="3H"))['Times'].count()

如果需要,我们可以更新index以只反映分组后的time

代码语言:javascript
运行
复制
value.index = value.index.time

因此,value变成了:

代码语言:javascript
运行
复制
09:00:00    2
12:00:00    6
15:00:00    6
18:00:00    6
21:00:00    2
Name: Times, dtype: int64

to_datetime一起

代码语言:javascript
运行
复制
def main():
    time_intervals = pd.date_range("11:00", "21:30", freq="30min").time
    df = pd.DataFrame({"Times": time_intervals})
    # Convert to DateTime
    df['Times'] = pd.to_datetime(df['Times'], format='%H:%M:%S')
    # Group and count specific column
    value = df.groupby(pd.Grouper(key="Times", freq="3H"))['Times'].count()
    # Retrieve only Time information
    value.index = value.index.time
    print(value)

或者在创建time之前不检索DataFrame:

代码语言:javascript
运行
复制
def main():
    time_intervals = pd.date_range("11:00", "21:30", freq="30min")
    df = pd.DataFrame({"Times": time_intervals})
    value = df.groupby(pd.Grouper(key="Times", freq="3H"))['Times'].count()
    value.index = value.index.time
    print(value)
票数 0
EN
查看全部 1 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69731081

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档