首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 学习手册中文第二版:11~15

具体而言,在本章中,我们将介绍: 数据分析拆分,应用和合并模式概述 单个分组 访问 Pandas 分组结果 使用多进行分组 使用索引级别分组 将聚合函数应用于分组数据 数据转换概述...在这种情况下,它将根据start_time计算个月,返回该之前最后个时间单位。 Period上数学运算过载,根据给定计算另一个Period。...在滚动窗口中,pandas 在特定时间段表示数据窗口计算统计信息。 然后,该窗口将沿某个间隔滚动,只要该窗口适合时间序列日期,就将在每个窗口上连续计算统计信息。...然后,来自.rolling()结果可以具有许多调用不同方法之,这些方法可以在每个窗口上执行计算。...波动率是通过对股票变化百分比取滚动窗口标准差(相对于窗口大小缩放比例)来计算窗口大小会影响整体结果。 窗口越大,代表测量值就越不代表。 随着窗口变窄,结果接近标准差。

3.3K20

Python时间序列分析简介(2)

使用Pandas进行时间重采样 考虑将重采样为 groupby() ,在此我们可以基于任何进行分组,然后应用聚合函数来检查结果。...滚动时间序列 滚动也类似于时间重采样,但在滚动中,我们采用任何大小窗口对其执行任何功能。简而言之,我们可以说大小为k滚动窗口 表示 k个连续。 让我们来看个例子。...如果要计算10天滚动平均值,可以以下方式进行操作。 ? ? 现在在这里,我们可以看到前10个是 NaN, 因为没有足够计算前10个滚动平均值。它从第11个开始计算平均值,然后继续。...在这里,我们可以看到在30天滚动窗口中有最大。 使用Pandas绘制时间序列数据 有趣是,Pandas提供了套很好内置可视化工具和技巧,可以帮助您可视化任何类型数据。...我可以以下方式进行绘制。 ? 在这里,我们指定了 xlim 和 ylim。看看我如何在xlim中添加日期。主要模式是 xlim = ['开始日期','结束日期']。 ?

3.4K20
您找到你想要的搜索结果了吗?
是的
没有找到

高级SQL查询技巧——利用SQL改善和增强你数据

计算滚动平均 使用时间序列数据时,为观察计算滚动平均值或附加历史可能会有所帮助。假设我想获取家公司每天售出小部件数量。...我可能想包括7天移动平均线,或附上上周出售工作日小部件,以查看业务与上周相比表现。我可以通过将数据集连接到自身上,使用日期列上操作来选择单个或观察范围来做到这点。...二、自连接附加历史数据 现在,如果我想附加4/25 / 21–5 / 1/21这7天滚动平均值,可以通过将表连接到自身上利用在SUM()函数。...在下面的示例中,如果表B在表A上当前观察日期前7天之内,我们可以将这些销售量相加除以7,以获得表A每周滚动平均值: select a.date , a.total_widgets_sold...将表联接到自身上是种非常灵活方式,可以向数据集添加汇总计算分组功能(例如SUM()和COUNT()与CASE()语句)创造性使用为功能工程,分析报告和各种其他用例带来了巨大机会。

5.7K30

Pandas库常用方法、函数集合

Series unstack: 将层次化Series转换回数据框形式 append: 将行或多行数据追加到数据框末尾 分组 聚合 转换 过滤 groupby:按照指定或多个对数据进行分组 agg...mean:计算分组平均值 median:计算分组中位数 min和 max:计算分组最小和最大 count:计算分组中非NA数量 size:计算分组大小 std和 var:计算分组标准差和方差...describe:生成分组描述性统计摘要 first和 last:获取分组个和最后个元素 nunique:计算分组中唯数量 cumsum、cummin、cummax、cumprod:...计算分组累积和、最小、最大、累积乘积 数据清洗 dropna: 丢弃包含缺失行或 fillna: 填充或替换缺失 interpolate: 对缺失进行插 duplicated: 标记重复行...用于访问Datetime中属性 day_name, month_name: 获取日期星期几和月份名称 total_seconds: 计算时间间隔总秒数 rolling: 用于滚动窗口操作 expanding

25610

首次公开,用了三年 pandas 速查表!

ds.cumprod() # 前边所有之积 ds.cummax() # 前边所有最大 ds.cummin() # 前边所有最小 # 窗口计算(滚动计算) ds.rolling(x).sum...,返回个 Boolean 数组 pd.notnull() # 检查DataFrame对象中非空返回个 Boolean 数组 df.drop(['name'], axis=1) # 删除...'2s' 为两秒 df.rolling(2).sum() # 在窗口结果基础上窗口计算 df.expanding(2).sum() # 超出(大于、小于)替换成对应 df.clip(-4, 6...col进行分组Groupby对象 df.groupby([col1,col2]) # 返回进行分组Groupby对象 df.groupby(col1)[col2] # 返回col1进行分组后...,col2均值 # 创建col1进行分组计算col2和col3最大数据透视表 df.pivot_table(index=col1, values=[col2

7.4K10

Pandas处理时间序列数据20个关键知识点

举几个例子: 段时间内股票价格 每天,每周,每月销售额 流程中周期性度量 段时间内电力或天然气消耗率 在这篇文章中,我将列出20个要点,帮助你全面理解如何Pandas处理时间序列数据。...1.不同形式时间序列数据 时间序列数据可以是特定日期、持续时间或固定自定义间隔形式。 时间戳可以是给定日期天或秒,具体取决于精度。...用取样函数重新采样 时间序列数据另一个常见操作是重采样。根据任务不同,我们可能需要以更高或更低频率重新采样数据。 Resample创建指定内部组(或容器),允许您对组进行合并。...滚动意味着创建个具有指定大小滚动窗口对该窗口数据执行计算,当然,该窗口滚动数据。下图解释了滚动概念。 值得注意是,计算开始时整个窗口都在数据中。...换句话说,如果窗口大小为3,那么第次合并将在第三行进行。 让我们为我们数据应用个3天滚动窗口

2.7K30

《DAX进阶指南》-第6章 动态可视化

6.2.4动态选择计算日期 在上节中,我们开发了个 DAX 度量值,用于销售时段、年初至今销售额和12个月滚动销售额之间动态切换。...由于其他日期可能不同,因此我们需要调整12个月滚动总计DAX公式以使用正确日期。 同样,我们需要个辅助表来允许我们在日期之间进行选择。...滚动总选项需要格外小心,因为我们需要从另一个参考日期展开。每个选项逻辑不同,不是调用通用[12 mth sales]度量值。...每个CALCULATE函数现在都有两个筛选器参数:个提供具有正确参考日期滚动总周期,另一个提供正确关系,代码如下。...但你可以反过来思考:提供静态计算出要与之进行比较。这利用了这样个事实,即SWITCH参数顺序进行所有比较,并将在第个出现匹配时停止。

5.6K50

懂Excel轻松入门Python数据分析包pandas(二十三):环比

由于 Excel 是高度自由表格数据,我们可以如下实现: - 从 B 复制下移粘贴到 C - 由于最后行下移后超出了总行数,直接去掉 现在可以在 D 写上简单公式得到结果: - 由于 C...是空,我填了个 na 错误 稍微懂点 Excel 小伙伴都会说:"根本不需要 C,直接用公式用B列上下相减就行了" 的确如此,这里特意用此方式,因为这过程在 pandas 中有操作...相当于 Excel 操作 D公式 - 行4:把计算结果写入原数据 > 实际上在 pandas 还有更便捷实现,类似于 Excel 操作中直接写公式上下引用。...不过,实际工作中数据没有这么简单, 比如说: - 数据中有些月份数据是缺失,怎么办? - 数据中日期类型,我希望年做环比 更多详细高级应用技巧,关注我 pandas 专栏!...多结合分组处理 实际情况是,我们拿到数据是多个城市月份销量: 此时我们需要注意2点: - 城市分组 - 保证每个城市内数据是按月份排序 代码如下: - 行3-5:每个分组处理逻辑,内容很简单

90820

Pandas 秘籍:6~11

() 另见 请参阅第 4 章,“选择数据子集”中“同时选择数据帧行和”秘籍 Pandas unstack和pivot方法官方文档 在groupby聚合后解除堆叠 单个对数据进行分组并在单个列上执行聚合将返回简单易用结果...on参数指定从中计算滚动窗口: >>> pres_rm = pres_41_45.groupby('President', sort=False) \...日期工具之间区别 智能分割时间序列 使用仅适用于日期时间索引方法 计算每周犯罪数量 分别汇总每周犯罪和交通事故 工作日和年份衡量犯罪 使用日期时间索引和匿名函数进行分组 按时间戳和另一分组...但是,groupby方法可以按时间段和其他进行分组。 准备 在此秘籍中,我们将展示两种非常相似但不同方法来按时间戳分组,并在另一中进行。...rolling方法唯需要参数是窗口大小,默认情况下,窗口大小将在当年结束。 rolling方法返回个类似分组对象,该对象必须使其组与另一个函数共同作用才能产生结果。

33.9K10

整理了10个经典Pandas数据查询案例

那么如何另一个字符串中写个字符串?将文本包装在单个引号“”中,就可以了。...与数值类似可以在同不同列上使用多个条件,并且可以是数值和非数值列上条件组合。 除此以外, Pandasquery()方法还可以在查询表达式中使用数学计算。...我们还可以在个或多个列上包含些复杂计算。...日期时间过滤 使用query()函数在日期时间上进行查询要求是,包含这些应为数据类型dateTime64 [ns] 在示例数据中,OrderDate日期时间,但是我们df其解析为字符串...OrderDate.dt.month显示了如何使用dt访问者仅提取整个日期月份

3.9K20

10个快速入门Query函数使用Pandas查询示例

那么如何另一个字符串中写个字符串?将文本包装在单个引号“”中,就可以了。...与数值类似可以在同不同列上使用多个条件,并且可以是数值和非数值列上条件组合。 除此以外, Pandas Query()还可以在查询表达式中使用数学计算。...我们还可以在个或多个列上包含些复杂计算。...日期时间过滤 使用Query()函数在日期时间上进行查询要求是,包含这些应为数据类型dateTime64 [ns] 在示例数据中,OrderDate日期时间,但是我们df其解析为字符串...OrderDate.dt.month显示了如何使用DT访问者仅提取整个日期月份

4.3K20

懂Excel轻松入门Python数据分析包pandas(二十三):环比

由于 Excel 是高度自由表格数据,我们可以如下实现: - 从 B 复制下移粘贴到 C - 由于最后行下移后超出了总行数,直接去掉 现在可以在 D 写上简单公式得到结果: - 由于 C...是空,我填了个 na 错误 稍微懂点 Excel 小伙伴都会说:"根本不需要 C,直接用公式用B列上下相减就行了" 的确如此,这里特意用此方式,因为这过程在 pandas 中有操作...相当于 Excel 操作 D公式 - 行4:把计算结果写入原数据 > 实际上在 pandas 还有更便捷实现,类似于 Excel 操作中直接写公式上下引用。...不过,实际工作中数据没有这么简单, 比如说: - 数据中有些月份数据是缺失,怎么办? - 数据中日期类型,我希望年做环比 更多详细高级应用技巧,关注我 pandas 专栏!...多结合分组处理 实际情况是,我们拿到数据是多个城市月份销量: 此时我们需要注意2点: - 城市分组 - 保证每个城市内数据是按月份排序 代码如下: - 行3-5:每个分组处理逻辑,内容很简单

81020

Pandas_Study02

复杂 使用向前 或 向后 填充数据,依旧使用fillna 方法,所谓向前 是指 取出现NaN或前数据来填充NaN,向后同理 # 在df e 这列上操作,默认下行操作,向前填充数据...interpolate() 利用插函数interpolate()对数据进行填。实现插填充数据,那么要求这列上必须得有些数据才可以,至少2个,会对起点和终点间NaN进行插。...下为NaN concat 函数 同样可以指定是行操作还是操作。...结果样,但每数据排列会有区别,因为结果表会先显示左表结果 print choose.merge(course, how = "right") pandas 数据分组 1. groupby 方法...agg形参是个函数会对分组后每都应用这个函数。

18410

Pandas 2.2 中文官方教程和指南(七)

每个子部分介绍个主题(如“处理缺失数据”),讨论 pandas 如何解决该问题,其中穿插着许多示例。 对于刚开始使用 pandas 用户,应从 10 分钟入门 pandas 开始。...Numba 加速例程 其他有用功能 示例 窗口操作 概览 滚动窗口 加权窗口 扩展窗口 指数加权窗口 时间序列/日期功能 概览 时间戳...加速例程 其他有用功能 示例 窗口操作 概述 滚动窗口 加权窗口 扩展窗口 指数加权窗口 时间序列/日期功能 概述 时间戳 vs....0.707731 2013-01-04 1.395042 2013-01-05 1.883656 2013-01-06 1.592306 Freq: D, dtype: float64 与具有不同索引或另一个...0.707731 2013-01-04 1.395042 2013-01-05 1.883656 2013-01-06 1.592306 Freq: D, dtype: float64 与具有不同索引或另一

26700
领券