首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

在Pandas中,在grouby和pd.cut之后,我如何重新排列数据帧,以便随时间按每个bin绘制?

在Pandas中,可以使用groupbypd.cut对数据帧进行分组和切割,然后重新排列数据帧以便按每个bin绘制。

首先,使用groupby方法对数据帧进行分组。例如,假设我们有一个名为df的数据帧,其中包含时间和值两列,我们想要按时间的bin进行分组,可以使用以下代码:

代码语言:txt
复制
groups = df.groupby(pd.cut(df['时间'], bins))

这里的bins是一个列表,表示时间的bin的范围。

接下来,可以使用apply方法将每个分组中的数据重新排列。例如,如果我们想要按照时间顺序对每个分组进行排序,可以使用以下代码:

代码语言:txt
复制
sorted_df = groups.apply(lambda x: x.sort_values('时间'))

这将返回一个重新排列后的数据帧sorted_df,其中每个分组都按照时间顺序排序。

最后,可以使用plot方法绘制每个bin的数据。例如,如果我们想要绘制每个bin的值的折线图,可以使用以下代码:

代码语言:txt
复制
sorted_df.groupby('bin')['值'].plot(legend=True)

这将绘制每个bin的值的折线图,并在图例中显示每个bin的标签。

关于Pandas的更多信息和使用方法,可以参考腾讯云的相关产品和文档:

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

万字长文 | 超全代码详解Python制作精美炫酷图表教程

一般来说,面对新数据时,的第一步是尝试可视化其分布,以便更好地理解数据。 3. 加载数据包导入 ? 图片来源:Kelli Tungay/Unsplash 先加载本文使用的数据。...人均GDP与生活阶梯的关系,不同颜色表示不同大洲人口规模 小提琴图 小提琴图结合了盒状图核密度估计值。它的作用类似于盒状图,显示了定量数据分类变量之间的分布,以便对这些分布进行比较。...小提琴图绘制大洲与生活阶梯的关系图时,用人均GDP的平均值对数据进行分组。人均GDP越高,幸福指数就越高 配对图 Seaborn配对图是一个大网格绘制双变量散点图的所有组合。...大洲划分的生活阶梯直方图 FacetGrid— 带注释的KDE图 还可以向网格每个图表添加特定的注释。以下示例将平均值标准偏差以及平均值处绘制的垂直线相加(代码如下)。 ?...结束语 本文展示了如何成为一名真正的Python可视化专家、如何在快速探索时更有效率、以及如何在董事会会议前创建更漂亮的图表、还有如何创建交互式绘图图表,尤其是绘制地理空间数据时,十分有用。

3.1K10

Pandas 秘籍:6~11

由于默认情况下groupby操作将唯一的分组列放在索引,因此unstack方法对于重新排列数据非常有用,以便以对解释更有用的方式显示数据。...在数据的当前结构,它无法基于单个列的值绘制不同的组。 但是,第 23 步显示了如何设置数据以便 Pandas 可以直接绘制每个总统的数据,而不会像这样循环。...另见 Python datetime模块的官方文档 Pandas 时间序列的官方文档 Pandas 时间增量官方文档 智能分割时间序列 第 4 章,“选择数据子集”,彻底介绍了数据的选择切片。...我们还为每个异常行提供一个唯一的整数,以便以后绘制时进行标识。 第 14 步,我们从与第 9 步相同的散点图开始,但是使用table参数将离群值表附加到该图的底部。...为此,我们需要找到自每个小组开始以来的每个时间点的成员总数。 我们有每个人加入每个小组的确切日期时间第 2 步,我们每周分组(偏移别名W)聚会组,并使用size方法返回该周的签约数量。

33.8K10

数据整合与数据清洗

每次爬虫获取的数据都是需要处理下的。 所以这一次简单讲一下Pandas的用法,以便以后能更好的使用。 数据整合是对数据进行行列选择、创建、删除等操作。...# 查询某个时间评论的用户情况 print(df[df['date'].isin(['2019-03-11 16:19:00', '2019-03-11 16:00:00'])]) 输出结果。 ?...05 排序 Pandas的排序方法有以下三种。 sort_values、sort_index、sortlevel。 第一个表示值排序,第二个表示索引排序,第三个表示级别排序。.../ 02 / 数据清洗 01 重复值处理 Pandas提供了查看删除重复数据的方法,具体如下。...03 数据分箱 分箱法包括等深分箱(每个分箱样本数量一致)等宽分箱(每个分箱的取值范围一致)。 其中Pandas的qcut函数提供了分箱的实现方法,默认是实现等宽分箱。

4.6K30

懂Excel轻松入门Python数据分析包pandas(二十八):二分法查找

此系列文章收录在公众号数据大宇宙 > 数据处理 > E-pd 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。...后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 Excel 的 vlookup 函数有一个模糊查找选项,其内在原理为二分法查找, pandas 同样有一样功能的方法...---- 场景 如下某物资取货记录: 左表为取货登记,有登记时间和数量 右表为批次库存数量 出库规则为批次从小到大优先出库,也就是说,批次1被取完,才会取批次2,以此类推 现在希望把左表每个人取货记录标记是哪个批次...真的可以做到,pandas 专栏后期将会详细讲解工程化扩展,想打造属于自己的 pandas 不是问题。 问题 不知道你有没有注意到,此案例存在有些人的取货是跨越了2个批次(比如A4这个人)。...这个问题留待下次探讨,大家不妨从 Excel 的操作角度想一下,可能一下子就能知道 pandas 如何解决 ---- 总结 本文重点: pd.cut 类比 Excel vlookup 模糊查找

80210

如何使用Python创建美观而有见地的图表

作者 | Fabian Bosler 来源 | Medium 今天的文章,将研究使用Python绘制数据的三种不同方式。将通过利用《 2019年世界幸福报告》数据来做到这一点。...用GapminderWikipedia的信息丰富了《世界幸福报告》的数据以便探索新的关系可视化。...大多数情况下,用它来澄清图表显示的内容,以便当回到图表上时,可以快速确定发生了什么。title需要一个字符串。 bins:允许覆盖直方图的bin宽度。...每个这些图中,中心图(散点图,双变量KDEhexbin)有助于理解两个变量之间的联合频率分布。此外,中心图的右边界上边界,描绘了各个变量的边际单变量分布(作为KDE或直方图)。...在下面的示例,将平均值标准偏差相加,并在该平均值处绘制一条垂直线(下面的代码)。

3K20

懂Excel轻松入门Python数据分析包pandas(二十八):二分法查找

前言 Excel 的 vlookup 函数有一个模糊查找选项,其内在原理为二分法查找, pandas 同样有一样功能的方法。...---- 场景 如下某物资取货记录: 左表为取货登记,有登记时间和数量 右表为批次库存数量 出库规则为批次从小到大优先出库,也就是说,批次1被取完,才会取批次2,以此类推 现在希望把左表每个人取货记录标记是哪个批次...但是这方法比 vlookup 麻烦,每个区间的分割点必需比区间要多1个数量(这符合数据分段逻辑,但不方便数据表操作) 所以参数 bins 里面,我们特意添加一个比较大的数 1000 上去 参数 right...真的可以做到,pandas 专栏后期将会详细讲解工程化扩展,想打造属于自己的 pandas 不是问题。 问题 不知道你有没有注意到,此案例存在有些人的取货是跨越了2个批次(比如A4这个人)。...这个问题留待下次探讨,大家不妨从 Excel 的操作角度想一下,可能一下子就能知道 pandas 如何解决 ---- 总结 本文重点: pd.cut 类比 Excel vlookup 模糊查找

53240

该用Python还是SQL?4个案例教你

这篇文章分享了4个能够节省时间的案例,在这几个案例,Python探索分析数据集方面远远优于SQL。...移动平均值 假设你现在想计算移动平均值,以便输入不断变化的情况下得到其明确的平均值。移动平均值有助于消除数据骤降峰值的影响,从而使长期趋势更加显而易见。...枢轴 要想重新排列数据与枢轴以绘制图表或是演示文稿格式,SQL需要几个步骤才能实现。在这个案例,需要将Mode Public Warehouse中大学橄榄球运动员的数据集从行枢轴转换到列枢轴。...首先,要汇总每年、每场比赛的运动员的信息来准备数据。 ? 转换数据之后,需要将查询(query)嵌入子查询(subquery)。 ?...当你从年份比赛SELECT大学橄榄球运动员后,可以跳转到Notebook并运行DataFrame.pivot。你能根据列值重塑数据,因而可以重新排列结果集。

1.1K50

数据处理 | xarray的计算距平、重采样、时间

因此一个时间,如果能够充分认识变量平均状态的变化趋势,那么对于预测未来情况是非常有利的。那么这个所谓随着平均态的偏移值便可称为距平(异常,anomaly). ?...resample(time="5Y")是对如何时间进行重采样进行设置,维度为time,设置的时间间隔为 5 年。...ds_anom_resample 之后就需要对这些分割好的 Resample 对象进行取平均,以便获得每一个分组好的 Resample 对象的平均值。...5年滑动平均 我们可以通过下图来理解时间窗是如何操作数据的 ?...当然 grouby 对象类似,也可用 list 来访问每一个时间窗移动对象 rolling_obj = da.rolling(time=5, center=True) list(rolling_obj

10.6K74

手把手教你用Pandas透视表处理数据(附学习资料)

本文重点解释pandas的函数pivot_table,并教大家如何使用它来进行数据分析。...所以,本文将重点解释pandas的函数pivot_table,并教大家如何使用它来进行数据分析。 如果你对这个概念不熟悉,维基百科上对它做了详细的解释。...添加项目检查每一步来验证你正一步一步得到期望的结果。为了查看什么样的外观最能满足你的需要,就不要害怕处理顺序变量的繁琐。 最简单的透视表必须有一个数据一个索引。...一般的经验法则是,一旦你使用多个“grouby”,那么你需要评估此时使用透视表是否是一种好的选择。 高级透视表过滤 一旦你生成了需要的数据,那么数据将存在于数据。...数据下载地址:http://pbpython.com/extras/sales-funnel.xlsx 备忘单 为了试图总结所有这一切,已经创建了一个备忘单,希望它能够帮助你记住如何使用pandas

3.1K50

【python】数据挖掘分析清洗——离散化方法汇总

还可以通过k-means先将数据进行聚类之后再进行编码。1.2 Factoring离散编码刚刚是将单列变为多维的数据,用1、0表示是否有这个数字。...(data))# 如果将箱子的边替代为箱子的个数,pandas将根据数据的最小值最大值计算出等长的箱子data2 = np.random.rand(20)print(pd.cut(data2, 4,...提高预测准确性:一些场景下,离散化后的数据可以更好地揭示变量之间的关系,提高模型的预测准确性。例如,信用评分模型,将收入分成若干个等级可以更好地捕捉收入与违约率之间的非线性关系。...方便解释可视化:离散化后的数据更容易解释可视化。例如,在营销分析,将年龄分成若干个组可以更清楚地展示不同年龄段的人口分布消费习惯。...离散化后的数据可以更好地应用于分类、聚类、关联规则挖掘等算法。例如,文本分类,将文本转化为词袋模型后,可以通过离散化将每个词语转化为一个特征,并将文本转化为一个向量。

39830

Pandas基本功能详解 | 轻松玩转Pandas(2)

  Pandas数据结构详解 | 轻松玩转Pandas(1) 介绍了 Pandas 中常用的两种数据结构 Series 以及 DataFrame,这里来看下这些数据结构都有哪些常用的功能。...# 导入相关库 import numpy as np import pandas as pd 常用的基本功能 当我们构建好了 Series DataFrame 之后,我们会经常使用哪些功能呢?...数据结构都有 ndarray 的常用方法属性,如通过 .shape 获取数据的形状,通过 .T 获取数据的转置。...此外,如果想要统计下某列每个值出现的次数,如何快速实现呢?调用 value_counts 方法快速获取 Series 每个值出现的次数。...Pandas 支持两种排序方式:轴(索引或列)排序实际值排序。 先来看下索引排序:sort_index 方法默认是按照索引进行正序排的。

1.7K20

增强分析可读性-Pandas教程

其他人一样,也是一名数据分析师,日常生活中使用python制作报告或演示文稿。通常的任务是2-3小时内进行分析,并提交给管理团队。...如果我们能在编程过程实现自动化呢。那太好了,不是吗? As-is 下面让我们看一下为这个示例生成的数据。这是公司需要的收入额。如你所见,这是pandas数据返回的默认结果。没有任何配置。...你会减少花在这上面的时间,然后把注意力放在内容的有效性上。 如何改进? 可读格式 收到的最常见的评论是,你能把数字四舍五入,并使用符号,如M表示百万或K表示千?...同样,格式化后,我们也可以matplotlib图中使用它。如果你使用pandas库进行数据分析,认为matplotlib将是你绘制图形的首选。 ?...想我今天和你们分享的技巧窍门某种程度上会有所帮助。

94040

这几个方法颠覆你对Pandas缓慢的观念!

一个技巧是根据你的条件选择分组DataFrame,然后对每个选定的组应用矢量化操作。 在下一个示例,你将看到如何使用Pandas的.isin()方法选择行,然后向量化操作实现上面新特征的添加。...pd.cut() 根据每小时所属的bin应用一组标签(costs)。 注意include_lowest参数表示第一个间隔是否应该是包含左边的(您希望包含时间= 0)。...▍使用HDFStore防止重新处理 现在你已经了解了Pandas的加速数据流程,接着让我们探讨如何避免与最近集成到Pandas的HDFStore一起重新处理时间。...你可以在此处执行的一项非常有用的操作是预处理,然后将数据存储已处理的表单以便在需要时使用。但是,如何以正确的格式存储数据而无需再次重新处理?...Pandas的 HDFStore 类允许你将DataFrame存储HDF5文件以便可以有效地访问它,同时仍保留列类型其他元数据

2.9K20

还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法

一个技巧是根据你的条件选择分组DataFrame,然后对每个选定的组应用矢量化操作。 在下一个示例,你将看到如何使用Pandas的.isin()方法选择行,然后向量化操作实现上面新特征的添加。...pd.cut() 根据每小时所属的bin应用一组标签(costs)。 注意include_lowest参数表示第一个间隔是否应该是包含左边的(您希望包含时间= 0)。...▍使用HDFStore防止重新处理 现在你已经了解了Pandas的加速数据流程,接着让我们探讨如何避免与最近集成到Pandas的HDFStore一起重新处理时间。...你可以在此处执行的一项非常有用的操作是预处理,然后将数据存储已处理的表单以便在需要时使用。但是,如何以正确的格式存储数据而无需再次重新处理?...Pandas的 HDFStore 类允许你将DataFrame存储HDF5文件以便可以有效地访问它,同时仍保留列类型其他元数据

3.4K10

推荐收藏 | Pandas常见的性能优化方法

1 数据读取与存取 Pandas内置了众多的数据读取函数,可以读取众多的数据格式,最常见的就是read_csv函数从csv文件读取数据了。...3 apply、transformagg时尽量使用内置函数 很多情况下会遇到groupby之后做一些统计值计算,而如果用内置函数的写法会快很多。 ?...agg() 方法+内置方法,用时694ms 建议3:grouby、aggtransform时尽量使用内置函数计算。...阿里云安全赛是用joblib库写的并行特征提取,比单核特征提取快60倍。 建议4:如果能并行就并行,用第三方库或者自己手写多核计算。...5 代码优化思路 优化Pandas时可以参考如下操作的时间对比: ? 建议5:优化的过程可以按照自己需求进行优化代码,写代码尽量避免循环,尽量写能够向量化计算的代码,尽量写多核计算的代码。

1.3K20

懂Excel就能轻松入门Python数据分析包pandas(十一):分段匹配

还有一个"模糊匹配"的功能,主要用于分段匹配,今天就来看看 pandas 如何做到同等效果。...多功能的 Vlookup 由于这次数据太多,用 Excel 已经不能打开此文件,因此用少量数据简单演示一下如何用 Vlookup 解决此问题: - 其实就是最后一个参数输入 1(True),即可...读取数据,从 Excel 读取规则表 - 注意这是 pandas 的顶层方法,因此是 pd.cut() - 第1参数传入判断数据列 - 第2参数传入规则表的 值 ,但是 cut 方法必需给定所有区间的边界...可以轻松从任意数据读取数据,本例即使你的数据各种数据库也是没问题 > 注意,bins 没有升序排序时,会报错。...你也可以指定 labels: 最后的划分结果尽可能每个区间数量平衡,来看看各区间的数量: 总结 - pd.cut() ,对数据做分箱处理 - 参数 bins 可以指定自己的规则表,也可以直接指定划分段数目

72150

Pandas基本功能详解 | 轻松玩转Pandas(2)

Pandas数据结构详解 | 轻松玩转Pandas(1) 介绍了 Pandas 中常用的两种数据结构 Series 以及 DataFrame,这里来看下这些数据结构都有哪些常用的功能。...# 导入相关库 import numpy as np import pandas as pd 常用的基本功能 当我们构建好了 Series DataFrame 之后,我们会经常使用哪些功能呢?...ndarray 的常用方法属性,如通过 .shape 获取数据的形状,通过 .T 获取数据的转置。...此外,如果想要统计下某列每个值出现的次数,如何快速实现呢?调用 value_counts 方法快速获取 Series 每个值出现的次数。...Pandas 支持两种排序方式:轴(索引或列)排序实际值排序。 先来看下索引排序:sort_index 方法默认是按照索引进行正序排的。

1.9K20

Pandas常见的性能优化方法

1 数据读取与存取 Pandas内置了众多的数据读取函数,可以读取众多的数据格式,最常见的就是read_csv函数从csv文件读取数据了。...3 apply、transformagg时尽量使用内置函数 很多情况下会遇到groupby之后做一些统计值计算,而如果用内置函数的写法会快很多。 ?...agg() 方法+内置方法,用时694ms 建议3:grouby、aggtransform时尽量使用内置函数计算。...阿里云安全赛是用joblib库写的并行特征提取,比单核特征提取快60倍。 建议4:如果能并行就并行,用第三方库或者自己手写多核计算。...5 代码优化思路 优化Pandas时可以参考如下操作的时间对比: ? 建议5:优化的过程可以按照自己需求进行优化代码,写代码尽量避免循环,尽量写能够向量化计算的代码,尽量写多核计算的代码。

1.2K30

【技巧】Pandas常见的性能优化方法

1 数据读取与存取 Pandas内置了众多的数据读取函数,可以读取众多的数据格式,最常见的就是read_csv函数从csv文件读取数据了。...3 apply、transformagg时尽量使用内置函数 很多情况下会遇到groupby之后做一些统计值计算,而如果用内置函数的写法会快很多。 ?...agg() 方法+内置方法,用时694ms 建议3:grouby、aggtransform时尽量使用内置函数计算。...阿里云安全赛是用joblib库写的并行特征提取,比单核特征提取快60倍。 建议4:如果能并行就并行,用第三方库或者自己手写多核计算。...5 代码优化思路 优化Pandas时可以参考如下操作的时间对比: ? 建议5:优化的过程可以按照自己需求进行优化代码,写代码尽量避免循环,尽量写能够向量化计算的代码,尽量写多核计算的代码。

1.2K60

懂Excel就能轻松入门Python数据分析包pandas(十一):分段匹配

还有一个"模糊匹配"的功能,主要用于分段匹配,今天就来看看 pandas 如何做到同等效果。...多功能的 Vlookup 由于这次数据太多,用 Excel 已经不能打开此文件,因此用少量数据简单演示一下如何用 Vlookup 解决此问题: - 其实就是最后一个参数输入 1(True),即可...读取数据,从 Excel 读取规则表 - 注意这是 pandas 的顶层方法,因此是 pd.cut() - 第1参数传入判断数据列 - 第2参数传入规则表的 值 ,但是 cut 方法必需给定所有区间的边界...可以轻松从任意数据读取数据,本例即使你的数据各种数据库也是没问题 > 注意,bins 没有升序排序时,会报错。...你也可以指定 labels: 最后的划分结果尽可能每个区间数量平衡,来看看各区间的数量: 总结 - pd.cut() ,对数据做分箱处理 - 参数 bins 可以指定自己的规则表,也可以直接指定划分段数目

64010
领券