首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Matplotlib时间序列型图表(1)

在前三篇文章中,我们系统介绍了python内置库和pandas中常见的时间处理方法,以此为基础,进入到我们今天的主题——时间序列图的绘制。...---- 1 折线图 时间折线图语法matplotlib的plot语法一致,只不过将x轴换为了时间数据。...示例代码如下: import pandas as pd import matplotlib.pyplot as plt #筛选1017A和1050A站点的数据,抽取指定列 sel_df1 = df.loc...= 'Times New Roman', size = 13) fig.autofmt_xdate() #自动调整x轴时间刻度 #为两个子图设置一个总标题,设置字体的属性和大小 plt.suptitle...结果如下: 其中,空值表示这一天数值缺失,通过日历图可以直观地感受数值的范围和分布情况。 ---- 声明:本公众号的所有原创内容,在未经允许的情况下,不得用于商业用途,违者必究。 参考来源: 1.

2K20

15个能使你工作效率翻倍的Jupyter Notebook的小技巧

技巧3-添加图片 如果要插入图像,必须先将单元格类型从“代码”更改为“标记”。您可以在页面顶部的下拉框中执行此操作,也可以转到命令模式并按M键。...技巧11-扩展Pandas中显示的列和行数 Pandas表中显示的行和列数量有限,可以根据自己的喜好进行自定义。 在这里,我将行和列的最大输出设置为500。...) 技巧12-使用粗体或彩色突出显示输出内容 要使输出的重要部分突出,可以添加粗体字体和/或颜色。...如下图所示,您可以使用“#”符号创建字体层次结构来组织笔记本。 ? 一旦执行上述操作,层次结构就是这样的。 ?...如果您创建这些不同的标题,并将其技巧9中提到的可折叠标题扩展相结合,则隐藏大量单元格以及快速导航和移动各节将非常有用。

2.6K20

分析你的个人Netflix数据

很长一段时间以来,情景喜剧一直是我的首选。 这曾经是一个我无法回答的问题,因为Netflix允许用户下载的活动相关的数据非常有限。...对于Title列来说这很好,但是我们需要将两个时间相关的列更改为正确的数据类型,然后才能使用它们。...(pandas可以理解执行计算的持续时间格式) 所以,让我们按照这个顺序来处理这些任务,首先使用pandas将Start Time通过pd.to_datetime()转换为DateTime 我们还将添加可选参数...为此,我们需要完成以下几个步骤: 告诉pandas我们要用哪一天的顺序pd.Categorical-默认情况下,它会根据每天观看的剧集数量按降序绘制,但在查看图表时,按周一到周日的顺序查看数据会更直观。...=[0,1,2,3,4,5,6],ordered=True) # 按天创建老友记计算每个工作日的行数,将结果分配给该变量 friends_by_day = friends['weekday'].value_counts

1.7K50

周杰伦在唱什么?数据可视化告诉你!

然后将统计结果pandas库转换为数据表单,存储为 Excel 文件,代码如下。...我们也可以根据个人需求,在这个界面中进一步编辑,例如只显示名词、只显示动词等,然后单击“确定使用所选单词”按钮,即可生成词云。 之后,我们可以在“配置”栏中编辑词云的显示方式。...其中,“计算模式”指的是字体的大小是否严格词频匹配,因此我们选择“严格比例”。另外,我们还可以更改文字的颜色,以及文字云中单词的数量等。在本案例中,我们把单词数量调整到 200(见图5)。...之后,我们分别为它们加上文字,调整颜色、背景等,即可得到一幅圆面积图。 以上,我们讲解了使用 Python 分词和使用在线工具分词的两种方法。...需要提醒的是,不同的分词途径,分词的结果可能不同(尤其是在语句比较复杂、生僻的情况下)。 因此,对分词质量比较看重的读者有必要对比不同方法分词的效果,选择最优的方案。

67010

增强分析可读性-Pandas教程

为了得到我想要的结果,我必须启动我的Jupiter笔记本内核快速编写代码来生成数字。...在那之后,我可以把结果放在微软的PowerPoint上,并在一天结束前附上一些基本的脚注,然后把它们发给我的主管,让他们演示做出重要的决定。...一个痛点是,由于时间限制,我必须消化信息,编写代码生成结果,并将其以一种漂亮的格式放入Microsoft PowerPoint中呈现。...那会让你非常恼火,因为你需要时间和精力。 要解决这个问题,你可以将编程语言的结果放入microsoftexcel,然后根据需要手动更改格式。Excel是一个很好的工具。不好的地方是你必须手工做。...如你所见,这是pandas数据帧返回的默认结果。没有任何配置。 ? 我经常从我的主管或首席执行官那里得到的一个评论是。 你能让它更易读,更容易比较吗?”

93240

jupyter notebook 主题自定义

✅作者简介:人工智能专业本科在读,喜欢计算机编程,写博客记录自己的学习历程。 个人主页:小嗷犬的博客 个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。...JT Customizable Features(可自定义的部分) 2.1.1 plotting style 2.1.2 markdown/equations 2.1.3 pandas dataframes...---- jupyter notebook 是我们常用的 Python 编辑环境,但是它的配色风格字体风格却有些单调,使用久了难免有些厌倦,本文将教大家更改 jupyter notebook 的主题和字体...笔者对插件提供的主题配色比较满意,但插件中没有包含笔者喜欢的Consola字体,于是笔者便自己导入字体来设置,下面提供教程。...进入以下路径: 你的Python位置\Lib\site-packages\jupyterthemes\fonts 选择你刚刚添加的字体类型: 进入对应分类子文件夹下,创建字体同名的文件夹

49220

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

副本就地操作 大多数 Pandas 操作返回 Series/DataFrame 的副本。要使更改“保持不变”,您需要分配给一个新变量。...这可以通过更改 pandas 选项或使用 DataFrame.head() 或 DataFrame.tail() 来覆盖。 tips.head(5) 结果如下: 4....If/then逻辑 假设我们想要根据 total_bill 是小于还是大于 10 美元,来创建一个具有低值和高值的列。 在Excel电子表格中,可以使用条件公式进行逻辑比较。...在 Pandas 中,您需要在从 CSV 读取时或在 DataFrame 中读取一次时,将纯文本显式转换为日期时间对象。 解析后,Excel电子表格以默认格式显示日期,但格式可以更改。...在 Pandas 中,您通常希望在使用日期进行计算时将日期保留为日期时间对象。输出部分日期(例如年份)是通过电子表格中的日期函数和 Pandas 中的日期时间属性完成的。

19.5K20

如何用Python操作PDF制作数据报告?

大家如果看过我的书《快学Python:自动化办公轻松实战》,会发现Python操作PDF文档内容,主要围绕PDF文档的内容提取、合并与拆分、加密解密、添加水印以及不同文档格式相互转换来展开。...1、创建PDF,添加单行文字 我们可以创建一个单元格cell(),然后将文本放入其中,这种方法更适合对齐或居中变量或动态文本。...pdf.output('test_01.pdf', 'F') 输出结果: 2、其他操作 pdf.set_font('SIMYOU',size=10) # 设置字体字体,加粗,字号 pdf.set_text_color...size为14 注意,上面代码中的字体文件路径要根据自己的电脑实际存放位置更改。...由于我们这个小案例涉及绘制图形+写入图表,所以使用了seaborn、pandas模块。懒得自己打字,所以又使用了Faker模块,干脆模拟生成一些“假”的文字段落,方便直接插入到PDF文档中。

1.4K20

Pandas 学习手册中文第二版:11~15

指定连接类型 默认连接实际上沿着连接相反的轴(行索引)上的索引标签执行外连接操作。 这使得标签的结果集类似于执行那些标签的集。...自动执行,Pandas 收集应用阶段的结果构建单个合并结果。...分析时间序列数据的能力在现代世界中至关重要,这是为了分析财务信息或监视可穿戴设备上的运动使您的运动目标和饮食相匹配。 Pandas 提供了广泛的时间序列数据建模能力。...在这种情况下,它将根据start_time计算一个月,返回该值之前的最后一个时间单位。 Period上的数学运算过载,根据给定值计算另一个Period。...通常,将一只股票的波动率另一只股票的波动率进行比较,以获得可能风险较小的感觉,或者将一个市场指数股票的波动率整个市场进行比较,这是很常见的。 通常,波动性越高,对该股票进行投资的风险就越大。

3.3K20

有比Pandas 更好的替代吗?对比Vaex, Dask, PySpark, Modin 和Julia

他们不像Pandas那么普遍 文档,教程和社区支持较小 我们将逐一回顾几种选择,比较它们的语法,计算方法和性能。...它的功能源自并行性,但是要付出一定的代价: Dask API不如Pandas的API丰富 结果必须物化 Dask的语法Pandas非常相似。 ? 如您所见,两个库中的许多方法完全相同。...PySpark一样,dask不会提示您进行任何计算。准备好所有步骤,等待开始命令.compute()然后开始工作。 为什么我们需要compute() 才能得到结果?...结果也可能因数据而有所偏差。一种工具可以非常快速地合并字符串列,而另一种工具可以擅长整数合并。 为了展示这些库有多快,我选择了5个操作,比较了它们的速度。...在这种情况下,将整个数据集加载到Pandas相比花费了更多的时间。 Spark是利用大型集群的强大功能进行海量计算的绝佳平台,可以对庞大的数据集进行快速的。

4.4K10

一个 Python 报表自动化实战案例

Excel的基本组成 2.一份报表自动化的流程 3.报表自动化实战     - 当日各项指标同环比情况     - 当日各省份创建订单量情况     - 最近一段时间创建订单量趋势 4.将不同的结果进行合并...假设我们现在有如下一份数据集: 现在我们需要根据这份数据集来制作每天的日报情况,会主要包含三方面: 当日各项指标的同环比情况; 当日各省份创建订单量情况; 最近一段时间创建订单量趋势 接下来分别来实现这三部分...当然了,有的时候放在不同文件中会比较麻烦,我们就需要把这些结果合并在同一个Excel的相同Sheet或者不同Sheet中。...将不同的结果合并到同一工作簿的不同Sheet中: 将不同的结果合并到同一工作簿的不同Sheet中比较好实现,只需要新建几个Sheet,然后针对不同的Sheet插入数据即可,具体实现代码如下: from ...,把上面代码执行一遍,结果马上就可以出来,当然了也可以设置定时执行,到时间结果就自动发送到你邮箱里面啦。

1.1K10

一个 Python 报表自动化实战案例

- 当日各项指标同环比情况 - 当日各省份创建订单量情况 - 最近一段时间创建订单量趋势 4.将不同的结果进行合并 - 将不同结果合并到同一个Sheet中 - 将不同结果合并到同一个工作簿的不同...假设我们现在有如下一份数据集: 现在我们需要根据这份数据集来制作每天的日报情况,会主要包含三方面: 当日各项指标的同环比情况; 当日各省份创建订单量情况; 最近一段时间创建订单量趋势 接下来分别来实现这三部分...当然了,有的时候放在不同文件中会比较麻烦,我们就需要把这些结果合并在同一个Excel的相同Sheet或者不同Sheet中。...将不同的结果合并到同一工作簿的不同Sheet中: 将不同的结果合并到同一工作簿的不同Sheet中比较好实现,只需要新建几个Sheet,然后针对不同的Sheet插入数据即可,具体实现代码如下: from...,把上面代码执行一遍,结果马上就可以出来,当然了也可以设置定时执行,到时间结果就自动发送到你邮箱里面啦。

1K10

一个 Python 报表自动化实战案例

- 当日各项指标同环比情况 - 当日各省份创建订单量情况 - 最近一段时间创建订单量趋势 4.将不同的结果进行合并 - 将不同结果合并到同一个Sheet中 - 将不同结果合并到同一个工作簿的不同...假设我们现在有如下一份数据集: 现在我们需要根据这份数据集来制作每天的日报情况,会主要包含三方面: 当日各项指标的同环比情况; 当日各省份创建订单量情况; 最近一段时间创建订单量趋势 接下来分别来实现这三部分...当然了,有的时候放在不同文件中会比较麻烦,我们就需要把这些结果合并在同一个Excel的相同Sheet或者不同Sheet中。...将不同的结果合并到同一工作簿的不同Sheet中: 将不同的结果合并到同一工作簿的不同Sheet中比较好实现,只需要新建几个Sheet,然后针对不同的Sheet插入数据即可,具体实现代码如下: from...,把上面代码执行一遍,结果马上就可以出来,当然了也可以设置定时执行,到时间结果就自动发送到你邮箱里面啦。

93211

Python 数据可视化之山脊线图 Ridgeline Plots

它们是一种很好的绘制数据的方式,可以用来直观比较分布,特别是哪些随着一个维度(比如时间)变化的分布。虽然这并不是一种新技术。...如果指定,则更改 X 轴标签尺寸。 xrot:浮点数,默认为 None。旋转 X 轴标签的角度。 ylabelsize:整数,默认值 None。如果指定,则更改 Y 轴标签尺寸。...用户还可以直接修改源代码,以调整 X 轴、Y 轴、标题和图例的字体大小,从而使生成的山脊线图更加美观。...通过将多个组的分布放置在同一张山脊线图上,使用不同的颜色或线型进行标识,我们可以轻松比较它们之间的相似性和差异性。...这种图表特别适用于比较不同组的数据分布情况。 为什么要使用山脊线图? 平滑展示数据分布:传统的条形图或直方图相比,山脊线图提供了一种更平滑、更直观的方式来展示数据的分布情况。

5300

Python自动化办公 | 如何实现报表自动化?

- 当日各项指标同环比情况 - 当日各省份创建订单量情况 - 最近一段时间创建订单量趋势 4.将不同的结果进行合并 - 将不同结果合并到同一个Sheet中 - 将不同结果合并到同一个工作簿的不同...假设我们现在有如下一份数据集: 现在我们需要根据这份数据集来制作每天的日报情况,会主要包含三方面: 当日各项指标的同环比情况; 当日各省份创建订单量情况; 最近一段时间创建订单量趋势 接下来分别来实现这三部分...当然了,有的时候放在不同文件中会比较麻烦,我们就需要把这些结果合并在同一个Excel的相同Sheet或者不同Sheet中。...将不同的结果合并到同一工作簿的不同Sheet中: 将不同的结果合并到同一工作簿的不同Sheet中比较好实现,只需要新建几个Sheet,然后针对不同的Sheet插入数据即可,具体实现代码如下: from...,把上面代码执行一遍,结果马上就可以出来,当然了也可以设置定时执行,到时间结果就自动发送到你邮箱里面啦。

2.3K32

实战 | 如何制作数据报表实现自动化?

(图1) 现在需要根据这份数据集来制作每天的日报情况,主要包含以下 3 个方面。 当日各项指标的同/环比情况。 当日各省份创建订单量情况。 最近一段时间创建订单量趋势。 接下来分别实现。...当然,有时放在不同文件中会比较麻烦,就需要把这些结果合并在同一个 Excel 的相同 Sheet 或者不同 Sheet 中。...首先,插入核心指标表 df_review,插入方式单独插入是一样的,具体代码如下。...(图8) 将不同的结果合并到同一工作簿的不同 Sheet 中 将不同的结果合并到同一工作簿的不同 Sheet 中比较好实现,只需要新建几个Sheet,然后对不同的 Sheet 插入数据即可,具体实现代码如下...dataframe_to_rows wb = Workbook() ws = wb.active ws1 = wb.create_sheet() ws2 = wb.create_sheet() #更改

1.6K30
领券