如何计算出还有几天是女朋友生日? 如何绘制出年、月的日历图? 如何使用 Python 提供的函数快速判断是否为闰年? 如何获取月的第一天、最后一天、月有几天?...性能比较 set_index, reset_index, reindex 使用总结 数据预览操作:info 和 describe 使用总结 Pandas 数据 null 值检查 空值补全,使用列的平均值..., seaborn 绘制 barplot图, catplot 图,pairplot 图 分类型变量处理技巧总结 读取时抽样 1% 样本的处理技巧 与时间序列相关的问题,平时挺常见。...Pandas 使用 apply(type) 做类型检查 Pandas 使用标签和位置选择数据的技巧 一个快速清洗数据的小技巧,在某列上使用 replace 方法和正则,快速完成值的清洗。...步长为小时的时间序列数据,有没有小技巧,快速完成下采样,采集成按天的数据呢? DataFrame 上快速对某些列展开特征工程,使用 map 如何做到?
因此,每一种方法产生的美感都是相似的,定制图片的方法将使用非常相似的语法。 当我想到这些可视化工具时,我想到:探索性数据分析。这些包对于第一次查看您的数据是非常棒的,但是当涉及到表示时就不太好了。...下面是一些使用Matplotlib和它的近亲制作的图的例子: 在处理篮球薪资数据时,我希望找到拥有最高薪资中位数数据的球队。...我创建了一个没有轴标签的条形图和一个“散点图”,其中的线条我无法删除。...一些值得注意的缺点有: 它需要一个API密钥和注册,而不仅仅是一个pip安装它 绘制的数据/布局对象是独特的图片,并不直观 图片布局对我不起作用(40行代码什么都没有!)...下面是我构建的一个简单图的几个不同的表示,以及从斯坦福SNAP下载的一些开始绘制小型Facebook网络的代码。
最近有不少粉丝问我关于Python批量操作Excel的问题。 大家的关注点主要是如何循环遍历表格、如何用Pandas批量处理,当然,还有在996的压迫下如何提效(来挤出更多摸鱼时间)。 ?...为此,我特意肝了几天,用基于实际业务的脱敏数据,以完整小项目的形式,来集中解决这些问题。 我的Pandas实战系列老传统,完整案例代码和数据源,已经打包好放在文末。...面对需求的临时改动,见过大风大浪的我们内心没有一丝波澜,甚至还有一点想笑。小事一桩,改改Pandas逻辑就好了。 先找到目标品牌凌云: ? 再按照顺延的逻辑,定位TOP5品牌相关数据: ?...接下来,我们就结合搜索人数,搜索-点击转化率和点击-支付转化率,用Pandas做一波分析。 要对最近一年的数据做分析,我们先把2020年所有数据合并,拿到汇总表: ?...正当我们准备把这一步结果同步给首席吹牛官,顺便探讨进一步的数据分析方向,比如结合支付人数的金额贡献、留存率、LTV,以及引入两年增速的维度,结合业务动作来定位深层原因。
本人最近在尝试着发表“以股票案例入门Python编程语言”系列的文章,在这些文章里,将用Python工具绘制各种股票指标,在讲述各股票指标的含义以及计算方式的同时,验证基于各种指标的交易策略,本文是第一篇...不过在实践中,我们一般需要综合地观察短期中期和长期均线,从中能分析出市场的多空趋势。...') 8 #设置图的位置 9 fig = plt.figure() 10 ax = fig.subplot(111) 11 #调用方法,绘制K线图 12 candlestick_ochl(opens=...天均线,并为每种均线设置了图例,在第16行里,通过legend方法设置了图例的位置。...由于在前几天是没有5日均价了,且在遍历最后2天交易数据时,在执行诸如df.iloc[cnt+2]['Close']的语句中会出现索引越界,所以在while循环里我们用到了try…except异常处理语句
使用地理空间数据有很多应用程序——位置跟踪、基于位置的营销和广告,将你与最近的骑手或送货员联系起来,以及其他用例。事实上,这一领域已经开始在业界崭露头角,所以现在是了解这一领域的最佳时机。...现在,让我们检查一下数据集是否包含任何空值: df.isnull().sum() ? 太好了!我们的数据集中没有任何空值。我们现在准备将这些数据可视化。...所有这些可视化都是由kepler.gl做的,我们还没有创造出什么东西,所以让我们纠正它。我能想到的一个很好的视觉效果是取货地点的热图,它将为我们提供人们取货地点的信息。...如果你知道如何使用Pandas,那么你在使用它时不会遇到任何问题。...现在,我可以说你已经知道如何使用kepler.gl用于可视化地理位置数据集。 为了进行更深入的分析,我强烈建议阅读他们的文档,这些文档制作精美,易于阅读。
当我们做可视化之前,要先明确一些关于图像目标的问题:你是想初步了解数据的分布情况?想展示时给人们留下深刻印象?也许你想给某人展示一个内在的形象,一个中庸的形象?...因此,这些图在美化方面是相似的,自定义图时用的语法也都非常相似。 当提到这些可视化工具时,我想到三个词:探索(Exploratory)、数据(Data)、分析(Analysis)。...下面是我用 Matplotlib 及相关工具所做的示例图: 在处理篮球队薪资数据时,我想找出薪资中位数最高的团队。...Ploty 入门时有一些要注意的点: 安装时要有 API 秘钥,还要注册,不是只用 pip 安装就可以; Plotly 所绘制的数据和布局对象是独一无二的,但并不直观; 图片布局对我来说没有用(40 行代码毫无意义...Pyecharts绘制可视化地图专辑 Python 绘制惊艳的瀑布图 使用日历热图进行时序数据可视化 用 GeoPandas 绘制超高颜值数据地图 一行 Python 代码轻松构建树状热力图 这种
大数据与人工智能时代,掌握Python基础后,我们可以选择数据分析方向、人工智能方向、全栈开发方向... 如果想要追赶 Python 的热潮,应该如何学习呢?...选择课程的衡量标准是什么呢?我认为有以下几条坑不能踩: || 是否针对零基础入门?...数据分析安装配置常见库:NumPy, Pandas, SciPy, Matplotlib 3.1.4 数据分析应用场景与简要示例 3.2 NumPy库的介绍 3.2.1 NumPy的性能优势...3.2.2 数组对象处理 3.2.3 矩阵处理 3.2.4 基本操作与实践案例 3.3 Pandas库的介绍 3.3.1 Pandas基本数据结构与功能(Series) 3.3.2 DataFrame...常用可视化方式与图表绘制 3.5.3 Matplolib 3.5.4 Seaborn 3.5.5 实践:基于微博数据的人物信息以及关系的数据可视化 3.6 Python与机器学习 3.6.1
为了鼓励我 INFO 5731 课程的学生们积极参加这项活动,我还制定了加分政策。 ? 不过因为加分策略偏于保守,来的学生没有预期那么多。 ?...因为许多时间段,本来就没有抢劫案件发生,所以这个表中,出现了许多空值(NaN)。我们根据具体情况,采用0来填充。Pandas 中数据填充的函数是 fillna。...我们希望绘制的,不是一张图,而是 12 张。分别代表 12 个月。这种图形,有个专门的名称,叫做“分面图”(facet plot)。...Pandas 的 plot 函数有一个非常方便的参数,叫做 subplots ,可以帮助我们轻松达成目标。 每张图,我们依然采用柱状图的方式。因为默认方式绘制的图像,尺寸可能不符合我们的预期。...小结 通过本文的学习,希望你已掌握了以下内容: 如何检索、浏览和获取开放数据; 如何用 Python 和 Pandas 做数据分类统计; 如何在 Pandas 中做数据变换,以及缺失值补充; 如何用 Pandas
分析数据点的探索性数据分析(EDA)是在算法的数据建模之前制定假设的正确步骤。 ? 数据科学行业中一个最常见的陷阱是花费数小时为他们的项目寻找最佳算法,而没有花足够的时间首先理解数据。...只要图中没有人口稠密的数据点,获得一个洞察力是非常有帮助的。在下面的代码中,我们绘制了“mpg”数据集中“Horsepower” 和“Acceleration”数据点之间的散点图。...当我们按照特定顺序绘制数据点的自相关图时,我们可以看到该图显著地非零。...滞后图(Lag) 滞后图也有助于验证数据集是随机值集还是遵循某种趋势。当绘制“tips”数据集的“total_bills”值的滞后图时,就像在自相关图中一样,滞后图表明它是随机数据,到处都有值。...当我们延迟绘制一个非随机数据序列时,如下面的代码所示,我们得到了一条平滑的线条。
上面对算法的描述可能会对我们理解它的原理有一点帮助,但是对于UMAP是如何实现的仍然没有说清楚。为了回答“如何”的问题,让我们分析UMAP执行的各个步骤。...而较大的 n_neighbors 值意味着我们的估计将基于更大的区域,因此在整个流形中更广泛地准确。 1.2.构建一个图 接下来,UMAP 需要通过连接之前确定的最近邻来构建图。...为了理解这个过程,我们需要将他分成几个子步骤来解释邻域图是如何形成的。...1.2.3 模糊区域 你一定已经注意到上面的图也包含了模糊的圆圈延伸到最近的邻居之外。这告诉我们,当我们离感兴趣的点越远,与其他点联系的确定性就越小。...我已经列出了 UMAP 中可用的每个超参数,并简要说明了它们的作用。 虽然在本示例中,我将大部分超参数设置为默认值,但你可以尝试改变它们来查看它们如何影响结果。
在前三篇文章中,我们系统介绍了python内置库和pandas中常见的时间处理方法,以此为基础,进入到我们今天的主题——时间序列图的绘制。...面积图的语法和常见参数解释如下: #(x, y1)是数据标签,y2是起始基准位置,若y2为0,则表示x轴与y1之间的面积 #facecolor是填充颜色,edgecolor是面积边缘线框颜色,label...---- 3.1 年日历图 年日历图的绘制需要利用calmap库进行绘制(利用pip工具下载)。其中,输入的数据必须为Series类型,且index为时间类型(DatetimeIndex)。...在plotnine中进行绘制月日历图时,使用geom_tile()函数来绘制每日的”瓦片“,借助facet_wrap()函数分面绘制逐月的图像。关键在于月、周、日数据的转换。...先将1017A站点的2020年PM2.5数据(sel_df1)利用月日历图绘制,数据结构同上一个例子,示例代码如下: #数据准备 import pandas as pd new_df = sel_df2
最近在学习数据可视化,梳理一下其中一些诸如pandas绘图、matplotlib绘图、pyplot(plt)、axes等概念。 重要的事情说三遍:axes不是axis!axes不是axis!...这种方式固然没错,可问题就出在了plt只是一个interface,只是一个接口,连对象都算不上(仔细回想,你确实没有实例化过任何一个名叫plt类型的对象)这给本来就对面向对象编程并不很熟悉的我带来无穷无尽的困扰...上面这个例子就展示了pyplot(plt)的特点,不用指明对象就能进行画图和设置,当我们在同一个程序中的图比较少的时候这是方便的,但当我们同一个程序中的图很多的时候,这种没有显性对象的方式会导致我们没有办法重新调用之前的图...注意对比表二和表四,很多作用相同的东西,跑到了axes这里要多加一个set_ 用实例化axes的方式画图很重要,因为多子图的绘制更是需要依赖axes对象。...我还会分两期分别介绍一下axes与多子图的绘制和axes与pandas绘图的关系。
正当我不明所以之际,盆友的微信语音通话接了进来 友:“看你在学python,爬虫写的怎么样了呀,我想抓一下某招聘网站的数据,能帮我整一个吗,不行的话我也去看看” 我:“哦哦,你不是技术嘛,自己来嘛 友:...fake_useragent 直译就是 假身份,作用和直译基本一样,是个表里不一的“人” UserAgent是识别浏览器的一串字符串,相当于浏览器的身份证,在利用爬虫爬取网站数据时,频繁更换UserAgent...当你明确需要的数据指标之后,你再去数据来源看是否有这些指标已经如何获取。...3)理清原始数据的结构 当我们获取到数据来源url之后,就需要理清这些原始数据长啥样,如此才好去解析整理出想要的信息。打开一个url,我们发现是一个json,嗯,很完整的多层json。...网页json图 使用json.loads方法做简单的预处理,然后我们一层一层寻找目标数据指标所在。 【这里我是通过spyder变量管理器 点开数据 让大家直观理解】 第一层:字典 ?
当我们做可视化之前,要先明确一些关于图像目标的问题:你是想初步了解数据的分布情况?想展示时给人们留下深刻印象?也许你想给某人展示一个内在的形象,一个中庸的形象?...因此,这些图在美化方面是相似的,自定义图时用的语法也都非常相似。 当提到这些可视化工具时,我想到三个词:探索(Exploratory)、数据(Data)、分析(Analysis)。...下面是我用 Matplotlib 及相关工具所做的示例图: 在处理篮球队薪资数据时,我想找出薪资中位数最高的团队。...在制作美观且表现力强的图片时,我更倾向于使用 Bokeh——它已经帮我们完成了大量美化工作。 ? ▲用 Pandas 表示相同的数据 蓝色的图是上面的第 17 行代码。...Plotly 入门时有一些要注意的点: 安装时要有 API 秘钥,还要注册,不是只用 pip 安装就可以; Plotly 所绘制的数据和布局对象是独一无二的,但并不直观; 图片布局对我来说没有用(40
用 Python 创建图形的方法有很多,但是哪种方法是最好的呢?当我们做可视化之前,要先明确一些关于图像目标的问题:你是想初步了解数据的分布情况?想展示时给人们留下深刻印象?...因此,这些图在美化方面是相似的,自定义图时用的语法也都非常相似。 当提到这些可视化工具时,我想到三个词:探索(Exploratory)、数据(Data)、分析(Analysis)。...下面是我用 Matplotlib 及相关工具所做的示例图: 在处理篮球队薪资数据时,我想找出薪资中位数最高的团队。...在制作美观且表现力强的图片时,我更倾向于使用 Bokeh——它已经帮我们完成了大量美化工作。 ? 用 Pandas 表示相同的数据 蓝色的图是上面的第 17 行代码。...Ploty 入门时有一些要注意的点: 安装时要有 API 秘钥,还要注册,不是只用 pip 安装就可以; Plotly 所绘制的数据和布局对象是独一无二的,但并不直观; 图片布局对我来说没有用(40 行代码毫无意义
因此,这些图在美化方面是相似的,自定义图时用的语法也都非常相似。 当提到这些可视化工具时,我想到三个词:探索(Exploratory)、数据(Data)、分析(Analysis)。...下面是我用 Matplotlib 及相关工具所做的示例图: 在处理篮球队薪资数据时,我想找出薪资中位数最高的团队。...第二个图是回归实验残差的 Q-Q 图。这张图的主要目的是展示如何用尽量少的线条做出一张有用的图,当然也许它可能不那么美观。...在制作美观且表现力强的图片时,我更倾向于使用 Bokeh——它已经帮我们完成了大量美化工作。 ? 用 Pandas 表示相同的数据 蓝色的图是上面的第 17 行代码。...Ploty 入门时有一些要注意的点: 安装时要有 API 秘钥,还要注册,不是只用 pip 安装就可以; Plotly 所绘制的数据和布局对象是独一无二的,但并不直观; 图片布局对我来说没有用(40 行代码毫无意义
本文示例文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 就在几天前,geopandas释放了其最新正式版本...压缩包 在以前的版本中,当我们的矢量文件存放在zip压缩包内时,使用gpd.read_file()直接读取时需要传入特殊格式的zip路径表达式(详见我以前撰写的geopandas系列教程文件IO篇)...图2 2.2 新增对wkt与wkb格式的直接支持 在以前版本的geopandas中,是没有直接的API来与wkt/wkb格式进行交互的,往往需要配合shapely中的相关功能。 ...图6 2.6 解决了explode()方法与pandas的冲突 我在geopandas系列教程空间计算篇(上)中还介绍过与dissolve()方法相反的explode()方法,它可以将多要素集合类型的...而以前版本geopandas中的explode()方法是不兼容pandas的,这意味着如果你既需要多部件矢量要素拆分,又需要按照数组型元素拆分,就得在geopandas与pandas的数据结构之间转来转去
领取专属 10元无门槛券
手把手带您无忧上云