首页
学习
活动
专区
工具
TVP
发布

数据科学学习手札

记录自己的数据科学学习之路
专栏成员
229
文章
346032
阅读量
90
订阅数
(数据科学学习手札149)用matplotlib轻松绘制漂亮的表格
  大家好我是费老师,matplotlib作为数据可视化的强力工具,可以帮助我们自由创作各式各样的数据可视化作品,其中matplotlib.pyplot.table模块就专门用于绘制表格,但是由于参数复杂,且默认样式单一简陋,想基于它绘制出美观的表格需要花费不少功夫。
Feffery
2023-03-07
1.3K0
(数据科学学习手札128)在matplotlib中添加富文本的最佳方式
  长久以来,在使用matplotlib进行绘图时,一直都没有比较方便的办法像R中的ggtext那样,向图像中插入整段的混合风格富文本内容,譬如下面的例子:
Feffery
2021-09-28
1.5K0
利用Python快速绘制海报级别地图
  基于Python中诸如matplotlib等功能丰富、自由度极高的绘图库,我们可以完成各种极富艺术感的可视化作品,关于这一点我在系列文章在模仿中精进数据可视化中已经带大家学习过很多案例了。
Feffery
2021-09-08
6430
一行代码让matplotlib图表变高大上
matplotlib作为Python生态中最流行的数据可视化框架,虽然功能非常强大,但默认样式比较简陋,想要制作具有简洁商务风格的图表往往需要编写众多的代码来调整各种参数。
Feffery
2021-07-27
9140
(数据科学学习手札107)在Python中利用funct实现链式风格编程
  链式编程是一种非常高效的组织代码的方式,典型如pandas与scikit-learn中的pipe(),以及R中的管道操作符%>%等,它们都可以帮助我们像连接管道一样,将计算过程中的不同步骤顺滑的连接起来,从而取代繁琐的函数嵌套以及避免多余中间变量的创建。
Feffery
2021-02-25
9090
秒啊,速来get这9个jupyter实用技巧
jupyter notebook与jupyter lab作为广受欢迎的ide,尤其适合开展数据分析相关工作,而掌握它们相关的一些实用技巧,势必会大大提升日常工作效率。而今天我就来给大家介绍9个非常实用的jupyter小技巧~
Feffery
2021-02-22
6660
(在模仿中精进数据可视化07)星球研究所大坝分布可视化
  在星球研究所最近的《10万座大坝的诞生!》一文中,作者们利用丰富的数据可视化手段对我国及世界大型水坝工程的发展分布情况进行了分析展示,而我尤其喜爱其中的一幅作品:
Feffery
2021-02-02
5980
不吹不黑,jupyter lab 3.0客观使用体验
jupyter lab于近期发布了其具有里程碑意义的3.0版本,随之带来的一些重要新特性,想必广大读者朋友已在各大公众号所翻译转载的jupyter lab团队官方介绍文章中知晓了很多。
Feffery
2021-01-13
1.1K0
(数据科学学习手札100)搞定matplotlib中的字体设置
matplotlib作为数据可视化的利器,被广泛用于数据分析之中,但不太友好的是matplotlib中书写非英文文字内容时,如果不事先对字体进行相关设置,会发现绘制出的诸如中文等均显示为方块乱码,而今天的内容,我们就来小小总结一下matplotlib中字体设置的常用技巧。
Feffery
2020-12-16
4850
(在模仿中精进数据可视化05)疫情期间市值增长top25公司
  新冠疫情对很多实体经济带来冲击的同时,也给很多公司带来了新的增长点。前段时间我看到图1所示的数据可视化作品,针对2020年1月1日到6月16日之间,世界范围内市值增大最多的25家公司进行可视化:
Feffery
2020-12-01
3280
(数据科学学习手札98)纯Python绘制满满艺术感的山脊地图
  下面的这幅图可能很多读者朋友们都看到过,这是英国摇滚乐队Joy Division在1979年发行的其第一张录音室专辑Unknown Pleasures的封面,由艺术家Peter Saville基于射电脉冲星信号的数据图创作而成,成为了一种流行文化的符号标志。
Feffery
2020-11-24
9020
(在模仿中精进数据可视化02) 温室气体排放来源可视化
  交通是产生温室气体排放的主要来源之一,而本期作为(在模仿中精进数据可视化)系列的第二期,将带大家以纯Python的方式对加拿大米西索加城市温室气体排放研究报告中的如图1所示的可视化作品进行复刻,它对温室气体排放来源中,交通方面的各排放源排放比例进行可视化:
Feffery
2020-09-16
8390
答应我,用了这个jupyter插件,别再重复造轮子了
在使用Python、R等完成日常任务的过程中,可能会经常书写同样或模式相近的同一段代码,譬如每次使用matplotlib绘制图像的时候可以在开头添加下面两行代码来解决中文乱码等显示问题:
Feffery
2020-09-09
7240
(数据科学学习手札87)利用adjustText解决matplotlib文字标签遮挡问题
  在进行数据可视化时我们常常需要在可视化作品上进行一些文字标注,譬如对散点图我们可以将每个散点对应的属性信息标注在每个散点旁边,但随着散点量的增多,或图像上的某个区域聚集了较多的散点时,叠加上的文字标注会挤在一起相互叠置,出现如图1所示的情况:
Feffery
2020-06-15
2.1K0
(数据科学学习手札83)基于geopandas的空间数据分析——geoplot篇(下)
在上一篇文章中我们详细学习了geoplot中较为基础的三种绘图API:pointplot()、polyplot()以及webmap(),而本文将会承接上文的内容,对geoplot中较为实用的几种高级绘图API进行介绍。
Feffery
2020-05-21
1.8K0
(数据科学学习手札82)基于geopandas的空间数据分析——geoplot篇(上)
  在前面的基于geopandas的空间数据分析系列文章中,我们已经对geopandas的基础知识、基础可视化,以及如何科学绘制分层设色地图展开了深入的学习,而利用geopandas+matplotlib进行地理可视化固然能实现常见的地图可视化,且提供了操纵图像的极高自由度,但对使用者matplotlib的熟悉程度要求较高,制作一幅地图可视化作品往往需要编写较多的代码,而geoplot基于geopandas,提供了众多高度封装的绘图API,很大程度上简化了绘图难度,就像seaborn之于matplotlib。
Feffery
2020-05-07
2.3K0
(数据科学学习手札78)基于geopandas的空间数据分析——基础可视化
  通过前面的文章,我们已经对geopandas中的数据结构、坐标参考系以及文件IO有了较为深入的学习,在拿到一份矢量数据开始分析时,对其进行可视化无疑是探索了解数据阶段重要的步骤。
Feffery
2020-03-04
3.6K0
实用的Python(2)利用Python制作gif动图
  moviepy是一个专门用于视频剪辑制作的模块,可以自动化完成很多繁琐的视频剪辑处理工作,除了处理视频数据之外,moviepy中还内置了可以制作gif动图的功能,通过使用moviepy.editor中的ImageSequenceClip,可以以自动化的方式批量生成指定参数要求的gif动图,本文就将针对ImageSequenceClip的使用展开介绍。
Feffery
2019-08-08
1.3K0
(数据科学学习手札08)系统聚类法的Python源码实现(与Python,R自带方法进行比较)
聚类分析是数据挖掘方法中应用非常广泛的一项,而聚类分析根据其大体方法的不同又分为系统聚类和快速聚类,其中系统聚类的优点是可以很直观的得到聚类数不同时具体类中包括了哪些样本,而Python和R中都有直接用来聚类分析的函数,但是要想掌握一种方法就得深刻地理解它的思想,因此自己从最底层开始编写代码来实现这个过程是最好的学习方法,所以本篇前半段是笔者自己写的代码,如有不细致的地方,望指出。 一、仅使用numpy包进行系统聚类的实现: '''以重心法为距离选择方法搭建的系统聚类算法原型''' # @Feffery
Feffery
2018-04-17
1.1K0
(数据科学学习手札03)Python与R在随机数生成上的异同
随机数的使用是很多算法的关键步骤,例如蒙特卡洛法、遗传算法中的轮盘赌法的过程,因此对于任意一种语言,掌握其各类型随机数生成的方法至关重要,Python与R在随机数底层生成上都依靠梅森旋转(twiste
Feffery
2018-04-17
9290
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档