首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python数据处理从零开始----第四章(可视化)背景:Matplotlib

我们现在将深入研究Matplotlib包,以便在Python中进行可视化。 Matplotlib是一个基于NumPy阵列的多平台数据可视化库,旨在与更广泛的SciPy协同工作。它由John Hunter在2002年构思,最初是作为IPython的补丁,用于通过来自IPython命令行的gnuplot实现交互式MATLAB风格的绘图。 IPython的创始人Fernando Perez当时正完成他的博士学位,而约翰知道他几个月没时间补丁了。约翰认为这是他自己开始的一个提示,Matplotlib软件包诞生了,2003年发布了0.1版本。当它被作为太空望远镜科学研究所选择的绘图包时,它得到了早期的提升。哈勃望远镜背后的科学家在财务上支持Matplotlib的开发并大大扩展了其功能。

01

ggcor |相关系数矩阵可视化

相关系数矩阵可视化已经至少有两个版本的实现了,魏太云基于base绘图系统写了corrplot包,应该说是相关这个小领域中最精美的包了,使用简单,样式丰富,只能用惊艳来形容。Kassambara的ggcorrplot基于ggplot2重写了corrplot,实现了corrplot中绝大多数的功能,但仅支持“square”和“circle”的绘图标记,样式有些单调,不过整个ggcorrplot包的代码大概300行,想学习用ggplot2来自定义绘图函数,看这个包的源代码很不错。还有部分功能相似的corrr包(在写ggcor之前完全没有看过这个包,写完之后发现在相关系数矩阵变data.frame方面惊人的相似),这个包主要在数据相关系数提取、转换上做了很多的工作,在可视化上稍显不足。ggcor的核心是为相关性分析、数据提取、转换、可视化提供一整套解决方案,目前的功能大概完成了70%,后续会根据实际需要继续扩展。

06
领券