Pandas这个库对Python来说太重要啦!因为它的出现,让Python进行数据分析如虎添翼,作为Python里面最最牛逼的库之一,它在数据处理和数据分析方面,拥有极大的优势,受到数据科学开发者的广大欢迎。
小编最近在逛GitHub的时候,发现了一款神器,一款神器分析Pandas DataFrames的图形化界面,可以帮助我们对数据集进行可视化的处理,非常不错!
01
如何安装
安装步骤其安装步骤十分简单,只需要使用pip命令安装即可。
pip3 install pandasgui
#清华镜像
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple pandasgui
建议大家用清华镜像安装,这样会稳定而且快很多。
02
功能特点
PandasGUI是一个交互式的数据操作界面,类似于Excel,但是其对于数据处理更加方便快捷,共拥有7项功能特点:
03
使用方式
启动PandasGUI的方式,代码也十分简单,只需要导入相关库,获取DataFrames数据并显示就好了。示例代码如下:
然后我们就可以看到一个图像化的界面了。
04
实战练习
这次我们拿大名鼎鼎的泰坦尼克数据集来做练习,一起看一下用这款神器如何分析,还是用上面的几行示例代码来启动PandaGui:
在首页中我们可以看到数据的大小维数(第一个红框)891*12,以及我们选择的六个菜单栏:DataFrame,Filters,Statistics,Grapher,Reshaper等,六个菜单栏可以按照自己所需调整到不同区域方便操作。
上图展示小编将过滤器和统计调整在右边的画面,大家可根据需求进行自行调整,下面将对菜单栏分别进行学习操作。
下面以直方图和词云为例子向大家进行展示:
上图绘制了年龄大于30的船上游客的年龄直方图,可以看到Filter工具在画图时仍可以同时使用。
上图以名字为例子,绘制了船上人员名字的词云图。
上图中以Sex为行索引,Age为列索引,Fare系统值,操作后的表格展示为:
在上图中,我们可以看到,在最左边增加了df_pivot的DataFrames数据,每操作一次,会增加一个DataFrames数据,并在左边显示,新增之后的DataFrames数据依然适用于之前所有的操作。此外,新生成的DataFrames可以直接拖拽在文件夹生成新的csv文件,保存方便。
到这里,小编的探索就结束了,有了这个工具,大家就可以像操作Excel一样操作Dataframe数据,迅速获取有用的信息,不知道大家有没有心动呢!