
公众号:尤而小屋 作者:Peter 编辑:Peter
大家好,我是Peter~
本文介绍的另一个机器学习自动化数据分析神器:pandas_profiling。
pandas-profiling能够使用pandas的DataFrame数据自动快速生成数据的详细报告,相比自带的describe方法生成的profile要详细的多。
这个库最大的特点就是一行代码(真的是一行)能够快速生成数据分析报告,非常便捷。

<!--MORE-->
在使用之前,先进行安装:建议使用豆瓣源安装,快速!
pip install -i https://pypi.douban.com/simple/ pandas_profiling另外还有一点,这个库依赖的是flask和jinja2,需要特别指定jinja的版本:
pip install -i https://pypi.douban.com/simple/ jinja2==3.0.3否则会报错:
ImportError: cannot import name 'escape' from 'jinja2.utils' 查看版本信息:
import pandas_profiling
pandas_profiling.__version__还是使用泰坦尼克数据集:
import pandas as pd
import numpy as np
df = pd.read_csv('titanic.csv')
df.head()
from pandas_profiling import ProfileReport
report = ProfileReport(df) # 关键代码
report









目前支持保存成html格式


原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。