前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >机器学习自动化数据分析神器-pandas_profiling

机器学习自动化数据分析神器-pandas_profiling

原创
作者头像
皮大大
发布2023-05-05 17:01:04
3500
发布2023-05-05 17:01:04
举报
文章被收录于专栏:机器学习/数据可视化

机器学习自动化数据分析神器-pandas_profiling

公众号:尤而小屋 作者:Peter 编辑:Peter

大家好,我是Peter~

本文介绍的另一个机器学习自动化数据分析神器:pandas_profiling

pandas-profiling能够使用pandasDataFrame数据自动快速生成数据的详细报告,相比自带的describe方法生成的profile要详细的多。

这个库最大的特点就是一行代码(真的是一行)能够快速生成数据分析报告,非常便捷。

<!--MORE-->

安装

在使用之前,先进行安装:建议使用豆瓣源安装,快速!

代码语言:python
代码运行次数:0
复制
pip install -i https://pypi.douban.com/simple/ pandas_profiling

另外还有一点,这个库依赖的是flask和jinja2,需要特别指定jinja的版本:

代码语言:python
代码运行次数:0
复制
pip install -i https://pypi.douban.com/simple/ jinja2==3.0.3

否则会报错:

代码语言:python
代码运行次数:0
复制
ImportError: cannot import name 'escape' from 'jinja2.utils'  

查看版本信息:

代码语言:python
代码运行次数:0
复制
import pandas_profiling
pandas_profiling.__version__

使用

还是使用泰坦尼克数据集:

代码语言:python
代码运行次数:0
复制
import pandas as pd
import numpy as np

df = pd.read_csv('titanic.csv')
df.head()
代码语言:python
代码运行次数:0
复制
from pandas_profiling import ProfileReport  

report = ProfileReport(df)  # 关键代码
report

保存结果

目前支持保存成html格式

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 机器学习自动化数据分析神器-pandas_profiling
  • 安装
  • 使用
  • 保存结果
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档