前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >自动化数据分析框架比较-EDA Is All You Need

自动化数据分析框架比较-EDA Is All You Need

作者头像
致Great
发布2021-02-04 11:12:26
6340
发布2021-02-04 11:12:26
举报
文章被收录于专栏:程序生活程序生活

在本文章,我们主要给大家介绍一些顶级的自动化EDA工具,并且通过实例来展示具体效果。 代码链接:https://www.kaggle.com/andreshg/automatic-eda-libraries-comparisson/notebook

? AutoViz ?

AutoViz在众多免费软件Pythonic Rapid EDA Automation工具中脱颖而出,以非常快速的方式运行,这比其紧密的免费软件竞争对手SweetViz或Pandas Profiling更好

安装方式:

代码语言:javascript
复制
!pip install git+git://github.com/AutoViML/AutoViz.git
!pip install xlrd
代码语言:javascript
复制
from autoviz.AutoViz_Class import AutoViz_Class

AV = AutoViz_Class()
dftc = AV.AutoViz(
    filename='', 
    sep='' , 
    depVar='target', 
    dfte=df, 
    header=0, 
    verbose=1, 
    lowess=False, 
    chart_format='png', 
    max_rows_analyzed=300000, 
    max_cols_analyzed=30
)

? Pandas Profiling ?

代码语言:javascript
复制
from pandas_profiling import ProfileReport
df = pd.read_csv('/kaggle/input/titanic/train.csv')
report = ProfileReport(df)
# Start of Pandas Profiling process
start_time = dt.datetime.now()
print("Started at ", start_time)
report

? SweetViz ?

代码语言:javascript
复制
!pip install sweetviz
代码语言:javascript
复制
import sweetviz as sv
df = pd.read_csv('/kaggle/input/credit-card-customers/BankChurners.csv').head(2000)
advert_report = sv.analyze([df, 'Data'])
advert_report.show_html()

print('SweetViz finished!!')
finish_time = dt.datetime.now()
print("Finished at ", finish_time)
elapsed = finish_time - start_time
print("Elapsed time: ", elapsed)

? D-Tale ?

安装

代码语言:javascript
复制
!pip install dtale
代码语言:javascript
复制
import dtale
dtale.show(df)

官方链接:https://github.com/man-group/dtale

? Dataprep ?

代码语言:javascript
复制
!pip install -U dataprep

实例

代码语言:javascript
复制
from dataprep.eda import plot, plot_correlation
plot(df)
代码语言:javascript
复制
plot_correlation(df)
代码语言:javascript
复制
plot(df, "Customer_Age")
代码语言:javascript
复制
plot(df, "Customer_Age", "Gender")

参考链接

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ? AutoViz ?
    • ? Pandas Profiling ?
    • ? SweetViz ?
    • ? D-Tale ?
    • ? Dataprep ?
      • 参考链接
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档