专栏首页程序生活自动化数据分析框架比较-EDA Is All You Need

自动化数据分析框架比较-EDA Is All You Need

在本文章,我们主要给大家介绍一些顶级的自动化EDA工具,并且通过实例来展示具体效果。 代码链接:https://www.kaggle.com/andreshg/automatic-eda-libraries-comparisson/notebook

? AutoViz ?

AutoViz在众多免费软件Pythonic Rapid EDA Automation工具中脱颖而出,以非常快速的方式运行,这比其紧密的免费软件竞争对手SweetViz或Pandas Profiling更好

安装方式:

!pip install git+git://github.com/AutoViML/AutoViz.git
!pip install xlrd
from autoviz.AutoViz_Class import AutoViz_Class

AV = AutoViz_Class()
dftc = AV.AutoViz(
    filename='', 
    sep='' , 
    depVar='target', 
    dfte=df, 
    header=0, 
    verbose=1, 
    lowess=False, 
    chart_format='png', 
    max_rows_analyzed=300000, 
    max_cols_analyzed=30
)

? Pandas Profiling ?

from pandas_profiling import ProfileReport
df = pd.read_csv('/kaggle/input/titanic/train.csv')
report = ProfileReport(df)
# Start of Pandas Profiling process
start_time = dt.datetime.now()
print("Started at ", start_time)
report

? SweetViz ?

!pip install sweetviz
import sweetviz as sv
df = pd.read_csv('/kaggle/input/credit-card-customers/BankChurners.csv').head(2000)
advert_report = sv.analyze([df, 'Data'])
advert_report.show_html()

print('SweetViz finished!!')
finish_time = dt.datetime.now()
print("Finished at ", finish_time)
elapsed = finish_time - start_time
print("Elapsed time: ", elapsed)

? D-Tale ?

安装

!pip install dtale
import dtale
dtale.show(df)

官方链接:https://github.com/man-group/dtale

? Dataprep ?

!pip install -U dataprep

实例

from dataprep.eda import plot, plot_correlation
plot(df)
plot_correlation(df)
plot(df, "Customer_Age")
plot(df, "Customer_Age", "Gender")

参考链接

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 独家 | 探索性文本数据分析的新手教程(Amazon案例研究)

    本文利用Python对Amazon产品的反馈对数据文本进行探索性研究与分析,并给出结论。

    数据派THU
  • 兜兜转转一个圈,闲聊一下What is all you need?

    最近读论文、看文章发现了两件有意思的事情,今天有时间分享闲聊一下,其一是各种MLP的论文频出,从各个方面对Transformer进行“围攻”,这让人有种“大...

    炼丹笔记
  • 【译】(数字化)平台思维的艺术

    作者: Amit Kaul (Vice President, Emerging Technology) & Ryan Murray (Director, Dig...

    JimmyLv_吕靖
  • .NET 基金会项目介绍-Nancy

    Nancy 是一个轻量的,简洁的HTTP服务构建框架,能够支持运行于 .Net Framework/Core 以及 Mono。该框架的目标在保持平台无关的前提下...

    newbe36524
  • 堪比当年的LSTM,Transformer引燃机器学习圈:它是万能的

    2017 年 6 月谷歌发布论文《Attention is All You Need》时,我们或许都没有意识到它提出的 Transformer 架构将带来多少惊...

    机器之心
  • Java - 关于 JavaBean 你所需知道的一切

     “A Java Bean is a reusable software component that can be manipulated visually ...

    Fisherman渔夫
  • Attention is Not All You Need​!谷歌石锤Transformer:没有残差和MLP,它啥都不是

    基于注意力的架构在机器学习社区中已经变得无处不在,Transformer最初在机器翻译打出名堂,随着BERT的问世几乎统治了整个NLP领域,RNN、LSTM等老...

    AI算法修炼营
  • 【Github】nlp-journey: NLP相关代码、书目、论文、博文、算法、项目资源链接

    这个项目的作者是AINLP交流群里的慢时光同学,该项目收集了NLP相关的一些代码, 包括词向量(Word Embedding)、命名实体识别(NER)、文本分类...

    zenRRan
  • 前端自动化测试框架 Jest 极简教程

    Jest是由Facebook发布的开源的、基于Jasmine的JavaScript单元测试框架。集成了 Mocha,chai,jsdom,sinon等功能。

    一个会写诗的程序员

扫码关注云+社区

领取腾讯云代金券