专栏首页深度学习与python面向非程序员的十大数据科学和ML工具

面向非程序员的十大数据科学和ML工具

不想编程!不会编程!但还是想尝试一下数据处理和机器学习怎么办?现在这都不是问题,今天我将分享十个优秀的机器学习工具,不用编程一样可以训练你的机器学习模型。

01 / DataRobot

DataRobot是简化机器学习和编程的最佳平台之一,该平台提供文本挖掘,插补,变量类型缩放和转换等最基本的数据处理,同时可以自动搜索选择最合适的算法来训练、测试以及部署模型。

参考地址:

https://www.datarobot.com/

02 / RapidMiner

RapidMiner是目前比较热门的工具,该工具能够让业务分析师不需要编程能力也可以将机器学习应用于数据准备到模型构建的全过程。对于非技术用户来说,RM绝对是强大的。 在这里不需要编写代码,也不需要执行复杂的数学计算。 您只需将数据放到工作字段上,然后只需将操作符拖到GUI中即可。

RM包括4个组件,包括:

  • RapidMiner Studio :易于使用的可视化环境软件,用于构建分析过程(数据准备,可视化和统计建模)。
  • RapidMiner Server :性能优化的应用程序服务器,您可以在上面运行分析流程并快速返回结果。
  • RapidMiner Radoop :实现以Hadoop为中心的大数据分析。
  • RapidMiner Cloud :基于云的存储库,可以在各种设备之间轻松共享信息。

网站地址:https://rapidminer.com/

03 / MLBase

MLbase是由加州大学伯克利分校的AMP实验室开发的一个开源平台,旨在解决数据科学中的两个关键问题:减少在大规模问题中实施和应用机器学习的难度。

它包括3个组件层,包括:

  • ML Optimizer:该层旨在自动完成ML管道部署的任务。 优化器解决了MLI和MLlib中包含的特征提取器和ML算法的搜索问题。 ML Optimizer目前正在积极开发中。
  • MLlib:它作为Apache Spark中的核心分布式ML库。 最初作为MLBase项目的一部分开发,MLlib现在由Spark社区支持。
  • MLI:这是用于特征提取和算法开发的实验性API,它引入了高级ML编程。 该接口可用于构建各种常见机器学习算法的分布式实现,具有最小的复杂性和极具竞争力的性能和可伸缩性

网站地址:

http://www.mlbase.org/

04 / Auto-WEKA

Auto-WEKA是一个用Java编写的数据挖掘软件,直观的GUI界面非常适合数据科学领域的新手,可以让您快速完成数据预处理,分类,回归,聚类,关联规则和可视化等相关处理。 不仅如此,该工具会探索多个算法的超参数优化,并向用户推荐最优的算法,以提供良好的泛化性能, 它目前主要用于教育和学术目的。

GITHUB地址:

https://github.com/automl/autoweka

05 / BigML

BigML是一个机器学习平台,可以让用户逐步完成机器学习模型训练的整个过程。该平台提供了一个良好的GUI,为用户提供以下6个功能:

  • 资料来源 :收集各种信息
  • 数据集 :创建数据集
  • 模型 :选择相应的算法训练预测模型
  • 预测 :根据训练的模型进行预测
  • 模型融合 :将各种算法模型进行融合
  • 评价 :针对验证集对模型进行评估

BigML提供多个免费的软件包,但您可以上传的数据集大小限制为16MB。

网站地址:https://bigml.com/

06 / Tableau

在ML&Data Science方面,Tableau是最受欢迎的平台之一。对于非程序员和没有编码技能的人来说,这是一个便捷的工具。Tableau可以快速,清晰地完成数据可视化和报告任务,可以在很短的时间内创建图形,图表等。

网站地址:

https://www.tableau.com/

07 / Datawrapper

Datawrapper是一种数字工具,可以轻松创建交互式数据。该工具主要用于分析数据并可视化数据,可以方便的创建条形图、折线图等可视化图表类型。不幸的是Datawrapper是一款付费应用。 用户必须每月支付39美元或年费119美元来生成嵌入式图形和下载Datawrapper图表的图像。

网站地址:

https://www.datawrapper.de/

08 / Visualr

虽然这个工具并不广泛流行,但Visualr并不比Tableau差。 该工具使用起来非常简单直观。您只需上传Excel,Access,CSV或者Flat文件,这就避免将文件转换为特定格式的麻烦。 更重要的是,该工具可以方便地连接到几乎所有企业级数据库,包括Oracle,MS SQL,MySQL,Excel,Access甚至像CSV这样的平面文件。

网站地址:

https://visualrsoftware.com/index.html

09 / Paxata

Paxata是一个帮助非技术用户快速有效处理数据的工具。该工具使用强大的视觉效果进行数据探索,使用自然语言处理使用类似值的规范化来进行数据清理等。如果您的工作需要大量数据清理,Praxata可能是一个很好的工具。

网站地址:

https://www.paxata.com/

10 / Trifacta

Trifacta是一个用于准备,清理和转换数据的工具, 这是一款免费的独立软件,可提供直观的GUI来执行数据清理。该软件将数据作为输入并按列分析多个统计信息,并且对于每列数据会自动推荐一些转换。

Trifacta目前有2种版本,包括:

  • Trifacta Wrangler : Wrangle文件高达100MB,逐步新用户入职,下载结果用于分析或数据可视化
  • Wrangler Pro: Wrangler Pro 14天免费试用,最多可访问5个用户,试用期内数据和处理无限制

该平台旨在解决Excel在处理大量数据时的缺点。 它拥有用户友好的GUI,具有高级图表构建,分析处理以及超快速生成报告等强大功能。

本文分享自微信公众号 - 深度学习与python(PythonDC),作者:Python语音识别

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-05-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 22款好用的CLI工具

    作者根据多年的终端使用经验,详细介绍了一些实用的 CLI 工具,希望它们能帮读者提高生产力。

    深度学习与Python
  • Chrome开发工具插件推荐

    想要了解一个网站的技术栈时就用它。Wappalyzer 可以分析网站所用的各项技术。它甚至可以帮助我们随时了解市场上的新兴技术信息。

    深度学习与Python
  • Node.js开发人员都应该知道的12个有用的包

    NPM 包节省了我们大量的时间和精力。需要日期库吗?NPM 上有一个包。需要实用程序库吗?没问题,只需安装一个软件包即可。每当你需要解决某个代码问题时,很可能会...

    深度学习与Python
  • 19年你应该关注这50款前端热门工具(下)

    上两篇文章《19年你应该关注这50款前端热门工具(上)》、《19年你应该关注这50款前端热门工具(中)》文章小编介绍了构建、框架和库、CSS和HTML、Java...

    前端达人
  • 二次元少女生成器、会开车的神经网络...2019年最好的17个机器学习项目!

    为了挑选出2019年最好的开源项目,最近某位Medium网友整理了2019年Reddit机器学习板块热门高赞项目资源汇总,一起来看看都有哪些项目上榜:

    数据派THU
  • 那些酷炫的深度学习网络图怎么画出来的?

    这个工具可以非常方便的画出各种类型的图,是下面这位小哥哥开发的,来自于麻省理工学院弗兰克尔生物工程实验室, 该实验室开发可视化和机器学习工具用于分析生物数据。

    磐创AI
  • 如何画出高级酷炫的神经网络图?优秀程序员都用了这几个工具

    NN-SVG 可以非常方便的画出各种类型的图,其作者是下面这位小哥哥开发的,他来自于麻省理工学院弗兰克尔生物工程实验室, 该实验室开发可视化和机器学习工具用于分...

    AI科技大本营
  • 那些酷炫的深度学习网络图怎么画出来的?

    AI 科技评论按:本文作者言有三,个人公众号“有三AI”,原文地址:https://zhuanlan.zhihu.com/p/60146525。正文内容如下:

    AI科技评论
  • 【杂谈】那些酷炫的深度学习网络图怎么画出来的?

    这个工具可以非常方便的画出各种类型的图,是下面这位小哥哥开发的,来自于麻省理工学院弗兰克尔生物工程实验室, 该实验室开发可视化和机器学习工具用于分析生物数据。

    马上科普尚尚
  • 入门 | 如果是个穷光蛋:如何从零开始学习成为一个数据科学家?

    去年,我自学了数据科学,搜集了几百个在线资源,每天学 6~8 个小时。与此同时,我白天还在日托中心上班,拿着最低的薪资水平。

    机器之心

扫码关注云+社区

领取腾讯云代金券