前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >面向非程序员的十大数据科学和ML工具

面向非程序员的十大数据科学和ML工具

作者头像
深度学习与Python
发布2019-06-18 20:55:41
8250
发布2019-06-18 20:55:41
举报

不想编程!不会编程!但还是想尝试一下数据处理和机器学习怎么办?现在这都不是问题,今天我将分享十个优秀的机器学习工具,不用编程一样可以训练你的机器学习模型。

01 / DataRobot

DataRobot是简化机器学习和编程的最佳平台之一,该平台提供文本挖掘,插补,变量类型缩放和转换等最基本的数据处理,同时可以自动搜索选择最合适的算法来训练、测试以及部署模型。

参考地址:

https://www.datarobot.com/

02 / RapidMiner

RapidMiner是目前比较热门的工具,该工具能够让业务分析师不需要编程能力也可以将机器学习应用于数据准备到模型构建的全过程。对于非技术用户来说,RM绝对是强大的。 在这里不需要编写代码,也不需要执行复杂的数学计算。 您只需将数据放到工作字段上,然后只需将操作符拖到GUI中即可。

RM包括4个组件,包括:

  • RapidMiner Studio :易于使用的可视化环境软件,用于构建分析过程(数据准备,可视化和统计建模)。
  • RapidMiner Server :性能优化的应用程序服务器,您可以在上面运行分析流程并快速返回结果。
  • RapidMiner Radoop :实现以Hadoop为中心的大数据分析。
  • RapidMiner Cloud :基于云的存储库,可以在各种设备之间轻松共享信息。

网站地址:https://rapidminer.com/

03 / MLBase

MLbase是由加州大学伯克利分校的AMP实验室开发的一个开源平台,旨在解决数据科学中的两个关键问题:减少在大规模问题中实施和应用机器学习的难度。

它包括3个组件层,包括:

  • ML Optimizer:该层旨在自动完成ML管道部署的任务。 优化器解决了MLI和MLlib中包含的特征提取器和ML算法的搜索问题。 ML Optimizer目前正在积极开发中。
  • MLlib:它作为Apache Spark中的核心分布式ML库。 最初作为MLBase项目的一部分开发,MLlib现在由Spark社区支持。
  • MLI:这是用于特征提取和算法开发的实验性API,它引入了高级ML编程。 该接口可用于构建各种常见机器学习算法的分布式实现,具有最小的复杂性和极具竞争力的性能和可伸缩性

网站地址:

http://www.mlbase.org/

04 / Auto-WEKA

Auto-WEKA是一个用Java编写的数据挖掘软件,直观的GUI界面非常适合数据科学领域的新手,可以让您快速完成数据预处理,分类,回归,聚类,关联规则和可视化等相关处理。 不仅如此,该工具会探索多个算法的超参数优化,并向用户推荐最优的算法,以提供良好的泛化性能, 它目前主要用于教育和学术目的。

GITHUB地址:

https://github.com/automl/autoweka

05 / BigML

BigML是一个机器学习平台,可以让用户逐步完成机器学习模型训练的整个过程。该平台提供了一个良好的GUI,为用户提供以下6个功能:

  • 资料来源 :收集各种信息
  • 数据集 :创建数据集
  • 模型 :选择相应的算法训练预测模型
  • 预测 :根据训练的模型进行预测
  • 模型融合 :将各种算法模型进行融合
  • 评价 :针对验证集对模型进行评估

BigML提供多个免费的软件包,但您可以上传的数据集大小限制为16MB。

网站地址:https://bigml.com/

06 / Tableau

在ML&Data Science方面,Tableau是最受欢迎的平台之一。对于非程序员和没有编码技能的人来说,这是一个便捷的工具。Tableau可以快速,清晰地完成数据可视化和报告任务,可以在很短的时间内创建图形,图表等。

网站地址:

https://www.tableau.com/

07 / Datawrapper

Datawrapper是一种数字工具,可以轻松创建交互式数据。该工具主要用于分析数据并可视化数据,可以方便的创建条形图、折线图等可视化图表类型。不幸的是Datawrapper是一款付费应用。 用户必须每月支付39美元或年费119美元来生成嵌入式图形和下载Datawrapper图表的图像。

网站地址:

https://www.datawrapper.de/

08 / Visualr

虽然这个工具并不广泛流行,但Visualr并不比Tableau差。 该工具使用起来非常简单直观。您只需上传Excel,Access,CSV或者Flat文件,这就避免将文件转换为特定格式的麻烦。 更重要的是,该工具可以方便地连接到几乎所有企业级数据库,包括Oracle,MS SQL,MySQL,Excel,Access甚至像CSV这样的平面文件。

网站地址:

https://visualrsoftware.com/index.html

09 / Paxata

Paxata是一个帮助非技术用户快速有效处理数据的工具。该工具使用强大的视觉效果进行数据探索,使用自然语言处理使用类似值的规范化来进行数据清理等。如果您的工作需要大量数据清理,Praxata可能是一个很好的工具。

网站地址:

https://www.paxata.com/

10 / Trifacta

Trifacta是一个用于准备,清理和转换数据的工具, 这是一款免费的独立软件,可提供直观的GUI来执行数据清理。该软件将数据作为输入并按列分析多个统计信息,并且对于每列数据会自动推荐一些转换。

Trifacta目前有2种版本,包括:

  • Trifacta Wrangler : Wrangle文件高达100MB,逐步新用户入职,下载结果用于分析或数据可视化
  • Wrangler Pro: Wrangler Pro 14天免费试用,最多可访问5个用户,试用期内数据和处理无限制

该平台旨在解决Excel在处理大量数据时的缺点。 它拥有用户友好的GUI,具有高级图表构建,分析处理以及超快速生成报告等强大功能。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深度学习与python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档