首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Orange:用于创建机器学习模型的便捷开源工具

Orange:用于创建机器学习模型的便捷开源工具

作者头像
February
修改2018-11-20 17:23:23
2.9K0
修改2018-11-20 17:23:23
举报
文章被收录于专栏:技术翻译技术翻译

在本教程中,我将演示Orange,一种用于机器学习的工具。Orange是一款极易使用,轻巧的拖放式工具。更重要的是,它是开源的!如果您是Anaconda用户,那么您可以在控制台中找到它,如下图所示 - 一个带着微笑的纯橙色太阳镜。

介绍

Orange是一个用于在GUI工作流程上创建机器学习管道的平台。没有编码技能的人可以轻松操作Orange。无需编写任何代码即可完成从数据准备到模型评估的所有任务。

它还有许多很酷的功能,我在许多其他重量级工具中找不到。你有没有画过数据?你说得对。您可以使用其“绘制数据”功能在Orange中绘制数据。这意味着您只需绘制数据点即可根据您的要求创建虚拟数据,Orange将为您生成数据。这是一项独特的功能,对于那些通过数据进行实验以获得原型的人来说非常需要。我们在下图中用橙色绘制了红色和蓝色数据。

除此之外,它还具有许多差异化因素,如良好的可视化功能,广泛的模型列表和评估技术。让我们通过使用我们之前创建的绘制数据创建机器模型来窥视该工具。

Orange主要有四种不同的标签。

1.数据

它有大约26种不同的功能。可以从不同的源(如文件,SQL表和数据表)中提取数据。您可以绘制数据,采样,合并和选择数据。您甚至可以构建功能,检测异常值和预处理数据。列表很长,用户可以使用大量与数据相关的内容。

2.可视化

提供大约15种不同类型的可视化,可用于查看各种维度的数据。对于我们绘制的数据,我通过将“ 绘制数据”图标连接到散点图来创建快速散点图。在每个可视化中,有一些功能可用于创建奇妙的图。在下面显示的散点图中,我使用Show Regression Line plot属性显示了回归线。我们可以清楚地验证,因为在我们的数据集中有两个类c1和c2,线性回归不是一种合适的技术。

3.模型

有十个监督ML建模功能。让我们为之前创建的数据集创建决策树模型。

所以,我们的分类模型现已准备就绪。它有多方便?对我来说非常容易。让我们快速可视化树模型。我们可以从Visualization部分选择Tree Viewer来查看模型,如下图所示。

现在我们的模型准备好了,让我们转到下一部分来评估模型的准确性。

4.评估

连接到树模型和测试数据节点时,“测试和分数”节点提供各种评估指标的分数。对于我们的绘制数据模型,AUC为0.972,F1为0.966,这证实它是一个合理的模型。

我们还可以通过将混淆矩阵节点连接到Test&Score节点来查看混淆矩阵。

使用Orange创建模型需要30分钟。如果没有使用工具的任何经验,使用其他开源工具构建相同类型的演示模型需要一个多小时。

我们可以使用“ 模型”选项卡中的“ 保存模型”选项将模型**另存**为pickle文件。

这就是现在。直到下一次,使用Orange的快乐数据挖掘!

该模型可以从我的GitHub下载。

原文标题《Orange: A Handy Open-Source Tool for Creating Machine Learning Models》

作者:Sibanjan Das

译者:February

不代表云加社区观点,更多详情请查看原文链接

本文系外文翻译,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系外文翻译前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 介绍
    • 1.数据
      • 2.可视化
        • 3.模型
          • 4.评估
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档