Orange:用于创建机器学习模型的便捷开源工具

在本教程中,我将演示Orange,一种用于机器学习的工具。Orange是一款极易使用,轻巧的拖放式工具。更重要的是,它是开源的!如果您是Anaconda用户,那么您可以在控制台中找到它,如下图所示 - 一个带着微笑的纯橙色太阳镜。

介绍

Orange是一个用于在GUI工作流程上创建机器学习管道的平台。没有编码技能的人可以轻松操作Orange。无需编写任何代码即可完成从数据准备到模型评估的所有任务。

它还有许多很酷的功能,我在许多其他重量级工具中找不到。你有没有画过数据?你说得对。您可以使用其“绘制数据”功能在Orange中绘制数据。这意味着您只需绘制数据点即可根据您的要求创建虚拟数据,Orange将为您生成数据。这是一项独特的功能,对于那些通过数据进行实验以获得原型的人来说非常需要。我们在下图中用橙色绘制了红色和蓝色数据。

除此之外,它还具有许多差异化因素,如良好的可视化功能,广泛的模型列表和评估技术。让我们通过使用我们之前创建的绘制数据创建机器模型来窥视该工具。

Orange主要有四种不同的标签。

1.数据

它有大约26种不同的功能。可以从不同的源(如文件,SQL表和数据表)中提取数据。您可以绘制数据,采样,合并和选择数据。您甚至可以构建功能,检测异常值和预处理数据。列表很长,用户可以使用大量与数据相关的内容。

2.可视化

提供大约15种不同类型的可视化,可用于查看各种维度的数据。对于我们绘制的数据,我通过将“ 绘制数据”图标连接到散点图来创建快速散点图。在每个可视化中,有一些功能可用于创建奇妙的图。在下面显示的散点图中,我使用Show Regression Line plot属性显示了回归线。我们可以清楚地验证,因为在我们的数据集中有两个类c1和c2,线性回归不是一种合适的技术。

3.模型

有十个监督ML建模功能。让我们为之前创建的数据集创建决策树模型。

所以,我们的分类模型现已准备就绪。它有多方便?对我来说非常容易。让我们快速可视化树模型。我们可以从Visualization部分选择Tree Viewer来查看模型,如下图所示。

现在我们的模型准备好了,让我们转到下一部分来评估模型的准确性。

4.评估

连接到树模型和测试数据节点时,“测试和分数”节点提供各种评估指标的分数。对于我们的绘制数据模型,AUC为0.972,F1为0.966,这证实它是一个合理的模型。

我们还可以通过将混淆矩阵节点连接到Test&Score节点来查看混淆矩阵。

使用Orange创建模型需要30分钟。如果没有使用工具的任何经验,使用其他开源工具构建相同类型的演示模型需要一个多小时。

我们可以使用“ 模型”选项卡中的“ 保存模型”选项将模型**另存**为pickle文件。

这就是现在。直到下一次,使用Orange的快乐数据挖掘!

该模型可以从我的GitHub下载。

原文标题《Orange: A Handy Open-Source Tool for Creating Machine Learning Models》

作者:Sibanjan Das

译者:February

不代表云加社区观点,更多详情请查看原文链接

原文链接:https://dzone.com/articles/orange-a-handy-tool-for-machine-learning

原文作者:Sibanjan Das

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

如何确保机器学习最重要的起始步骤"特征工程"的步骤一致性?

关于特征工程,业界有这么一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。

682
来自专栏ATYUN订阅号

使用OpenCV,Python和深度学习进行人脸识别

在这篇文章中,你将学会如何使用OpenCV、Python和深度学习在图像和视频流中执行人脸识别。我们今天将在这里使用的基于深度学习的面部嵌入,既高度准确又能够实...

2.6K5
来自专栏悦思悦读

数据挖掘: R, Python,Machine Learning,一起学起来!

大数据概念的火爆带动了相关工具方法的流行。大数据工具中,R和Python以其开源、免费、简单易用、大量算法库和社区支持等特质赢得了一众人心。机器学习则以其高大上...

3698
来自专栏ATYUN订阅号

机器学习项目:使用Keras和tfjs构建血细胞分类模型

人工智能的应用非常广泛,尤其是在医疗领域。先进的人工智能工具可以帮助医生和实验室技术人员更准确地诊断疾病。例如,尼日利亚的一位医生可以使用这个工具从他根本不了解...

2463
来自专栏吉浦迅科技

TensorRT

作为Inference(推理)端的SDK的工具,TensorRT是可编程的处理加速器,主要是用来部署神经网络到Inference端之前,对于网络进行优化加速,来...

70511
来自专栏杨熹的专栏

详解 TensorBoard-如何调参

什么是 TensorBoard TensorBoard 是 TensorFlow 上一个非常酷的功能,我们都知道神经网络很多时候就像是个黑盒子,里面到底是什么样...

6228
来自专栏小白课代表

软件分享 | SPSS 24 32位/64位 安装教程

SPSS for Windows是一个组合式软件包,它集数据录入、整理、分析功能于一身。用户可以根据实际需要和计算机的功能选择模块,以降低对系统硬盘容量的要求,...

1713
来自专栏目标检测和深度学习

用好这几款炼丹利器,调参从此得心应手 | Let's Fork

#实现显示结果的CV开发环境 ? Live CV 是一个用于实现显示结果的计算机视觉算法开发环境,基于 QtQuick 开发。它可以用于交互、链接和调整算法,以...

3688
来自专栏人工智能头条

谷歌 TensorFlow 物理检测 API,目前最好的物体识别方案?

1522
来自专栏企鹅号快讯

机器视觉:用图像驱动智能小车

本篇大致探索下图像的识别。实现了颜色识别,以及利用直方图来计算图像相似度。先来个视频。 摄像头实时捕捉画面,从画面中解析出蓝色的区域,并与预设图像对比,相似度小...

4530

扫码关注云+社区

领取腾讯云代金券