【教程】机器学习Python教程:2机器学习术语

笔者邀请您,先思考:

1 你熟悉和理解机器学习那些专业术语?举例说明

分类器

将未标记的实例映射到类的程序或函数称为分类器。

混淆矩阵

混淆矩阵,也称为关联表或错误矩阵,用于可视化分类器的性能。

矩阵的列表示预测类的实例,行表示实际类的实例。(注意:也可以反过来。)

对于二进制分类,表有两行两列。

例如:

这意味着分类器在42个案例中正确地预测了为男性,并错误地预测了8个男性案例为女性。它正确地预测了32例女性,18例被错误地预测为男性而不是女性。

正确度(错误率)

准确性是一种统计度量,定义为分类器所做的正确预测的数除以分类器所做的预测的总和。

我们前面例子中的分类器正确地预测了42个男性实例和32个女性实例。

因此,可以通过以下方法计算精度:

正确度=(42 + 32)/(42 + 8 + 18 + 32)

这是0.72

假设我们有一个分类器,它总是预测“女性”。在这种情况下,我们的准确度为50%。

我们将展示所谓的准确性悖论。

垃圾邮件识别分类器由以下混淆矩阵描述:

该分类器的精度为(4 + 91)/ 100,即95%。

下面的分类器只预测“ham”,并且有同样的准确性。

这个分类器的准确度为95%,即使它根本不能识别任何垃圾邮件。

Precision and Recall

Accuracy: (TN+TP)/(TN+TP+FN+FP)

Precision: TP/(TP+FP)

Recall: TP/(TP+FN)

监督式学习

机器学习程序同时给出输入数据和相应的标签。这意味着学习数据必须事先由人类标记。

无监督学习

学习算法没有标签。算法必须计算出输入数据的簇。

强化学习

计算机程序与它的环境进行动态交互。这意味着程序接收到积极和/或消极的反馈,以改进性能。

原文链接: https://www.python-course.eu/machine_learning_terminology.php

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。 平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。 您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。 我们努力坚持做原创,聚合和分享优质的省时的数据知识! 我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!

原文发布于微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文发表时间:2018-08-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

【干货】基于TensorFlow卷积神经网络的短期股票预测

【导读】近期,意大利公数据科学家Mattia Brusamento撰写了基于Tensorflow卷积网络的 短期股票预测教程,在这篇博文中,你将会看到使用卷积...

69470
来自专栏新智元

深度 | ImageNet 历届冠军架构最新评析:哪个深度学习网络最适合你

【新智元导读】计算机图像计算水平稳步的增长,但各大厉害的模型尚未得到合理应用。在这篇 ICLR 2017 提交论文《深度神经网络模型分析在实践中的应用》中,作者...

38660
来自专栏机器学习之旅

基于Tensorflow实现FFMFFM理论代码实现论文结论总结

没错,这次登场的是FFM。各大比赛中的“种子”算法,中国台湾大学Yu-Chin Juan荣誉出品,美团技术团队背书,Michael Jahrer的论文的fiel...

12920
来自专栏新智元

关于 NIPS 2016 你应该知道的 50 件事情

【新智元导读】Andreas Stuhlmüller 目前在斯坦福 Noah Goodman 教授 Computation & Cognition lab 当博...

34140
来自专栏量子位

Kaggle获奖者自述比赛求生指南:我们如何“穿越”亚马逊热带雨林

作者:刘思聪 中山大学|计算机科学与技术研究生 来源自知乎专栏:AI带路党 量子位 已获授权编辑发布 大家好,我是思聪 · 格里尔斯,我将向您展示如何从世界上某...

64080
来自专栏生信宝典

贝叶斯学习记录

这篇文章用于记录学习贝叶斯定理及其应用过程中的记录,希望由浅及深的提供一份自我学习教程。 引子 概率的定义:概率是一个0-1之间的数,代表了我们对某个事实或预测...

24060
来自专栏AI科技评论

干货 | 数据科学岗位必备面经:17个热点问题如何回答?(一)

AI科技评论按:随着数据科学成为炙手可热的领域,相关的应聘岗位也多了起来。面试者们在准备应聘的过程中,往往会有一个疑问:面试官们会问些什么?我又应该如何回答? ...

39680
来自专栏蜉蝣禅修之道

Java中利用Math.random()产生服从泊松分布的随机数

30440
来自专栏媒矿工厂

HDR关键技术:光学、视觉与光电转换曲线

本系列的前作当中介绍了HDR技术的相关技术与标准,本文将从更基础的知识点出发,重点介绍HDR技术的两大关键基础-亮度与颜色中的前者。

1.7K40
来自专栏量子位

Hinton领衔谷歌大脑新研究,拯救被认成步枪的乌龟

最近,深度学习之父Geoffrey Hinton带领的谷歌大脑团队,提出了一种防御对抗攻击的新方法。

10910

扫码关注云+社区

领取腾讯云代金券