进阶机器学习大师,四个核心概念给你加buff

全文共1772字,预计学习时长4分钟

机器学习中对于许多概念的理解是很重要的。更重要的是,如果你要实现人工智能(AI),销售人工智能(AI),集成人工智能(AI)或设计人工智能(AI),你就需要了解这些核心且先进的概念,为起步打下良好的、坚实的基础。

阅读本文后,相信你的机器智能学习商数(MILQ)将大幅增加!

查准率(Precision)和查全率(Recall)

查准率和查全率究竟是什么?有时读到有关查准率和查全率的信息,它们好像是一样的; 比如,“查准率是指你正确的频率,而查全率是你正确的频率”。 实际上,他们是不同的,并且,它们对于了解一个机器学习模型为何适用于某一用例的原因非常重要。

可以这样来解释两者之间的差异:

假设你想要记住一些东西,比如记住你看到过多少把蓝色的伞。查全率(Recall)描述的是你能不能记住你看到的蓝色的伞,因为你有可能会把紫色的伞记错,记成蓝色的伞。假设你在生活中看到了10把蓝色雨伞,你全部记住了。但是,你还多错误地多记了5次紫色的伞(你把它们记成了蓝色的)。这时你的查全率是100%,因为那10次蓝色的伞你都记得。

而查准率(precision)将描述正确记忆的百分比。上述例子中,15个记忆中只有10个是正确的。因此,查准率约为66%。

那么这两个哪个更重要呢?这取决于你的用例。如果你正在使用计算机视觉或深度学习,从痣的照片中识别癌症,那么最小化在患者患癌症时你告诉患者他们没有患癌症的次数(假阴性)可能是有意义的,那么减少告知癌症患者他们没有患癌症(假阴性)的次数也可能说得通,即使是冒着告知未患癌者他们患癌了(假阳性)可能性增加的风险。

关键是你不能兼得,总会有一个权衡。这取决于哪个对你更重要;冒着做出一些错误的阳性判定的风险下,做出正确的阳性判定?还是冒着更多错误的阴性判定风险来确保尽可能多的正确的阳性判定?

明白了吗?如果你还是不太懂,不要担心,它确实很复杂,而且很难记住。

识别(Recognition)vs检测(Detection)

当你使用机器学习时,可以使用一些非常酷的工具,比如面部识别和徽标检测。你还可以进行面部检测和徽标识别。究竟是什么意思?

可以用一些例子,来解释这个概念:

面部识别——输入的是面部图像,机器学习模型会识别这个人,告诉这个人的姓名。

面部检测——输入的是面部图像,机器学习模型会识别面部的位置及相关的尺寸。它告诉检测到的面部在哪里,但不会告诉这个人是谁。

图像识别——输入的是图像,输出(可能)是描述该图像的多个标签,例如雾、汽车、单色照片、建筑、景观等。

物体检测——输入是特定图像(如徽标)和进行检测的一般图像,输出是出现图像中的每个特定图像(或徽标)的信息,它们的位置及相关尺寸等。

分类

许多机器学习的良好应用实际上是分类器。一篇文章是假新闻还是真新闻,这张图片上的叶子是棕榈叶、枫叶还是毒橡树,这句话是不是判刑等等。

每个类别都是一个选择或标签。训练机器学习模型时将一些输入数据(如照片或新闻文章)放入一类中。有些模型可以做几类,有些只能一次做一类。

关键是在训练分类器时必须遵循一些基本规则,否则它就无法正常工作(比如语法检查器)。

你的训练数据必须平衡。这意味着狗和猫的照片数量需要相同。如果你尝试训练一个具有不均匀类别的模型,那么它自然会把更多的例子分到其中一类。

该模型不仅仅能弄清楚哪些例子是错误的。你的训练数据必须干净利落。如果你的猫文件夹中有一些狗的例子,那你就搞砸了。现在就把这些照片移动到狗文件夹去。

深度学习

深度学习听起来很棒,不是吗?有什么比常规学习好呢?事实证明,深度学习很棒,但它也有相应的问题。首先,要知道解深度学习是什么。

大多数深度学习模型都基于人工神经网络。神经网络基本上就是一层一层节点,这些节点以某种无比奇妙的方式相互连接。当你的输入层和输出层之间超过1层时,就是一个深度网络!真正酷的是,当你训练神经网络时,它就会弄清楚如何去识别面部(举例子)。它可能让第一层进行像素分组,第二层进行边缘检测,第三层识别鼻子,依此类推......这些都是它自己做的。真是惊人。

但它不是万能的。一个安全的经验法则是,当您听到深度学习时,它意味着多个图形处理器(GPU)。 GPU很贵。所以你需要考虑实际。例如,有一个很棒的面部检测器没有使用深度学习。它是一个计算机视觉过滤器,具有97%的准确度。这个面部检测器还有一个深度学习版本。精度会更高,但同时性能成本也很高。你需要GPU!但计算机视觉版本可以在单个CPU上以超快的速度运行。

所以,这又是一个权衡。

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

编译组:郝晶晶、胡婷

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181215B0IF4900?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券