汉化视频 | Yann LeCun亲自上镜,三个视频解读人工智能

图像识别

视频要点:

通常,计算机使用被称为算法的一系列精确的指令进行编程。算法是一个简单的指令序列。

但怎样可以写一个算法来识别图像呢?例如区分一张图是汽车还是狗。实际上连仅表达出车与狗的差异都很困难。

我们在做的一件事便是,事实上人类已经做了数个世纪的,将需要识别的图像与一系列已经记住的模版做比较。

问题是这样做并不够好,因为这个工作过程中我们将需要海量的模版。我们需要各种可能位置、颜色、姿势的狗的图片,对汽车也是如此。所以这一方法在实践中并不太可行。这便是机器学习方法需要被使用的地方了。

我们所做的不是编程识别狗和车,而是给机器展示了许多车和狗的样例,训练其分辨它们。这里有个非常简单的方式。假设说,我们的图像都只有九个像素,我们不是区分狗和车,而是识别出字母C和字母D,假设D代表狗(dog),C代表车(car)。假设,对于黑白图像,黑色像素取值为1,白色像素代表0。我们的机器学习算法所做的非常简单,它将计算图中像素的加权和。也就是说,你取出图像中的每个像素,将每个像素乘相对应的权重,再将其它们相加起来便得到了加权和 (weighted sum)。然后你将这个加权和与零做比较,如果它大于0,便认为是字母C,小于0便得到D。

便有个问题是,权值应该被给予什么值?权重需要使得D小于零C能大于零。我们将做的是,展示一系列的C和D样例图片,通过一系列学习过程,即处理该机器中全部的权重,你可以视权重的模型为一种我们将用于全部样例的模版。那我们应该怎样做以调整权重呢?

我们输入了一个C,我们告诉机器将相应的权重变大一些。机器将做的便是提升看到的所有C中的黑色像素的权值,降低或保持C中白色像素的权值。

反过来相同的方法对D,D的权重和需要小于0,所以我们将通知机器调整权重变小点。所以机器所做的便是,降低看到的D的所有黑色像素的权值,保留其它位置的值不变。最后,你将得到正权值在所有只属于C的像素处,以及负权制在只属于D的像素处,这便是一个完美的模版来分辨C和D。现在,当你提供图像C,计算权重和,和大于零所以被正确的分类为C,当你展示D,计算结果小于零,所以被分类为D。

当然现实生活中,我们关于每个字母和形状有不只一种样例,运行生成这些模版将可能花费更长的时间,或者更复杂,但这就是基本原则。

◆ ◆ ◆

卷积神经网络

视频要点:

深度学习中有一类特别的系统我们称之为卷积神经网络,这是指是神经网络中结点与单元之间特别的连接方式。这种连接方式在一定程度上受我们所知的哺乳动物的视觉皮层结构启发。做卷积的原因主要是因为物体可能在一张图像中的各个不同位置出现。

举例,如果我拍了张剪刀的图像,它能出现在图中的不同位置显出不同的样子,此外,可能我希望我们的系统还可以识别其它类型看起来不相同的剪刀。例如,如果识别这个特别的剪刀,我需要一个探测器去识别这个洞,那么我需要你知道识别出来它在某特定的位置。所以我设计了一个探测器来识别这个特殊的模式,我希望运用这个探测器来用于整个图像,从而当这个剪刀出现,探测器可以被触发并检测出图像上有这样一个特殊的形状。所以,我们的思路是用这个探测器来重复的在这张图片的每一行上寻找这个形状(小洞),这便是卷机操作。

第一层的卷积网络就像有上百个不同的detector去寻找不同的模式。而我们所做的并不是手动编写去建立这些detectors来尝试找有助于识别出剪刀的模式 从其它物体中,如汽车、狗。这只是学习过程的一部分,这些detectors自我训练以至能够识别(分辩不同物体)。这个技术被用于几乎任何地方,如图像识别,分析图片用于自驾驶汽车,语音识别,也用于是被部分场合进行语言文字的识别理解。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2016-12-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

盘点|最实用的机器学习算法优缺点分析,没有比这篇说得更好了

推荐理由 对于机器学习算法的盘点,网上屡见不鲜。但目前,还没人能结合使用场景来把问题说明白,而这一点正是本文的目的所在。 在文章中,作者将结合他的实际经验...

4767
来自专栏Coding迪斯尼

深度学习:透过神经网络的内在灵活与柏拉图的哲学理念

1443
来自专栏PPV课数据科学社区

用R语言实现对不平衡数据的四种处理方法

在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。那么,这种结果是为何发生的呢?到底是什么...

4198
来自专栏新智元

【何恺明最新论文】非局部神经网络,打造未来神经网络基本组件

【新智元导读】何恺明又出论文了,这次与CMU和FAIR的几位作者合作,提出了“非局部神经网络”。受计算机视觉中的经典非局部均值方法的启发而来,非局部网络可以作为...

39711
来自专栏量化投资与机器学习

【原创精品】使用R语言gbm包实现梯度提升算法

原创推文预告(绿色为已发布,点击标题即可阅读) ● 随机森林在因子选择上的应用基于Matlab ● 择时策略:在一天的何时进行交易 ● 主题模型 - LD...

4447
来自专栏AI科技评论

Google最新开源Inception-ResNet-v2,进一步提升图像分类水准

2016年8月31日,Google团队宣布针对TensorFlow开源了最新发布的TF-slim资料库,它是一个可以定义、训练和评估模型的轻量级的软件包,也能对...

7424
来自专栏宏伦工作室

用R语言实现对不平衡数据的四种处理方法

2343
来自专栏人工智能头条

机器学习的“小无相功”:高斯过程回归的深度科普

1743
来自专栏目标检测和深度学习

知乎“看山杯”夺冠记

比赛介绍 这是一个文本多分类的问题:目标是 “参赛者根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型”。通俗点讲就是:当用户在...

4397
来自专栏ATYUN订阅号

为什么我们一定要用随机权重初始化神经网络

必须将人工神经网络的权重初始化为小的随机数。这是因为这是用于训练模型的随机优化算法的期望,即随机梯度下降。

1313

扫码关注云+社区

领取腾讯云代金券