4位谷歌工程师8分钟视频,带你了解计算机视觉(有字幕)

安妮 编译整理 量子位 报道 | 公众号 QbitAI

到底什么是计算机视觉?

计算机视觉离我们并不遥远。我们经常挂在嘴边的AR、自动驾驶、人脸识别都是计算机视觉的一部分应用。但这样说来可能又太宽泛了。量子位找到一个视频,里面是一组来自Google的研究人员,一起谈计算机视觉的历史、现在和将来。

虽然都属于计算机视觉领域的专家,但这段视频里的被采访者来自谷歌不同的部门:

Serge Belongie分管移动端视觉;Bill Freeman主要研究PC端视觉;Julian Ibarz和Vincent Vanhoucle这两个小伙,则是机器人技术研究人员。

视频如下。量子位空耳听译,配好了字幕。

视频内容

另外,量子位从中截图了一部分内容。

Serge Belongie认为,计算机视觉主要包括四个方面,概括起来就是四个Re-开头的单词。首先需要让计算机学会识别(Recognition)图像,在此期间需要为计算机输入大量的被标记图像内容。

之后,需要进行图像重建(Reconstruction),我们输入的图像信息是二维的,但可以利用算法将之变成三维立体图形。

变成三维模型后,就需要进行图像配准(Registration)了。图像配准是一个比较专业的词汇,是指将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程。

Serge认为这其实是教会计算机追踪图像,无论是道路上的行人,还是自动驾驶时追踪的车道、甚至是你自拍时的美颜相机,都是在进行图形配准。

最后,我们需要对图像进行重组(Reorganization)。在此阶段需要进行大量的无监督学习。就像小孩子在没有被告知的情况下认识这个世界一样,计算机需要在无标记信息的情况下重组图像。

如同最后Bill Freeman总结的那样,计算机视觉如此迷人就在于它那点让你惊奇的发现。我们看到的计算机眼中的世界,又何尝不是一种动人心魄的美呢。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-05-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏计算机视觉life

【深度相机系列一】iPhone X的原深感相机到底是个什么玩意?

9月13日苹果发布了致敬十周年的新机型iPhone X,其中前置原深感(TrueDepth)相机引起了极大的舆论关注。该相机的构成如下图所示。从左到右,依次是红...

85760
来自专栏IT派

深度学习框架排名:TensorFlow第一,PyTorch第二

上周,Keras作者、谷歌研究科学家François Chollet晒出一张图,他使用Google Search Index,展示了过去三个月,ArXiv上提到...

54940
来自专栏新智元

【CVPR 2018】机器也能感知时间,AI系统可预测5分钟内的未来!

13050
来自专栏量子位

DeepMind智能体自学跑酷:略显智障,结果尚好

安妮 编译整理 量子位出品 | 公众号 QbitAI “看起来就像小学生在玩地狱边境。” 近日,谷歌DeepMind团队创造了一个自学跑酷的智能体,并且解锁了它...

37480
来自专栏新智元

LeCun Quora 问答读后:深度学习走向何方

【新智元导读】前天深度学习代表人物Yann LeCun在Quora答题,新智元第一时间跟进,LeCun表示他最看好深度学习的对抗式网络,引发从业者王天树回忆起当...

36080
来自专栏人工智能快报

人工智能将重力透镜分析速度提升千万倍

美国国家加速器实验室(SLAC)和斯坦福大学的研究人员表示,脑模拟的“神经网络”可以改变天体物理学家分析其最复杂数据的方式,包括对我们对宇宙理解至关重要的时空极...

36180
来自专栏大数据文摘

视频更新|斯坦福CS231n深度学习与计算机视觉课时14-卷积神经网络详解(上)

16020
来自专栏AI研习社

港科大教授权龙:计算机视觉下一步将走向三维重建 | CCF-GAIR 2018

雷锋网按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了宝安区政...

28020
来自专栏专知

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

【导读】IT资深工程师和人工智能技术专家Abhishek Nandy和Manisha Biswas撰写的Open AI, TensorFlow, Keras强化...

72240
来自专栏机器之心

GMIS 2017 | 第四范式首席科学家杨强:AlphaGo的弱点及迁移学习的应对(附视频)

机器之心整理 演讲者:杨强 5 月 27-28 日,机器之心在北京顺利主办了第一届全球机器智能峰会(GMIS 2017),来自美国、加拿大、欧洲,香港及国内的众...

372100

扫码关注云+社区

领取腾讯云代金券