专栏首页量子位4位谷歌工程师8分钟视频,带你了解计算机视觉(有字幕)

4位谷歌工程师8分钟视频,带你了解计算机视觉(有字幕)

安妮 编译整理 量子位 报道 | 公众号 QbitAI

到底什么是计算机视觉?

计算机视觉离我们并不遥远。我们经常挂在嘴边的AR、自动驾驶、人脸识别都是计算机视觉的一部分应用。但这样说来可能又太宽泛了。量子位找到一个视频,里面是一组来自Google的研究人员,一起谈计算机视觉的历史、现在和将来。

虽然都属于计算机视觉领域的专家,但这段视频里的被采访者来自谷歌不同的部门:

Serge Belongie分管移动端视觉;Bill Freeman主要研究PC端视觉;Julian Ibarz和Vincent Vanhoucle这两个小伙,则是机器人技术研究人员。

视频如下。量子位空耳听译,配好了字幕。

视频内容

另外,量子位从中截图了一部分内容。

Serge Belongie认为,计算机视觉主要包括四个方面,概括起来就是四个Re-开头的单词。首先需要让计算机学会识别(Recognition)图像,在此期间需要为计算机输入大量的被标记图像内容。

之后,需要进行图像重建(Reconstruction),我们输入的图像信息是二维的,但可以利用算法将之变成三维立体图形。

变成三维模型后,就需要进行图像配准(Registration)了。图像配准是一个比较专业的词汇,是指将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程。

Serge认为这其实是教会计算机追踪图像,无论是道路上的行人,还是自动驾驶时追踪的车道、甚至是你自拍时的美颜相机,都是在进行图形配准。

最后,我们需要对图像进行重组(Reorganization)。在此阶段需要进行大量的无监督学习。就像小孩子在没有被告知的情况下认识这个世界一样,计算机需要在无标记信息的情况下重组图像。

如同最后Bill Freeman总结的那样,计算机视觉如此迷人就在于它那点让你惊奇的发现。我们看到的计算机眼中的世界,又何尝不是一种动人心魄的美呢。

本文分享自微信公众号 - 量子位(QbitAI),作者:强行听译

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-05-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 我在A4纸上看宫崎骏动画

    来自港中文-商汤联合实验室、浙江大学、英伟达的研究人员,用AI将图片视频投影到实时弯曲的纸面上,还更改图片的视角、光照条件。

    量子位
  • 苹果无人车野心越发明显,再挖一名特斯拉工程师,或负责汽车软件UI

    据外媒The Verge报道,特斯拉资深设计师Andrew Kim离职,并加入了苹果公司。

    量子位
  • 只要算法够厉害,白墙能当镜子用:我初中物理都白学了 | Nature新论文

    一篇新论文登上了Nature,论文中显示,仅仅用一台普通的数码相机,仅仅凭借墙上模糊不清的光影,就能还原最初的画面。

    量子位
  • 计算机视觉应用:深度学习的力量和局限性

    自从人工智能诞生之初,计算机科学家就梦想着创造出能够像我们一样看到和理解世界的机器。这些努力导致了计算机视觉的出现,计算机视觉是AI和计算机科学的广阔领域,致力...

    AiTechYun
  • 【图像分割】图像分割专栏栏主自述:分割,我们究竟在研究什么?

    专栏《图像分割模型》已经完结,也是时候向大家正式介绍一下自己了。趁着新专栏刚刚开始,也借此机会聊聊在我眼中,我们做的分割究竟是什么,又该怎么做。

    用户1508658
  • 计算机视觉:进最快的赛道,挣最多的钱

    指纹解锁、刷脸识别、语音转换文字、机器人看病、Alphago······我们已经深刻的感受到,人工智能在改变我们的工作方式和认知。

    Crossin先生
  • 计算机视觉:进最快的赛道,挣最多的钱

    指纹解锁、刷脸识别、语音转换文字、机器人看病、Alphago······我们已经深刻的感受到,人工智能在改变我们的工作方式和认知。

    量化投资与机器学习微信公众号
  • 计算机视觉:进最快的赛道,挣最多的钱

    指纹解锁、刷脸识别、语音转换文字、机器人看病、Alphago······我们已经深刻的感受到,人工智能在改变我们的工作方式和认知。

    abs_zero
  • 你的电脑是如何识别色图的??

    在视频监控系统中,计算机甚至能把你能从一大堆东西里给认出来,连你穿啥颜色衣服都能看的一清二楚。

    小林C语言
  • 你的电脑是如何识别色图的?

    在视频监控系统中,计算机甚至能把你能从一大堆东西里给认出来,连你穿啥颜色衣服都能看的一清二楚。

    昱良

扫码关注云+社区

领取腾讯云代金券