前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【李飞飞最新演讲】斯坦福AI实验室图像与视觉理解技术进展(191PPT)

【李飞飞最新演讲】斯坦福AI实验室图像与视觉理解技术进展(191PPT)

作者头像
新智元
发布2018-03-26 16:54:22
1.4K0
发布2018-03-26 16:54:22
举报
文章被收录于专栏:新智元

【新智元导读】ImageNet 缔造者、斯坦福大学副教授、人工智能实验室主任李飞飞在刚刚结束的ICML2016会议发表演讲 A Quest for Computer Vision,介绍她所在的实验室用深度学习和大数据进行图像和视频理解的最新进展。新智元取得李飞飞教授授权,将PPT发布如下并摘选翻译。

人类视觉系统演化用了500万多年的时间,而人工智能计算机视觉发展只用了15年左右。

在以下演讲中,斯坦福副教授李飞飞将介绍计算机视觉的发展历程,尤其是她实验室用端到端的学习方法进行稠密图像描述的最新进展。

本文摘选主要部分翻译。具体演讲内容请关注新智元后续报道。

计算机视觉发展与挑战

演化大爆炸:5.4亿年前生物演化出了视觉

目标:全景理解

要点一:学习是通往机器视觉之路

2000年,得到机器学习相关结果推动,计算机视觉取得巨大进展

子目标一:物体识别

20世纪90年代到21世纪初,计算机视觉逐步取得成果

要点二:学习需要大量数据

1990 年到2010年互联网数据增长趋势

ImageNet大规模视觉识别竞赛:1000个物体类型,143万多张图片

1998年和2012年ImageNet竞赛冠军对比

计算机很难识别体积小、没有纹理的物体

子目标二:场景GIST特征理解

用语言描述图片

难点在哪里

模型建立

图像处理

卷积神经网络

句子处理:如何编码成为大小固定的向量?

匹配图像和句子

描述图像句子数据库

图像与描述句子评测

量化结果分析

尚存缺点:

  1. 数据有限:只能用训练数据库中存在的句子描述图片
  2. 处理效率有待提高
  3. 计算机描述相对人类不够简练

子目标三:稠密图像描述

训练图像文字描述模型单独描述每个区域

存在问题

1. 缺乏上下文语境

2. 描述效率有待提高

3. 不是一种端到端的方法

斯坦福人工智能实验室最新技术

端到端的学习:从输入到输出创建一个单一的可微函数

进展

以上3大问题分别得到解决

查找给定区域

要点三:对图像深度理解需要知识和结构

目标:图像及视频场景全面理解

计算机图像识别方法与模型发展历程


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-06-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档