计算机学会预测视频的下一步内容

2016年6月21日,美国麻省理工学院发布消息称,计算机已经可以预测视频内容。

如果看到两个人会面,我们常常可以预测到即将出现的情形:握手,拥抱,甚至可能会接吻。我们这种预测行为的能力是来自于生活经验带来的直觉。另一方面,机器在利用上述复杂知识方面存在很大困难。能够预测行为的计算机系统将在以下方面带来新的可能性:能够在人类环境中更好地导航的机器人;可以预测人类摔倒的急救反应系统;能够在不同情况下提供行动建议的头戴设备等。

来自麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员在预测视觉方面取得了一项重要的新突破。他们开发了一种算法,能够比以前更准确地预测互动过程。

经过YouTube上的视频和“办公室”、“绝望主妇”等电视剧的训练,这个系统可预测两个人是否会拥抱、亲吻、握手或相互击掌。它也可以预测在一个视频中某个时刻的五秒钟后可能会出现什么对象。人类的问候行为看起来像是随意的行为,因此这个任务可以看作一个供研究人员研究的更易控制的测试实例。该研究的主要人员之一Carl Vondrick表示:人类可以自动从经验中学会预测行为,而仅仅通过观看大量的视频,计算机就能够获得足够的知识来对它们周围的情况作出持续的预测。

以前的计算机视觉预测一般采用以下两种方法之一:第一种方法是观测一副图像的每个像素,并使用这些知识来创建达到照片画质的“未来”影像。Vondrick表示,逐个像素的操作“对职业画家来说是很困难的,但对一个算法而言则简单地多”。第二种方法是利用人工为计算机预标记场景,但对大规模的预测任务来说,这是不切实际的。

CSAIL团队创造的是一种能够用来预测“视觉表示”的算法,其呈现的主要内容是某个场景的多种可能后续场景的静态效果图像。Vondrick表示,与其给出单个像素值是蓝色的、下一个是红色的等结论,视觉表示更倾向于揭示较大图像的信息,如某个表示人脸的像素集合等。

该团队的算法采用了深度学习技术。这是一个人工智能领域,使用被称为“神经网络”的系统来训练计算机去研究大量的数据,以自动找到合适的工作模式。该算法的每一个网络给出的预测表示被自动归类为四个行动之一:在上述情况下,就是拥抱、握手、击掌或者接吻。随后系统将这些行为合并成一个,并将其作为预测结果。例如,有三个网络预测的结果是接吻行为,而另一个网络可能根据有另一个人进入场景的事实预测出结果将是一个拥抱。

在使用600小时的未标记视频对算法进行训练后,该团队测试了它在新视频中对行为和对象的预测效果。测试表明,该算法对人物下一动作的预测准确率超过了43%,而现有算法只能达到36%。在第二项研究中,该算法被要求根据某个视频中的一帧图像来预测五秒种后将出现什么对象。例如,看到有人打开微波炉可能预示着后面会出现咖啡杯。研究表明,该算法的平均预测准确率只有11%,它对单帧对象的预测准确率比基准准确率高30%。

值得一提的是,人的预测准确率为71%。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2016-08-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏听雨堂

想修改CSS

      下载了一个“通用”的CSS文件,本来想偷懒的,结果发现有问题,就是它用的颜色是变量定义的,无法识别。我又找不到在哪里可以定义。 BODY{     ...

20410
来自专栏吴小龙同學

时间工具类TimeUtil

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30...

3036
来自专栏闻道于事

商城项目整理(三)JDBC增删改查

商品表的增加,修改,删除,订单表的增加,确认,用户表的查看,日志表的增加,查看 商品表建表语句: 1 create table TEST.GOODS_TABL...

5435
来自专栏菩提树下的杨过

遍历文件夹所有文件(示例)

//要引用 using System.Collections.Specialized; public StringCollection GetAllFile...

2159
来自专栏码匠的流水账

聊聊spring cloud的AbstractLoadBalancingClient

本文主要研究一下spring cloud的AbstractLoadBalancingClient

832
来自专栏成长道路

JDBC动态SQL语句连接orcale数据库的工具类

import java.sql.Connection; import java.sql.DriverManager; import java.sql.P...

2460
来自专栏C/C++基础

C#获取系统当前时间

ystem.DateTime currentTime=new System.DateTime(); 1.1 取当前年月日时分秒 currentTime=Sy...

1153
来自专栏c#开发者

C# : row-clickable GridView and get and set gridview rows using JavaScript

Complete C# code: ---------------- using System; using System.ComponentModel; ...

2986
来自专栏码匠的流水账

聊聊EurekaRibbonClientConfiguration

spring-cloud-netflix-eureka-client-2.0.0.RELEASE-sources.jar!/org/springframewor...

1161
来自专栏跟着阿笨一起玩NET

GB2312转换成UTF-8与utf_8转换成GB2312

1801

扫码关注云+社区