前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >剑桥科学家用两百万段视频教会人工智能预测未来

剑桥科学家用两百万段视频教会人工智能预测未来

作者头像
人工智能快报
发布2018-03-07 16:37:48
5890
发布2018-03-07 16:37:48
举报
文章被收录于专栏:人工智能快报人工智能快报

人工智能系统可以预测场景如何展开,也可以设想不久的将来。

对于静止画面,深度学习算法生成的微视频可以预测接下来可能发生的场景。例如,如果展示的是一幅火车站的场景,人工智能系统可能会想象火车驶离站台,而如果是海滩图,则会生成层层叠叠的波浪动态图。

训练人工智能预测未来有助于促进其对当下场景的认知。当某人做饭时,要明白他在做什么,我们就会想象他们接下来会吃什么,而人工智能很难做到这一点。该系统还可帮助人工智能助手预测危险,如预测某个人即将摔倒或帮助自动驾驶汽车预测事故。

“在现实世界里运行的任何机器人都需要具备一些预测未来的基本能力。”美国麻省理工学院研究人员指出,“例如,如果你要坐下,你不会希望机器人把椅子从你身后拉开。”

2016年12月5日,该团队在西班牙巴塞罗那举行的神经计算大会上展示了他们的研究成果。

为开发人工智能,该团队用图像分享网站Flickr的两百万段视频对其系统进行训练,包括海滩、高尔夫球场、火车站和住院婴儿等场景。这些视频没有标签,即没有有助于人工智能识别它们的信息标记。然后,研究人员给模型提供了静止图像,自动生成了一段段关于预测情景的微视频。

为了训练人工智能制作更好的视频,该团队采用了“对抗式网络”法。一个网络生成视频,另一个网络用于判断视频看上去是真实的还是虚构的。这两个网络相互竞争:生成视频的那个网络尽力创造出能够使另一个网络无法分辨的视频,而后者则不遗余力区分哪些是生成的视频哪些是现实场景。

此时这些视频的像素低,32帧,时长仅超过1秒,但它们会逐渐变得清晰,展现相应的运动场景:列车以直线轨迹向前移动、婴儿皱脸。纽约大学和脸谱网等开展的视频场景预测研究需要多个输入帧,只生成少量未来帧,而且通常是模糊的。

这些视频提供的信息对于人类而言似乎并不可靠,人工智能还需要接受更多的训练。例如,它没有意识到离站的火车最终还应离开画面,这是因为人工智能没有关于现实世界的先验知识,它缺乏我们所说的常识。这两百万段视频都是人工智能需要学习的数据,以便理解人类世界的一些规则。“与一个10岁儿童掌握的知识或人类的进化史相比,这些视频所包含的内容并不多。”研究人员表示。

英国剑桥大学计算机实验室的研究人员指出,该研究展示了计算机视觉与机器学习技术结合的产物,其一个关键方面在于能够认识到随着时间发生的事物之间的因果联系。物理法则和物体的本质意味着并不是任何事情都会发生,该团队证实了这些限制条件也是可以被学习的。”

该团队目前正在对系统进行扩展,目的是制作更大更长的视频。研究人员指出,虽然人工智能可能始终无法做到准确预测未来,但它可以向我们展示可能发生的情形,人们有望最终开发出能够合理预见各种图像和视频的后续场景的预测系统。”

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-01-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能快报 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
智能识别
腾讯云智能识别(Intelligent Identification,II)基于腾讯各实验室最新研究成果,为您提供视频内容的全方位识别,支持识别视频内的人物、语音、文字以及帧标签,对视频进行多维度结构化分析。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档