动态 | MIT CSAIL最新研究:将AI应用于流媒体视频,可获得更好的播放体验

AI科技评论按:在网上看视频时,缓冲或色块问题时有发生,极其影响观看体验。现在,MIT计算机科学与人工智能实验室(CSAIL)利用神经网络算法,最大化地缓解了这种现象。将这种算法应用到YouTube或Netflix等网站之后,观众将会获得更好的体验。此外,这项技术还能应用于VR,缓解现有的网络带宽不够的问题。

Engadget上的一篇文章详述了CSAIL新的方法,AI科技评论将其编译如下。

缓冲和色块是流媒体视频播放中常常出现的问题。一旦出现这种情况,会影响观看体验,观众换台之后,又会影响广告商的收入。并且,这种情况还给流媒体服务带来了技术上的难点——很难设计出解决方案。

MIT 计算机科学与人工智能实验室(CSAIL)新发明的神经网络AI算法或许恰好能满足互联网所需的流畅流媒体服务。

上面播放的视频并不是以整段传输到电脑上的,那会占用太大的带宽。事实上,数据被分成小片段,然后按顺序传送。但是为了保证视频质量,像YouTube这样的网站是利用ABR(码率自适应)算法来确定视频播放的分辨率。ABR算法通常有两种模式:一种是测量网络传输数据的速率,另一种是保证视频开头有足够的缓冲区。

如果基于速率的算法失败了,系统会降低比特率以确保视频继续播放,这会导致色块问题。

另外,如果试图将视频快进太多,将会更加影响播放体验,这是因为基于缓冲的系统提前加载新的视频块和缓冲区时,不得不暂停播放。

这两种ABR模式本质上是解决同一问题的两面,他们都没有完全解决问题的能力。接下来就是人工智能的用武之地了。

实际上已经有了一些关于这个问题的研究。卡耐基梅隆大学的一个研究小组最近开发了一种叫做“模型预测控制”(MPC)的方案,试图预测网络环境如何随时间变化,并基于这个模型做出优化决策。然而,这个系统的问题在于,它只会基于模型自身做出优化决策,不适合那些突然或急剧发生流量变化的网络。

CSAIL的新方法被称为“Pensive”,它并不依赖模型,而是用机器学习来计算何时(以及何种情况下)在速率ABR和基于缓冲的ABR之间进行切换。和其他神经网络一样,Pensive使用奖励和惩罚来强化每次试验的结果。随着时间的推移,系统能够调整自己的行为,始终获得最高的奖励。有趣的是,由于可以调节奖励,我们可以调整系统,让它执行我们想要得到的行为。

麻省理工学院教授Mohammad Alizadeh在一份声明中说:“我们的系统很灵活,无论想要什么样的效果,都可以优化它来实现。甚至可以想象用户个性化自己的流媒体体验,这取决于他们是想要让缓冲优先还是让分辨率优先。”该团队对这个神经网络只进行了总长一个月的下载视频内容的训练,就已经能获得与MPC系统相同的分辨率,但减少了10%到30%的缓冲问题。

我们最终会看到这一技术被YouTube和Netflix等公司采用,但麻省理工学院的团队希望先将它应用于VR。Alizadeh说:“VR需要4k的分辨率,在使用时,码率很容易就达到每秒上千兆,而现在的网络根本无法支持。我们很高兴看到像Pensieve这样的系统能够为VR等这样的应用做些什么。这只是我们所做出的第一步。”

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-08-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

一份在移动应用程序项目中使用机器学习的指南

机器学习是人工智能的核心,旨在创建一个解决类似问题的通用方法。机器学习已经被整合到我们经常在日常生活中使用应用中,比如iPhone的Siri。本文是一个包含了如...

3456
来自专栏AI科技评论

业界 | 谷歌 Smart Compose:神经网络可以帮你写 Gmail 邮件了

AI 科技评论按:在 Google I/O 2018 上,除了 Google 助手给餐馆打电话的场景赢得现场观众的喝彩外,在用户写邮件时可预测下一句的 Smar...

863
来自专栏FreeBuf

机器学习在安全攻防场景的应用与分析

一、引言 随着人工智能(artificialintelligence, 简称AI)的技术突破,现今的计算技术可从大数据平台中挖掘出有价值的信息,从而为人们在决策...

8676
来自专栏人工智能头条

在机器学习模型运行时保持高效的方法

1102
来自专栏AI科技评论

【深度】机器学习如何帮助Youtube 实现高效转码?

GAIR 今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”(简称GAIR)。大会现场,雷锋网将发布“人工智能&机器人Top25创新企...

2924
来自专栏ATYUN订阅号

2018年嵌入式处理器报告:神经网络加速器的崛起

人工智能和机器学习应用程序代表了嵌入式处理器的下一个重大市场机遇。然而,传统的处理解决方案并不是为了计算神经网络的工作负载,这些工作负载为许多应用程序提供了动力...

4265
来自专栏云计算D1net

谷歌推出云自然语言API

将自然语言处理(NLP)的先进成果,从前沿研究的小世界里拿出来,送到普通的数据科学家和软件工程师手中,这已经成为一场运动。7月20日,谷歌也加入进来,发布了测试...

3295
来自专栏新智元

【深度】TensorFlow or TensorSlow,谷歌基准测试为何不给力?(附Google内部员工测试代码下载)

11月9日Google发布了第二代深度学习引擎TensorFlow,引起业内广泛关注。发布后业内人士热议的一个话题是:这个引擎能否成为Google所说的平台级产...

4354
来自专栏PPV课数据科学社区

2017年最全的数据科学学习计划(完结篇)

注: 在PPV课微信公众号回复“数据科学计划”获取PDF全文,内附学习资料网址推荐,让学习直达源头,不用找度娘更省心! 本文为2017年最全的数据科学学习计划(...

33211
来自专栏AI科技评论

论文 | 谷歌OpenAI联合发布AI安全五大准则,预防AI暴走(下)

今天我们带来了谷歌安全五大定律的下篇,经过详细的论证,谷歌给出了一个可执行的AI的安全问题设计框架。让对于AI的限制的问题不再仅限于假设和推测,对今后深度学习系...

2654

扫码关注云+社区