为什么说爱奇艺是一家技术公司?

爱奇艺首席技术官兼基础架构和智能内容分发事业群总裁 刘文峰

作者 | 阿司匹林

出品 | AI科技大本营(ID:rgznai100)

作为中国视频网站的巨头之一,爱奇艺一直被外界认为是中国版的Netflix,当然这种比喻主要是从内容的角度出发。

2017年,爱奇艺的《中国有嘻哈》成为现象级综艺节目;2018年,爱奇艺独占的《延禧攻略》又登上谷歌2018年度热搜词。可以发现,不管是内容制作和内容发现,爱奇艺的眼光可谓精准。

然而,Netflix擅长的不只是内容,而是技术+内容,在用户看来,Netflix是一家内容公司,但是支撑这家公司却是对技术的大力投入,特别是AI技术,不管是视频编解码,还是内容推荐等等。在流媒体时代到来之后,AI在Netflix已经无处不在。

经过6年的沉淀之后,如今AI在爱奇艺也是无处不在。

AI无处不在

在近日举行的爱奇艺世界大会上,爱奇艺展示了AI技术和落地应用。爱奇艺首席技术官兼基础架构和智能内容分发事业群总裁刘文峰介绍称,在爱奇艺的整个运营流程中,AI发挥的作用无孔不入,贯穿视频内容的创作、生产、理解、分发、播放到变现以及客服整个流程中。

首先以智能生产环节为例。爱奇艺的内容主要来自三个部分,一部分是传统的采买,另外一部分是自制剧,以及爱奇艺号等原创用户产生的一些内容。对于自制部分,爱奇艺采用AI打造了一个爱创媒资系统,这个系统主要是针对导演、制作人的创作痛点。内容创作者在后期制作的过程中往往会被一些非原创性的工作所影响,以至于没有办法集中精力,而且拍摄素材繁多,导致1~2个小时的综艺后期制作的时间往往要花上8~10天才能最终看到成片。通过使用身份识别、表情识别、镜头识别等AI技术,类似工作可缩短至数分钟,剪辑师可以很方便地从繁杂的素材中挑选精彩片段,效率提高20%-30%。

比如,导演想要成百上千个小时的素材里找到吴亦凡生气的特写,AI可能只需要三步就能解决:第一是身份识别,找出吴亦凡;第二是表情识别,识别出生气的表情;第三是镜头识别,识别特写镜头。这样就能很快把导演想要的片段找出来。

此外,拍摄片场里往往有几十个摄像机在同时拍摄,这样就会产生非常多路的素材,原来把这些素材按照自然时间精准对齐费时费力,但是有了AI技术可以把时间缩短到分钟级别。此外,爱奇艺还通过语音识别技术辅助字幕输出,大大提高了后期字幕制作的效率。今年的《青春有你》、《我是唱作人》等都已经落地了爱奇艺爱创媒资系统。除了辅助后期制作,爱奇艺提供的AI技术还可以按照模板自动利用精彩的素材生成优质的短视频内容,甚至可以通过分析BGM的节拍,按照节拍自动切换画面。

爱奇艺还打造了智能视频增强解决方案——ZoomAI。ZoomAI主要是针对影视作品进行画质修复和增强:首先,利用超分辨率技术解决分辨率低的问题;其次,利用去噪锐化解决有背景噪声和压缩噪声的问题;色彩增强则可以解决色彩灰暗的问题;针对帧率低的问题可以通过插帧的手段解决;由于胶片损伤导致的视频上有很多的划痕的问题则可以通过去划痕技术来解决。

在广告领域,爱奇艺也做了很多创新和探索,以减少片头广告对用户观看体验带来的不利影响。爱奇艺推出创可贴广告,通过AI识别视频里适合投放的广告点位。比如AI可以自动识别视频里的做饭场景,然后自动投放厨具品牌的广告;也可以通过AI识别明星身份,投放他的代言广告。

除了创可贴广告之外,爱奇艺还在探索非常多的新的广告形式,比如前情提要的广告,以及在精彩高能、集数播报的一些点位进行广告投放。比如在足球比赛直播时,AI能够实时分析画面,把进球的点位找出来,然后进行相应的广告投放。这些新的形式可以大幅提升广告效果和用户的观看体验。

在个性化领域,爱奇艺做的工作的也非常多,比如信息流推荐,比如搜索场景,比如短视频展示等等。为了能够真正实现个性化,爱奇艺除了采用综合模型,还会把用户的观看行为、互动模型和留存模型全部考虑进去。当然,不只是内容推荐可以千人千面,利用AI技术,爱奇艺还实现了电视或电影海报的千人千面。

此外,还有蒙版弹幕技术,能够实现“弹幕穿人过,爱豆心中坐”;HomeAI语音交互平台,通过智能搜索、智能跳转与百科问答等功能激活线上与线下场景之间的互动;AI雷达功能,可以智能识别人物、音乐、物品,用户还能即时扫码解锁产品信息并可实现购买行为等等。

不过技术不只是技术,也不只是为了商业,技术也是有温度的。为了帮助听障人士,爱奇艺推出了AI手语主播,它的工作原理是通过自动语音识别技术(ASR),准确识别视频中的语音并转换为文字,然后NLP技术将文字转换为手语内容,之后通过虚拟偶像进行输出。

整个产品把虚拟偶像和爱奇艺的ASR、NLP等AI技术进行结合,从而达到自动手语翻译的效果;通过爱奇艺AI的语义理解能力,AI手语主播能够对自然语言进行理解,并且智能翻译为手语表达;及其深度学习和训练则后续不断优化翻译效果。

2018年11月,爱奇艺发布的了适合娱乐场景的虚拟主播,今年爱奇艺将与华夏出版社、中国聋人协会和凤凰云祥等机构合作,研发适合严肃场景的新闻主播。

打破虚拟与现实的界限

除了无处不在的AI技术,爱奇艺也渴望冲破限制,让用户享受具有真实感和沉浸感观影体验。在这次大会上,爱奇艺还发布了奇遇VR系列新品——奇遇2S、奇遇2Pro、奇遇AR。

据介绍,奇遇2S VR一体机采用Real RGB 4K高清屏幕,同时采用无杂散光的非球面镜片,并基于显示屏的特性进行针对性优化,保证全视场的清晰度。奇遇2S VR一体机采用的是骁龙835,采用杜比及DTS双解码音效。

VR如何做到防眩晕一直是一个难题,爱奇艺奇遇VR将屏幕刷新率做到70HZ,同时优化了从头部运动到图像上屏的ATW反畸变、反色散的核心算法,在保证110度FOV的前提下,采用非对称光学设计,增加自适应IPD调节机制,以此缓解眩晕疲劳问题。

为了解决VR环境下的观影互动的高清晰度与流畅性,爱奇艺通过CDN技术与移动边缘计算系统(MEC)的融合,来保证用户的观影体验。

除了基本配置,丰富的VR内容也非常重要。营长现场亲自体验之后发现,爱奇艺除了拥有诸多高清片源之外,而且还有加入了很多小细节,比如爱奇艺在VR里设置了巨幕影院场景,让你在观影的时候仿佛置身电影院,非常新奇。

虽然大家对VR的前景可能仍有质疑,但是爱奇艺智能科技CEO熊文表示,随着5G商业化,2019年VR又将站上风口。

当然,虚拟与现实的界限除了观看方式,还需要增加互动。在此次大会上,爱奇艺还发布全球首个互动视频标准(Interactive Video Guideline,IVG),并计划推出协助互动视频生产的互动视频平台(Interactive Video Platform,IVP),并且公布国内首个带入式互动影视作品《他的微笑》也将上线。

根据介绍,爱奇艺发布的互动视频标准可以提供分支剧情、角色切换、画面信息探索等剧本结构设置,并提供与之对应的互动组件,从剧情设置到互动能力展现多个环节协助创作方制作互动影视内容。

也就是说,以后看视频,你可以决定剧情走向了。

编者手记

“虽然我们现在做的是媒体行业的事情,但是我们的核心是技术。爱奇艺是一个非常强的技术公司,从人员结构上接近一半的人是工程师,我们是同业公司里技术功底最高的公司。”爱奇艺创始人&CEO 龚宇此前接受采访时曾给爱奇艺定调。

2016年,爱奇艺的技术研发投入是8.2亿,2017年这一数字达到12.7亿,2018全年研发投入20亿人民币,比2017年增长57%。在刚刚发布的2019第一季度财报中,研发费用支出5.981亿元人民币(约合8910万美元),同比增长54%。这些数字足以说明爱奇艺对技术的重视。

创立9年,爱奇艺和Netflix越来越靠近,也越来越远离。共同点是对技术的重视和大力投入,不同点则是业务方向的偏离。

可以肯定的是,爱奇艺的未来已经没法再用Netflix来定义。

(*本文为 AI科技大本营原创文章,转载请联系原作者)

CTA核心技术及应用峰会

5月25-27日,由中国IT社区CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会将在杭州国际博览中心隆重召开,峰会将围绕人工智能领域,邀请技术领航者,与开发者共同探讨机器学习和知识图谱的前沿研究及应用。

更多重磅嘉宾请识别海报二维码查看,点击阅读原文即刻抢购。添加小助手微信15101014297,备注“CTA”,了解票务以及会务详情。

推荐阅读

点击阅读原文,了解「CTA核心技术及应用峰会」

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2019-05-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券