视频用户体验理论与实践

用户体验概论

随着视频服务逐渐成为人们获取信息的主要途径之一,消费者对观看体验的要求不断提高,视频用户体验质量已经成为视频服务的主要竞争因素。ITU-T P.10/G.100 (Amd5) 标准将用户体验质量(quality of experience,QoE)定义为“用户对某项应用或者服务的满意程度,该满意程度来自于用户对于此项应用或服务功能或质量的期望的实现程度,与该用户的个人喜好和感受相关”。其影响因素主要可以分为3个层面:服务层面、环境层面和用户层面,如图所示。

QoE的影响因素

值得注意的是,QoE引入的用户主感受本质上需要通过主观评价方法加以测定,然而因为主观评价方法对于时间和参与测试人数有着一定的要求,较为耗时耗力,目前主观测试结果主要用于对客观模型输出进行校验和训练,QoE问题的研究方向在于如何设计一套有效的客观评价办法,使得评价系统输出尽量接近人的主观感受,这样的客观评价算法在实际应用中才具有广泛的使用价值,而视频服务即是目前对于客观评价算法有迫切需求的领域之一。视频质量评价框图如下图所示,客观评价根据评价算法是否需要无质量损失的参考源,客观质量评价可以分为无参考、半参考、全参考3类,其中以无参考客观质量评价算法的应用场景更为广泛。无参考客观评价根据模型输入的不同可分为传输层模型、码流模型及混合模型。

视频质量评价框图

  • 主观评价方法

ITU对于不同的应用场景设计了不同的主观测试标准,对于视频服务应用最广泛的有ITU-T P.910以及ITU-R BT.500 标准,其中前者侧重视频会议、视频通话场景,后者侧重家庭电视环境,在基本方法上二者有交叠,主要差异在于应用场景不同。两个标准被包含的主要测试方法有:单刺激绝对分级法ACR(absolute category rating)、成对比较法PC(pair comparison)、双刺激损伤分级法DSIS(double stimulus impairment scale),双刺激损伤连续评价法DSCQS(double stimulus continuous quality scale)。

  • 客观评价——基于网络传输性能

网络传输质量的评价是利用可量化的评价指标对视频质量受网络损伤的影响程度进行合理有效的评定。由于网络的传输环境错综复杂且具有时变性,因此存在多种多样的因素能影响到传输视频的质量,其中影响较大的因素包括分组丢失、端到端时延、时延抖动和带宽等方面。ITU-T G.1050提供了IP网络上多媒体传输性能的网络评估模型。ITU-T G.1080对IPTV的用户体验质量和影响网络传输和应用层行为的信息进行了定义。ITU-T G.1081定义了IPTV服务中的性能监测点。ITU-T G.1082提供了基于实时测量结果,用于提高IPTV性能稳健性的方案。此外,ITU-T P.1200系列标准提供了流媒体质量评估模型,其中部分模型对于基于网络传输的视频质量进行了评估,例如ITU-T P.1201.2。

  • 客观评价——基于视频压缩性能

压缩编码对于视频的传输来说是必不可少的。视频编码器的作用是将输入的原始像素数据编码成码流数据并输出,其最终的目的在于实现视频的数据量的压缩。视频编码过程是一个有损压缩的过程,对视频的质量产生决定性的影响。视频编码器输出的视频质量与编码标准、编码器种类、视频内容、视频码率(比特率)和其他编码参数(如帧率、分辨率等)有密切的关系。

基于视频压缩性能的视频质量评价就是根据视频压缩过程中的关键影响因素对视频质量的压缩损伤进行评价。现有的一些主流的视频质量评价模型,包括国际电信联盟(ITU)提出的标准化视频质量评价模型和其他相关学者提出的模型,针对不同的应用场景对视频压缩质量进行了评估。各个模型在实际的应用中对视频质量评价的准确性、一致性和线性相关性等方面存在差异。

  • 3C概念与视频质量评价

作为工业界高端视频生产和研究行业组织,Ultra HD Forum 在2016年提出了基于关键质量指标的超高清图像质量“3C”KQI概念,即颜色度、对比度、清晰度(colorfulness, contrast, clarity)。颜色度侧重图像还原真实世界色彩的能力,对比度代表画面呈现亮区和暗区细节的能力,清晰度强调图像没有细节质量的损伤,具体可细化为模糊度,块效应程度,噪点度,即“3C”概念对应着5类人眼视觉相关评价指标:模糊度、块效应程度、噪点度、颜色丰富度与噪点度。

我国视频用户体验标准化进程

由中国信息通信研究院、国家新闻出版广电总局广播电视规划院牵头,中国电信,华为公司,上海交通大学等深度参与的中国视频服务用户体验标准工作组,与2016年9月发布了国内首个《视频服务用户体验评估标准(1.0)》(如图所示)。《评估标准》将视频终端用户对视频业务的总体主观体验分数Uves定义为Uves=f(Qs,Qa, Qi,Qv),即用户体验综合评分为视频体验质量(Qs),音频体验质量(Qa),交互体验质量(Qi),观看体验质量(Qv)的函数关系。标准区分了不同的应用场景,包括点播、直播以及视频监控等,其余场景正在逐步扩充中。

《视频服务用户体验评估标准(1.0)》评价结构

  • 视频体验质量

视频体验质量按照其处理信号层级主要包含Model0, Model1, Model2三层模型。其中Model0显式包含比特率(BitRate)、视频显示屏幕尺寸(ScreenSize) 、电视机分辨率(PPI)和编码器类型(CodecType)变量。Model1需要从编码数据分组及比特流中采集视频帧关键编码信息,包含视频分辨率(Resolution)及帧率(FrameRate)、每一帧的编码类型(FrameType)及帧大小(BytesPerFrame)、编码量化参数(QP)、运动矢量信息(MV)以及每一帧内编码单元跳过比例(SkipRatio)。Model2需要从播放器连续采集视频帧的图像层关键质量信息,包含模糊度(Blurriness)、块效应(Blockiness)、对比度(Contrast)、噪点度(Noise)和颜色度(Color)。三层模型所需的输入信息按获取难度递增,且评价精细化程度递增,采用分层形式有利于根据实际应用条件中的灵活调整(如不具备完全解码能力时可仅采用基于码流的前两层模型):

  • 音频体验质量

音频体验质量同样依据其处理信号层级分为三级。其中Mode0包含码率和编码类型变量, Mode1 包含码率、编码类型(E-AC3、AAC、MPEG1 Layer2、Layer3)、音频数据每秒采样点数(SampleRate)、声道数(NumberofChannels)和AAC编码中的尺度因子(ScaleFactor), Mode2需要从原始音频或播放器连续采集音频,获得响度(Loudness)、动态范围(Dynamic Range)和左右声道相位差(Skewing)等关键质量信息:

  • 交互体验质量

交互体验是指用户在视频业务使用过程中业务操作的便捷性和效率,包括直播、点播等业务操作的成功率以及交互时延等指标。用户的交互体验主要受视频系统的响应速度影响;对于不同视频业务,用户关注的交互体验具体指标有所不同。直播业务操作时,频道切换的时延tloadding是影响交互体验最重要的因素;对于点播和直播应用,均需要考虑当前已播放时长t和最大遗忘时T(默认为系统参数,用以构建遗忘曲线刻画用户对时延的忍耐性):

  • 观看体验质量

观看体验即视频在播放过程中是否有出现视频图像不连续,图像出现异常等质量劣化的情况,包括花屏、马赛克、卡顿、声画不同步等。造成这些情况的原因主要是网络和业务平台的能力是否满足要求,是否能协调一致。模型的输入变量为缓冲平均时长(Duration,所有的缓冲时长之和除以缓冲次数Frequency)与多次缓冲情况下缓冲间隔的平均值(Interval)。其次考虑视频流中花屏时间(BlockingTimeRatio)占比和花屏面积占比(BlockingAreaRatio):

视频用户体验提升措施

对于国内专网传输的IPTV业务,由于网络环境能够得到有效保障,用户体验总体表现良好,但IPTV点播业务的 4K 内容的交互体验却较低,这是由于 4K 点播内容相对高清(1080P)内容在码率上要求更高,在今后一段时期高清和 4K 内容占比不断增加的情况下,需要开展网络端到端的优化,以提升交互体验和观看体验。同时需要综合采用多种技术手段如:CDN 下沉尽量靠近用户、新的编码技术、基于主观感受的码率优化及终端播放性能优化等。

参考文献:

[1] HE T T, LIU Y K, XIE R, et al. Evaluation of no reference bitstream-based video quality assessment methods[J]. arXiv:1706.10143.

[2] 贺甜甜, 刘彦凯, 宋利. 视频用户体验理论与实践[J]. 电信科学, 2017(8).

原文发布于微信公众号 - 媒矿工厂(media_tech)

原文发表时间:2017-10-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【2017深度学习框架大事记】PyTorch成TensorFlow最大竞争对手,微软、亚马逊、Facebook 合作联盟对抗谷歌

来源:towardsdatascience.com 作者:Indra den Bakker 编译:刘小芹 【新智元导读】2017年,深度学习框架领域出现了许多新...

3906
来自专栏机器人网

推荐:10种机器学习的工具和框架(附;链接)

AWS re:Invent 2017上宣布的一款重大产品就是正式发布的亚马逊Sagemaker,这种新的框架简化了构建机器学习模型并部署到云端的任务。

1311
来自专栏机器人网

2018年大行其道的10种机器学习的工具和框架

2017年是机器学习大放异彩的一年,这归功于众多公司广泛而深入地研究和开发更新颖、更高效的工具和框架。这里介绍,有望在2018年大行其道的10种机器学习的工具和...

6045
来自专栏新智元

【重磅】微软Facebook联手发布AI生态系统,CNTK+Caffe2+PyTorch挑战TensorFlow

【新智元导读】夜间重磅,微软Facebook联手发布AI生态系统,推出 Open Neural Network Exchange(ONNX,开放神经网络交换)格...

3084
来自专栏FD的专栏

什么是最小可行性数据产品(MVP)?如何用它做机器学习?

本文作者是一名数据科学家,现在离开了Pivotal公司加入了idealo公司,正在帮助其搭建数据科学团队以及把机器学习整合到公司的产品中。

892
来自专栏PPV课数据科学社区

常用的5种数据可视化方法

小编最近在研究后台的设计,涉及到数据统计分析模块的数据的呈现方面,搜集学习材料的时候发现这篇文章,推荐给有需求的童靴们共同学习。在文章中,原作者跟大家分享数据可...

2434
来自专栏机器人网

有望在2018年大行其道的10种机器学习工具和框架

2017年是机器学习大放异彩的一年,这归功于众多公司广泛而深入地研究和开发更新颖、更高效的工具和框架。这里介绍,有望在2018年大行其道的10种机器学习的工具和...

3895
来自专栏数据科学与人工智能

【数据挖掘】常用的数据挖掘方法

数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡...

2576
来自专栏华章科技

极度烧脑+惊人发现:4个颠覆你世界观的量子理论实验

导读:最近,“量子”这个词成了网红。科幻作家们用量子理论虚构一个神奇的世界;量子计算是最火热的前沿技术之一;量子纠缠也成了伪科学用来忽悠人的幌子……

841
来自专栏企鹅号快讯

PyTorch一周年战绩总结:是否比TensorFlow来势凶猛?

选自PyTorch 机器之心编译 今天 PyTorch 刚好一周年。自发布以来,由于调试、编译等多方面的优势,它成为 2017 年热度极高的框架之一。本文内容介...

2208

扫码关注云+社区