视频用户体验理论与实践

用户体验概论

随着视频服务逐渐成为人们获取信息的主要途径之一,消费者对观看体验的要求不断提高,视频用户体验质量已经成为视频服务的主要竞争因素。ITU-T P.10/G.100 (Amd5) 标准将用户体验质量(quality of experience,QoE)定义为“用户对某项应用或者服务的满意程度,该满意程度来自于用户对于此项应用或服务功能或质量的期望的实现程度,与该用户的个人喜好和感受相关”。其影响因素主要可以分为3个层面:服务层面、环境层面和用户层面,如图所示。

QoE的影响因素

值得注意的是,QoE引入的用户主感受本质上需要通过主观评价方法加以测定,然而因为主观评价方法对于时间和参与测试人数有着一定的要求,较为耗时耗力,目前主观测试结果主要用于对客观模型输出进行校验和训练,QoE问题的研究方向在于如何设计一套有效的客观评价办法,使得评价系统输出尽量接近人的主观感受,这样的客观评价算法在实际应用中才具有广泛的使用价值,而视频服务即是目前对于客观评价算法有迫切需求的领域之一。视频质量评价框图如下图所示,客观评价根据评价算法是否需要无质量损失的参考源,客观质量评价可以分为无参考、半参考、全参考3类,其中以无参考客观质量评价算法的应用场景更为广泛。无参考客观评价根据模型输入的不同可分为传输层模型、码流模型及混合模型。

视频质量评价框图

  • 主观评价方法

ITU对于不同的应用场景设计了不同的主观测试标准,对于视频服务应用最广泛的有ITU-T P.910以及ITU-R BT.500 标准,其中前者侧重视频会议、视频通话场景,后者侧重家庭电视环境,在基本方法上二者有交叠,主要差异在于应用场景不同。两个标准被包含的主要测试方法有:单刺激绝对分级法ACR(absolute category rating)、成对比较法PC(pair comparison)、双刺激损伤分级法DSIS(double stimulus impairment scale),双刺激损伤连续评价法DSCQS(double stimulus continuous quality scale)。

  • 客观评价——基于网络传输性能

网络传输质量的评价是利用可量化的评价指标对视频质量受网络损伤的影响程度进行合理有效的评定。由于网络的传输环境错综复杂且具有时变性,因此存在多种多样的因素能影响到传输视频的质量,其中影响较大的因素包括分组丢失、端到端时延、时延抖动和带宽等方面。ITU-T G.1050提供了IP网络上多媒体传输性能的网络评估模型。ITU-T G.1080对IPTV的用户体验质量和影响网络传输和应用层行为的信息进行了定义。ITU-T G.1081定义了IPTV服务中的性能监测点。ITU-T G.1082提供了基于实时测量结果,用于提高IPTV性能稳健性的方案。此外,ITU-T P.1200系列标准提供了流媒体质量评估模型,其中部分模型对于基于网络传输的视频质量进行了评估,例如ITU-T P.1201.2。

  • 客观评价——基于视频压缩性能

压缩编码对于视频的传输来说是必不可少的。视频编码器的作用是将输入的原始像素数据编码成码流数据并输出,其最终的目的在于实现视频的数据量的压缩。视频编码过程是一个有损压缩的过程,对视频的质量产生决定性的影响。视频编码器输出的视频质量与编码标准、编码器种类、视频内容、视频码率(比特率)和其他编码参数(如帧率、分辨率等)有密切的关系。

基于视频压缩性能的视频质量评价就是根据视频压缩过程中的关键影响因素对视频质量的压缩损伤进行评价。现有的一些主流的视频质量评价模型,包括国际电信联盟(ITU)提出的标准化视频质量评价模型和其他相关学者提出的模型,针对不同的应用场景对视频压缩质量进行了评估。各个模型在实际的应用中对视频质量评价的准确性、一致性和线性相关性等方面存在差异。

  • 3C概念与视频质量评价

作为工业界高端视频生产和研究行业组织,Ultra HD Forum 在2016年提出了基于关键质量指标的超高清图像质量“3C”KQI概念,即颜色度、对比度、清晰度(colorfulness, contrast, clarity)。颜色度侧重图像还原真实世界色彩的能力,对比度代表画面呈现亮区和暗区细节的能力,清晰度强调图像没有细节质量的损伤,具体可细化为模糊度,块效应程度,噪点度,即“3C”概念对应着5类人眼视觉相关评价指标:模糊度、块效应程度、噪点度、颜色丰富度与噪点度。

我国视频用户体验标准化进程

由中国信息通信研究院、国家新闻出版广电总局广播电视规划院牵头,中国电信,华为公司,上海交通大学等深度参与的中国视频服务用户体验标准工作组,与2016年9月发布了国内首个《视频服务用户体验评估标准(1.0)》(如图所示)。《评估标准》将视频终端用户对视频业务的总体主观体验分数Uves定义为Uves=f(Qs,Qa, Qi,Qv),即用户体验综合评分为视频体验质量(Qs),音频体验质量(Qa),交互体验质量(Qi),观看体验质量(Qv)的函数关系。标准区分了不同的应用场景,包括点播、直播以及视频监控等,其余场景正在逐步扩充中。

《视频服务用户体验评估标准(1.0)》评价结构

  • 视频体验质量

视频体验质量按照其处理信号层级主要包含Model0, Model1, Model2三层模型。其中Model0显式包含比特率(BitRate)、视频显示屏幕尺寸(ScreenSize) 、电视机分辨率(PPI)和编码器类型(CodecType)变量。Model1需要从编码数据分组及比特流中采集视频帧关键编码信息,包含视频分辨率(Resolution)及帧率(FrameRate)、每一帧的编码类型(FrameType)及帧大小(BytesPerFrame)、编码量化参数(QP)、运动矢量信息(MV)以及每一帧内编码单元跳过比例(SkipRatio)。Model2需要从播放器连续采集视频帧的图像层关键质量信息,包含模糊度(Blurriness)、块效应(Blockiness)、对比度(Contrast)、噪点度(Noise)和颜色度(Color)。三层模型所需的输入信息按获取难度递增,且评价精细化程度递增,采用分层形式有利于根据实际应用条件中的灵活调整(如不具备完全解码能力时可仅采用基于码流的前两层模型):

  • 音频体验质量

音频体验质量同样依据其处理信号层级分为三级。其中Mode0包含码率和编码类型变量, Mode1 包含码率、编码类型(E-AC3、AAC、MPEG1 Layer2、Layer3)、音频数据每秒采样点数(SampleRate)、声道数(NumberofChannels)和AAC编码中的尺度因子(ScaleFactor), Mode2需要从原始音频或播放器连续采集音频,获得响度(Loudness)、动态范围(Dynamic Range)和左右声道相位差(Skewing)等关键质量信息:

  • 交互体验质量

交互体验是指用户在视频业务使用过程中业务操作的便捷性和效率,包括直播、点播等业务操作的成功率以及交互时延等指标。用户的交互体验主要受视频系统的响应速度影响;对于不同视频业务,用户关注的交互体验具体指标有所不同。直播业务操作时,频道切换的时延tloadding是影响交互体验最重要的因素;对于点播和直播应用,均需要考虑当前已播放时长t和最大遗忘时T(默认为系统参数,用以构建遗忘曲线刻画用户对时延的忍耐性):

  • 观看体验质量

观看体验即视频在播放过程中是否有出现视频图像不连续,图像出现异常等质量劣化的情况,包括花屏、马赛克、卡顿、声画不同步等。造成这些情况的原因主要是网络和业务平台的能力是否满足要求,是否能协调一致。模型的输入变量为缓冲平均时长(Duration,所有的缓冲时长之和除以缓冲次数Frequency)与多次缓冲情况下缓冲间隔的平均值(Interval)。其次考虑视频流中花屏时间(BlockingTimeRatio)占比和花屏面积占比(BlockingAreaRatio):

视频用户体验提升措施

对于国内专网传输的IPTV业务,由于网络环境能够得到有效保障,用户体验总体表现良好,但IPTV点播业务的 4K 内容的交互体验却较低,这是由于 4K 点播内容相对高清(1080P)内容在码率上要求更高,在今后一段时期高清和 4K 内容占比不断增加的情况下,需要开展网络端到端的优化,以提升交互体验和观看体验。同时需要综合采用多种技术手段如:CDN 下沉尽量靠近用户、新的编码技术、基于主观感受的码率优化及终端播放性能优化等。

参考文献:

[1] HE T T, LIU Y K, XIE R, et al. Evaluation of no reference bitstream-based video quality assessment methods[J]. arXiv:1706.10143.

[2] 贺甜甜, 刘彦凯, 宋利. 视频用户体验理论与实践[J]. 电信科学, 2017(8).

原文发布于微信公众号 - 媒矿工厂(media_tech)

原文发表时间:2017-10-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

Intel研究院院长吴甘沙:大数据分析师的卓越之道(珍藏版)

亲爱的各位同仁,各位同学,早上好。大数据时代数据分析师应该做什么改变?我今天的标题是大数据分析师的卓越之道。这个演讲信息量比较大,我讲的不一定对,即使对的我也不...

3325
来自专栏人人都是极客

自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

“自动泊车、公路巡航控制和自动紧急制动等自动驾驶汽车功能在很大程度上是依靠传感器来实现的。重要的不仅仅是传感器的数量或种类,它们的使用方式也同样重要。目前,大多...

5027
来自专栏华章科技

Intel研究院院长吴甘沙:大数据分析师的卓越之道(珍藏版)

亲爱的各位同仁,各位同学,早上好。大数据时代数据分析师应该做什么改变?我今天的标题是大数据分析师的卓越之道。这个演讲信息量比较大,我讲的不一定对,即使对的我也不...

652
来自专栏PPV课数据科学社区

【新闻】大数据可视化的新动态

大数据可视化的新动态 Intetix Foundation(英明泰思基金会)由从事数据科学、非营利组织和公共政策研究的中国学者发起成立,致力于通过数据科学改善...

3425
来自专栏人工智能快报

英特尔研究员展望人工智能与高性能计算的融合

高性能计算领域专业媒体HPCwire发表文章,介绍了英特尔研究人员对人工智能与高性能计算结合的技术展望。 将针对特定问题的深度神经网络扩展到具有数千个节点的大型...

2719
来自专栏人工智能快报

IBM正在研制通用型深度学习芯片

深度学习领域仍在不断发展,特别地,专家们认识到如果芯片能够使用低精度的计算方式得出近似答案,神经网络就可以用很少的资源完成大量的计算。这在移动设备和其他功率受限...

912
来自专栏人工智能LeadAI

如何准备机器学习工程师面试

人们用很多东西来比喻准备面试的过程。有人说这像准备一场战争,也有人说像邀请某人出去约会,还有人说像在高尔夫大师赛上打进最后一个洞。准备面试是一个令人兴奋,又或者...

3346
来自专栏专知

自动驾驶的“大脑”——决策规划篇

自动驾驶的“大脑”——决策规划篇 中国人工智能系列白皮书-智能驾驶2017 ▌决策规划技术概述 ---- 智能汽车 ( Intelligent Vehic...

4178
来自专栏数据派THU

【干货】完结篇:英特尔中国研究院院长吴甘沙演讲全文

本文共17500字,建议阅读时间20分钟 本文为清华大数据产业联合会"技术•前沿"系列讲座的第一讲,主讲人为英特尔(中国)研究院院长吴甘沙。 内容摘要 1、领先...

1859
来自专栏机器之心

KDD2018 | 摩拜&京东联合利用智能单车数据挖掘违章停车

作者:Tianfu He、Jie Bao、Ruiyuan Li、Sijie Ruan、Yanhua Li、Chao Tian、Yu Zheng

111

扫描关注云+社区