视频用户体验理论与实践

用户体验概论

随着视频服务逐渐成为人们获取信息的主要途径之一,消费者对观看体验的要求不断提高,视频用户体验质量已经成为视频服务的主要竞争因素。ITU-T P.10/G.100 (Amd5) 标准将用户体验质量(quality of experience,QoE)定义为“用户对某项应用或者服务的满意程度,该满意程度来自于用户对于此项应用或服务功能或质量的期望的实现程度,与该用户的个人喜好和感受相关”。其影响因素主要可以分为3个层面:服务层面、环境层面和用户层面,如图所示。

QoE的影响因素

值得注意的是,QoE引入的用户主感受本质上需要通过主观评价方法加以测定,然而因为主观评价方法对于时间和参与测试人数有着一定的要求,较为耗时耗力,目前主观测试结果主要用于对客观模型输出进行校验和训练,QoE问题的研究方向在于如何设计一套有效的客观评价办法,使得评价系统输出尽量接近人的主观感受,这样的客观评价算法在实际应用中才具有广泛的使用价值,而视频服务即是目前对于客观评价算法有迫切需求的领域之一。视频质量评价框图如下图所示,客观评价根据评价算法是否需要无质量损失的参考源,客观质量评价可以分为无参考、半参考、全参考3类,其中以无参考客观质量评价算法的应用场景更为广泛。无参考客观评价根据模型输入的不同可分为传输层模型、码流模型及混合模型。

视频质量评价框图

  • 主观评价方法

ITU对于不同的应用场景设计了不同的主观测试标准,对于视频服务应用最广泛的有ITU-T P.910以及ITU-R BT.500 标准,其中前者侧重视频会议、视频通话场景,后者侧重家庭电视环境,在基本方法上二者有交叠,主要差异在于应用场景不同。两个标准被包含的主要测试方法有:单刺激绝对分级法ACR(absolute category rating)、成对比较法PC(pair comparison)、双刺激损伤分级法DSIS(double stimulus impairment scale),双刺激损伤连续评价法DSCQS(double stimulus continuous quality scale)。

  • 客观评价——基于网络传输性能

网络传输质量的评价是利用可量化的评价指标对视频质量受网络损伤的影响程度进行合理有效的评定。由于网络的传输环境错综复杂且具有时变性,因此存在多种多样的因素能影响到传输视频的质量,其中影响较大的因素包括分组丢失、端到端时延、时延抖动和带宽等方面。ITU-T G.1050提供了IP网络上多媒体传输性能的网络评估模型。ITU-T G.1080对IPTV的用户体验质量和影响网络传输和应用层行为的信息进行了定义。ITU-T G.1081定义了IPTV服务中的性能监测点。ITU-T G.1082提供了基于实时测量结果,用于提高IPTV性能稳健性的方案。此外,ITU-T P.1200系列标准提供了流媒体质量评估模型,其中部分模型对于基于网络传输的视频质量进行了评估,例如ITU-T P.1201.2。

  • 客观评价——基于视频压缩性能

压缩编码对于视频的传输来说是必不可少的。视频编码器的作用是将输入的原始像素数据编码成码流数据并输出,其最终的目的在于实现视频的数据量的压缩。视频编码过程是一个有损压缩的过程,对视频的质量产生决定性的影响。视频编码器输出的视频质量与编码标准、编码器种类、视频内容、视频码率(比特率)和其他编码参数(如帧率、分辨率等)有密切的关系。

基于视频压缩性能的视频质量评价就是根据视频压缩过程中的关键影响因素对视频质量的压缩损伤进行评价。现有的一些主流的视频质量评价模型,包括国际电信联盟(ITU)提出的标准化视频质量评价模型和其他相关学者提出的模型,针对不同的应用场景对视频压缩质量进行了评估。各个模型在实际的应用中对视频质量评价的准确性、一致性和线性相关性等方面存在差异。

  • 3C概念与视频质量评价

作为工业界高端视频生产和研究行业组织,Ultra HD Forum 在2016年提出了基于关键质量指标的超高清图像质量“3C”KQI概念,即颜色度、对比度、清晰度(colorfulness, contrast, clarity)。颜色度侧重图像还原真实世界色彩的能力,对比度代表画面呈现亮区和暗区细节的能力,清晰度强调图像没有细节质量的损伤,具体可细化为模糊度,块效应程度,噪点度,即“3C”概念对应着5类人眼视觉相关评价指标:模糊度、块效应程度、噪点度、颜色丰富度与噪点度。

我国视频用户体验标准化进程

由中国信息通信研究院、国家新闻出版广电总局广播电视规划院牵头,中国电信,华为公司,上海交通大学等深度参与的中国视频服务用户体验标准工作组,与2016年9月发布了国内首个《视频服务用户体验评估标准(1.0)》(如图所示)。《评估标准》将视频终端用户对视频业务的总体主观体验分数Uves定义为Uves=f(Qs,Qa, Qi,Qv),即用户体验综合评分为视频体验质量(Qs),音频体验质量(Qa),交互体验质量(Qi),观看体验质量(Qv)的函数关系。标准区分了不同的应用场景,包括点播、直播以及视频监控等,其余场景正在逐步扩充中。

《视频服务用户体验评估标准(1.0)》评价结构

  • 视频体验质量

视频体验质量按照其处理信号层级主要包含Model0, Model1, Model2三层模型。其中Model0显式包含比特率(BitRate)、视频显示屏幕尺寸(ScreenSize) 、电视机分辨率(PPI)和编码器类型(CodecType)变量。Model1需要从编码数据分组及比特流中采集视频帧关键编码信息,包含视频分辨率(Resolution)及帧率(FrameRate)、每一帧的编码类型(FrameType)及帧大小(BytesPerFrame)、编码量化参数(QP)、运动矢量信息(MV)以及每一帧内编码单元跳过比例(SkipRatio)。Model2需要从播放器连续采集视频帧的图像层关键质量信息,包含模糊度(Blurriness)、块效应(Blockiness)、对比度(Contrast)、噪点度(Noise)和颜色度(Color)。三层模型所需的输入信息按获取难度递增,且评价精细化程度递增,采用分层形式有利于根据实际应用条件中的灵活调整(如不具备完全解码能力时可仅采用基于码流的前两层模型):

  • 音频体验质量

音频体验质量同样依据其处理信号层级分为三级。其中Mode0包含码率和编码类型变量, Mode1 包含码率、编码类型(E-AC3、AAC、MPEG1 Layer2、Layer3)、音频数据每秒采样点数(SampleRate)、声道数(NumberofChannels)和AAC编码中的尺度因子(ScaleFactor), Mode2需要从原始音频或播放器连续采集音频,获得响度(Loudness)、动态范围(Dynamic Range)和左右声道相位差(Skewing)等关键质量信息:

  • 交互体验质量

交互体验是指用户在视频业务使用过程中业务操作的便捷性和效率,包括直播、点播等业务操作的成功率以及交互时延等指标。用户的交互体验主要受视频系统的响应速度影响;对于不同视频业务,用户关注的交互体验具体指标有所不同。直播业务操作时,频道切换的时延tloadding是影响交互体验最重要的因素;对于点播和直播应用,均需要考虑当前已播放时长t和最大遗忘时T(默认为系统参数,用以构建遗忘曲线刻画用户对时延的忍耐性):

  • 观看体验质量

观看体验即视频在播放过程中是否有出现视频图像不连续,图像出现异常等质量劣化的情况,包括花屏、马赛克、卡顿、声画不同步等。造成这些情况的原因主要是网络和业务平台的能力是否满足要求,是否能协调一致。模型的输入变量为缓冲平均时长(Duration,所有的缓冲时长之和除以缓冲次数Frequency)与多次缓冲情况下缓冲间隔的平均值(Interval)。其次考虑视频流中花屏时间(BlockingTimeRatio)占比和花屏面积占比(BlockingAreaRatio):

视频用户体验提升措施

对于国内专网传输的IPTV业务,由于网络环境能够得到有效保障,用户体验总体表现良好,但IPTV点播业务的 4K 内容的交互体验却较低,这是由于 4K 点播内容相对高清(1080P)内容在码率上要求更高,在今后一段时期高清和 4K 内容占比不断增加的情况下,需要开展网络端到端的优化,以提升交互体验和观看体验。同时需要综合采用多种技术手段如:CDN 下沉尽量靠近用户、新的编码技术、基于主观感受的码率优化及终端播放性能优化等。

参考文献:

[1] HE T T, LIU Y K, XIE R, et al. Evaluation of no reference bitstream-based video quality assessment methods[J]. arXiv:1706.10143.

[2] 贺甜甜, 刘彦凯, 宋利. 视频用户体验理论与实践[J]. 电信科学, 2017(8).

原文发布于微信公众号 - 媒矿工厂(media_tech)

原文发表时间:2017-10-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CSDN技术头条

SDCC 2015算法专场札记:知名互联网公司的算法实践

【编者按】11月21日,为期三天的SDCC2015中国软件开发者大会成功闭幕,主办方总计邀请了95余位演讲嘉宾,为参会者奉献了10个主题演讲,9大技术专场论坛(...

1896
来自专栏量子位

亚马逊全面发力AI,推机器学习托管服务、四项新工具,还有AI硬件

Root 假装发自 拉斯维加斯 量子位 出品 | 公众号 QbitAI 机器学习现在已经在多个领域爆发出惊人的能量,企业通过获取有效的用户数据,可以高效锁定用户...

2747
来自专栏机器学习算法与Python学习

为什么程序员一定要学深度学习

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 对于深度学习,我也是一个初学者,能力...

3254
来自专栏人工智能头条

来自Google的经验:以用户为中心的机器学习七大技巧

762
来自专栏数据科学与人工智能

机器学习实践指南:理解、差异化和应用

作者:Rob Thomas 和 Jean-François Puget 机器学习由Arthur Samuel在1959年首次定义,即“学习领域,使计算机能够在没...

2534
来自专栏企鹅号快讯

金融机构利用人工智能反欺诈的利器:设备指纹技术的前世今生 下

01 设备指纹的核心技术 设备指纹技术是一个综合性的系统工程,掌握这门技术需要跨越一系列的技术门槛,这也是为什么虽然应用场景广阔,至今市场上此项技术提供者并不多...

2977
来自专栏CreateAMind

狂扫谷歌tesla的开源自动驾驶!

741
来自专栏大数据挖掘DT机器学习

订单贡献率10%,京东个性化推荐系统持续优化的奥秘

京东基于大数据和个性化推荐算法,实现了向不同用户展示不同的内容的效果,在PC端和移动端都已经为京东贡献了10%的订单。为了探索京东全品类平台“千人千面”背后的算...

3326
来自专栏人工智能头条

猜你喜欢-----推荐系统原理介绍

1762
来自专栏大数据挖掘DT机器学习

微博中的用户画像:微博中的用户模型

作者:@fengyoung 于2015小光棍节 原文:http://www.wbrecom.com/?p=588 社交媒体(Social Media)相对于传统...

3459

扫码关注云+社区