前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >IBC 2023 | 通过机器学习改善广播观众体验

IBC 2023 | 通过机器学习改善广播观众体验

作者头像
用户1324186
发布2024-03-20 14:28:39
1300
发布2024-03-20 14:28:39
举报
文章被收录于专栏:媒矿工厂

论文题目:Improving the Broadcast Viewer Experience through Rapid and Early Elephant Flow Detection by Machine Learning 作者:University of Surrey, UK 来源:IBC 2023 论文链接:https://www.ibc.org/technical-papers/ibc2023-tech-papers-improving-the-broadcast-viewer-experience-through-rapid-and-early-elephant-flow-detection-by-machine-learning/10261.article 内容整理:王柯喻

引言

保持低的广播网络延迟对于维持沉浸式观看体验至关重要,特别是在要求互联网或广播中心提供高质量媒体广播时。而目前存在的问题是重量级广播媒体流需要高传输数据速率与长时间寿命,其对资源与网络的占用会与传输短数据流产生冲突,导致交换机缓冲区过载或网络拥塞,从而出现丢包和由于重传超时导致的延迟(TCP-RTOs)。在广播中心中,媒体流通常属于大象流(elephant flows,EF)分类,短数据流被分类为老鼠流(mice flows,MF)。EF的快速性和提前检测功能使得SDN控制器可以对其重新规划路由并减少它们对广播 IP 网络内的 MF 的影响。这减少了数据包丢失,使得TCP-RTO不会被触发,从而可以保持较低的延迟并有良好的观看体验。

概述

本文即提出了一种新方法能在 500 ms内检测广播网络中 SDN 控制器的 EF,从而允许 SDN 控制器重新规划EF并减少丢包。这种方法使用集成的 LSTM 神经网络的机器学习,其中每个 LSTM 具有不同的大小,因此集成网络可以捕获不同大小流量的非线性特征。然后集成的 LSTM 输出通过连接层并由神经网络进一步处理。通过反向传播训练网络,然后每个 LSTM可以得到针对广播 IP 网络更准确的EF推理。该方法在行业标准数据集上进行了测试,并在500 ms内实现了 EF 检测,而无需依赖于网络交换机提供的统计信息,进一步减少了延迟并改善了沉浸式观看体验。

相关工作

Chao [1]使用了一种基于Hoeffding Tree [2]的称为Stream Mining的机器学习方法。这使用标记的CAIDA数据集对连续数据流进行操作。其分类标准为所有大于5000 ms且平均数据速率大于50 MB/s的TCP流分类为大象流。本文通过将其结果与Chao进行比较来展示EF检测的效果,实验发现集成LSTM的检测准确度与Chao相同,但时间只有一半。这对于SDN网络很重要,因为控制器的响应时间显著改善,从而长TCP的大象流可以更快地重新路由。

系统设计

图1 系统总述

本文提出了一个数据驱动的架构:一个由 LSTM 层组成的神经网络,可以识别已处理的TCP序列数据中的模式来分类EF,如图1所示。本文将 TCP 数据流标记为一组离散的bin,这个量化 TCP 数据的向量经过 LSTM 层的集合来训练时间预测模型。LSTM 可以在定义的时间窗口内学习有关时间输入数据的信息,并行使用多个LSTM允许对多种长度的TCP数据序列进行分析。这捕获了关于 TCP 数据包的短期和长期时间信息。集合流的结果然后通过另一个多层 MLP 和 softmax 连接,以将向量转换为双热向量,然后将其分类为 MF 或 EF。

输入数据处理(数据包令牌化)

初始阶段是将原始数据处理成已定义的TCP流。从原始网络数据中提取IP包。然后,将包解码成TCP流,成为具有以下定义的规范的元组- [ip src,ip dst,port src,port dst],其中 ip src 是 IP 分组源地址,ip dst 是 IP 分组目的地地址,port src 是 TCP 端口源地址,port dst 是 TCP 端口目的地地址。

每个流都是唯一的,并且具有开始和结束序列。为了使数据令牌化,与每个流相关联的IP包中的字节数被聚合到大小固定的 bin(x)中,每个 bin 包含 10 ms 内的数据。bin 中包含记录中被标识的TCP流的累积数据。每一个 bin 按 10 ms 的间隔为流提供平均的数据速率。因此,对于给定的总序列长度为n的TCP流 X ,其包含 n 个 bins 即

X= \{x ^{0},x^{1},x^{2},...,x^{n−1}\}

。然后,TCP流X的提取信息集合可以由

X = \{X^{(0)},X^{(1)},.,X^{(n−1)}\}

表示。这种将原始数据标记为离散bin的方法可以通过多个LSTM层进行时间序列预测,以了解EF和MF之间的关系。

令牌化进一步改进了 EF 检测,因为数据包的时间元素隐含在每个 bin 内,并且保持了测量的鲁棒性。与收集详细信息并向 SDN 控制器传送(例如时间戳)相比,整理数据所需的路由资源量很小。此外,还减少了用于将聚合的 bin 传送到 SDN 控制器所需的网络流量。

LSTM层的优势

考虑到令牌化数据中表示的 TCP 数据包信息的时间性质,LSTM 层需要学习和识别流之间的丰富时间模式以分类EF和MF。与标准递归神经网络相比,长短期记忆(LSTM)层在许多任务中利用其在时间相关性上的优点发挥了出色的作用。LSTM 层可以长时间存储和访问信息,同时通过专门的门控机制减轻了RNN中常见的梯度消失问题。

给定在时间 t 输入向量

J^{i}(t)

由转换成 bins 的数据包和所得的输出联合向量

J^{0}(t)

组成。目的是学习使输入向量和输出向量之间的损失最小的函数

J^{o} = o_{t} \circ tanh(c_{t})

(其中

\circ

表示 Hadamard 乘积),

o_t

是输出门,

c_t

是存储器单元。前一个记忆单元

c_{t-1}

乘以遗忘门的组合。因此,它结合了先前的记忆和新的输入。例如,可以完全忽略旧的存储器(遗忘门全为0)或完全忽略新状态(输入门全0),但实际上,它介于这之间。

LSTM层的输入序列

为了建立数据包之间的关系,从而尽可能在短时内检测到EF,将每个时间 bin 作为时间序列的一部分,再将该时间序列输入到 LSTM 层。这些序列长度与检测EF所花费的时间直接相关,并且在长度上变化以实现广泛的检测颗粒度。由五个10 ms时间 bins 组成的短序列来检测短期TCP流活动,这个短TCP流很可能是MF,因此将从最终分类中将其筛出。然而,同样有可能的是特定的EF会在前 50 ms 内快速爆发,模型将训练和检测这些EF。模型最大序列长度为50,代表500ms(10ms · 50)。通过选择不同的序列长度,可以更好地检测表示 EF 数据速率和时间特性的数据模式。

LSTM层的应用

图2 LSTM集合的应用

LSTM特别适合于确定序列中的模式。然而它采样的序列窗口的大小是固定的,这使得它只能学习具有特定序列长度的模式。因此,为了在一系列窗口序列大小上进行扩展和建模,本文使用具有不同序列大小的多个LSTM,并将其输出联合收割机组合起来,以创建短期和长期时间模型。图2展示了所提出的架构,其中有一组并行LSTM层,每个 LSTM 都有唯一的序列或窗口长度,输出是固定大小的,并通过 MLP 层连接,这反过来又提供了输出检测的能力。

通过改变每个LSTM的序列长度和超参数(如学习率和隐藏层大小),模型可以通过学习超参数来在一系列窗口大小范围内进行建模,从而提高EF的检测精度。

应用实例

图 3 广播应用实例

广播实例解决方案如图3所示,显示了REMI类型的配置。视觉工程师驻留在演播室中,并控制位于 OB 的远程摄像机的阴影和光圈功能,摄像机操作员驻留在OB中以平移、倾斜、聚焦和缩放摄像机。如果视频和控制数据通过相同的网络路由,则即使CDN被占用,时间敏感的OCP控制数据也很有可能由于CDN中视频和音频流(EF)的主导而被延迟并且经受变化的延迟,特别是当采用多个相机时。这将导致阴影和光圈控制功能受到损害,因为视觉工程师将无法对光圈和色彩平衡进行合理调整,相机视频将间歇性地出现过度曝光和曝光不足,以及色彩不足的过度校正,从而导致不良的观看体验。通过自动检测长EF(视频和音频)并通过CDN路由它们,OCP数据和其他时间敏感数据可以通过单独的CDN路由,从而为视觉工程师提高 OCP 控制的准确性,依次产生准确曝光和颜色校正的高质量图像,进而改善的观看体验。

实验

数据集预处理

本文使用标准的 CAIDA 数据集,在预处理期间,可以准确检测 EF 和 MF,以提供详细的训练和测试数据集,其中 EF 按照 Chao 的方法定义。该数据集由 300,908 个MF和 33,434 个 EF 组成,MF 数量与EF的比例为 90:10。同时MF与EF的数据速率为31:69,表明69%的数据来自EF,占TCP流数量的10%。为了降低训练过程中过度拟合的风险,数据集以50:50的MF与EF比率进行平衡。MF 的随机子样本用于匹配EF的数量,并提供33,434个 MF,数据集中共有 66,868 个流。

定义的指标

本文使用几个标准指标来评估我们提出的方法的性能,精确度,召回率,F-measure,MCC 和平均绝对百分比误差。F-measure 是分类精度的度量。平均绝对百分比误差(MAPE)是衡量预测系统准确性的指标,并以百分比的形式衡量准确性。马修斯相关系数(MCC)考虑混淆矩阵的二进制分类中的所有四个度量(真阳性、真阴性、假阳性和假阴性),以提供范围为+1和-1的值。值+1表示100%相关, -1表示100%不相关。

实验结果

表1 实验结果

表1显示了本文所提出的集成方法 LSTM-4 与使用来自CAIDA数据集的TCP流的前 500 ms 预测 EF 和 MF 的基线方法的比较。表1显示Chao 的方法提供了与本文提出的方法具有最接近的性能。相比之下,其他人的表现较差,在500 ms内提供的数据量有限。

参考文献

[1] Chao and Lin, “Flow Classification for Software-Defined Data Centres Using Stream Mining”, 2019 Transactions on Services Computing [2] Internet Measurement Conference Kumar,ArvindandKaur,ParminderandSharma, Pratibha,“Asurveyon Hoeffding tree stream data classification algorithms”, 2015 CPUH-Res.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-03-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 媒矿工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 引言
  • 概述
  • 相关工作
  • 系统设计
    • 输入数据处理(数据包令牌化)
      • LSTM层的优势
        • LSTM层的输入序列
          • LSTM层的应用
          • 应用实例
          • 实验
            • 数据集预处理
              • 定义的指标
                • 实验结果
                • 参考文献
                相关产品与服务
                内容分发网络 CDN
                内容分发网络(Content Delivery Network,CDN)通过将站点内容发布至遍布全球的海量加速节点,使其用户可就近获取所需内容,避免因网络拥堵、跨运营商、跨地域、跨境等因素带来的网络不稳定、访问延迟高等问题,有效提升下载速度、降低响应时间,提供流畅的用户体验。
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档