专栏首页arxiv.org翻译专栏基于多任务分层学习的网络流量分析

基于多任务分层学习的网络流量分析

网络流量分类是重要网络应用的基础。以前在这一领域的研究在代表性数据集的可用性方面遇到了挑战,许多结果无法轻易复制。驱动的机器学习方法加剧了这一问题。为了解决这个问题,我们提供了(N et)2数据库三个开放的数据集,共包含近1.3M标记的流量,以及一个流量特征的全面列表,用于搜索社区1。我们关注网络流量分析的广泛方面,包括恶意软件检测和应用程序分类。随着我们继续发展这些数据,我们希望这些数据集能够成为人工智能驱动的、可重复的网络流量分析研究的共同基础。我们公开发布数据集,并引入多任务分层学习(MTHL)模型,在单个模型中执行所有任务。我们的研究结果表明,MTHL能够准确地执行多个任务与分层标记与大幅减少训练时间。

原文题目:Multi-Task Hierarchical Learning Based Network Traffic Analytics

原文:Classifying network traffic is the basis for important network applications. Prior research in this area has faced challenges on the availability of representative datasets, and many of the results cannot be readily reproduced. Such a problem is exacerbated by emerging data-driven machine learning based approaches. To address this issue, we present(N et)2databasewith three open datasets containing nearly 1.3M labeled flows in total, with a comprehensive list of flow features, for there search community1. We focus on broad aspects in network traffic analysis, including both malware detection and application classification. As we continue to grow them, we expect the datasets to serve as a common ground for AI driven, reproducible research on network flow analytics. We release the datasets publicly and also introduce a Multi-Task Hierarchical Learning (MTHL)model to perform all tasks in a single model. Our results show that MTHL is capable of accurately performing multiple tasks with hierarchical labeling with a dramatic reduction in training time.

原文链接:https://arxiv.org/abs/2106.03850

原文作者:Onur Barut, Yan Luo, Tong Zhang, Weigang Li, Peilong Li

我来说两句

0 条评论
登录 后参与评论

相关文章

  • TN-SCUI2020挑战赛——基于多任务的分割分类网络

    今天将分享甲状腺超声结节多任务的二值分割和二值分类的完整实现过程,为了方便大家学习理解整个流程,将整个流程步骤进行了整理,并给出详细的步骤结果。感兴趣的朋友赶紧...

    医学处理分析专家
  • 基于winpcap的以太网流量分析器(java)

    IDE:eclipse -neon JDK:1.8 OS:Win10-64bit

    于果
  • 用于VVC质量提升和超分辨率的多任务学习

    最新的视频编码标准被称为多功能视频编码(VVC),它包括编码链不同层次的几种新颖和完善的编码工具。这些工具与之前的标准--高效视频编码(HEVC)相比,带来了显...

    用户8436237
  • 【学习】网站数据分析:网站分析的基本度量

    ? 我们在使用各种网站分析工具的时候,会看到很多不同的度量指标,可能不同的工具会有不同的命名和定义,这里列举一些常见的度量,简单说明一下它们是如何计算得到的。...

    小莹莹
  • 基于多任务学习的异质信息网络推荐 | 论文解读(上)

    本文为 TKDE2020 的文章《Multi-task Learning for Recommendation over Heterogeneous Infor...

    Houye
  • KDD 2021:基于Seq2Seq多任务学习的路网轨迹恢复

    随着GPS设备的普及,大量基于轨迹数据的智能应用迅速发展,例如导航系统、出行时间估计、司机驾驶行为分析等。这些应用的准确性依赖于匹配至路网上的高采样率轨迹的采集...

    京东技术
  • 深度学习在药物发现领域的兴起

    过去的十年中,深度学习(DeepLearning,DL)在各种人工智能研究领域取得了显着的成功。从以前对人工神经网络的研究演变而来,该技术在诸如图像和语音识别,...

    DrugAI
  • 独家 | 一文读懂如何用深度学习实现网络安全

    本文简要介绍深度学习以及它支持的一些现有信息安全应用,并提出一个基于深度学习的TOR流量检测方案。

    数据派THU
  • SIGIR2021 | 基于特征交互学习的门控增强多任务神经网络用于CTR预测

    今天分享一篇百度公司发表在SIGIR 2021的点击率预估方面的Short Research Paper论文。

    张小磊
  • 普华永道全息图解机器学习

    几十年来,人工智能研究者的各个「部落」一直以来都在彼此争夺主导权。现在是这些部落联合起来的时候了吗?他们也可能不得不这样做,因为合作和算法融合是实现真正通用人工...

    SeanCheney
  • 三张图读懂机器学习:基本概念、五大流派与九种常见算法

    选自PwC 作者:Alan Morrison、Anand Rao 机器之心编译 参与:吴攀、晏奇 机器学习正在进步,我们似乎正在不断接近我们心中的人工智能目标。...

    机器之心
  • 基于 Flink 构建关联分析引擎的挑战和实践

    随着云计算、大数据等新一代IT技术在各行业的深入应用,政企机构IT规模和复杂程度不断提高,网络流量、日志等各类数据规模大幅提升。与此同时,网络攻防日益激烈,网络...

    zhisheng
  • Arxiv机器学习论文摘要10篇(2019-7-17)

    原文标题:Two-stage Optimization for Machine Learning Workflow

    Jarvis Cocker
  • 三张图读懂机器学习 :基本概念、五大流派与九种常见算法

    机器学习正在进步,我们似乎正在不断接近我们心中的人工智能目标。语音识别、图像检测、机器翻译、风格迁移等技术已经在我们的实际生活中开始得到了应用,但机器学习的发展...

    小莹莹
  • 综述卷积神经网络论文:从基础技术到研究前景

    过去几年来,计算机视觉研究主要集中在卷积神经网络(常简称为 ConvNet 或 CNN)上。这些工作已经在广泛的分类和回归任务上实现了新的当前最佳表现。相对而言...

    IT派
  • 94页论文综述卷积神经网络:从基础技术到研究前景

    选自arXiv 机器之心编译 参与:Panda 卷积神经网络(CNN)在计算机视觉领域已经取得了前所未有的巨大成功,但我们目前对其效果显著的原因还没有全面的理解...

    机器之心
  • 94页论文综述卷积神经网络:从基础技术到研究前景

    机器之心编译 参与:Panda 卷积神经网络(CNN)在计算机视觉领域已经取得了前所未有的巨大成功,但我们目前对其效果显著的原因还没有全面的理解。近日,约克大...

    朱晓霞
  • 【CNN】94页论文综述卷积神经网络:从基础技术到研究前景

    过去几年来,计算机视觉研究主要集中在卷积神经网络(常简称为 ConvNet 或 CNN)上。这些工作已经在广泛的分类和回归任务上实现了新的当前最佳表现。相对而言...

    zenRRan
  • 94页论文综述卷积神经网络:从基础技术到研究前景

    卷积神经网络(CNN)在计算机视觉领域已经取得了前所未有的巨大成功,但我们目前对其效果显著的原因还没有全面的理解。2018年3月,约克大学电气工程与计算机科学系...

    Datawhale

扫码关注云+社区

领取腾讯云代金券