前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Multi-Task Networks With Universe, Group, and Task Feature Learning-阅读笔记

Multi-Task Networks With Universe, Group, and Task Feature Learning-阅读笔记

作者头像
百川AI
发布2021-10-19 17:03:02
2930
发布2021-10-19 17:03:02
举报
文章被收录于专栏:我还不懂对话我还不懂对话

Multi-Task Networks With Universe, Group, and Task Feature Learning

文章将任务区分为三个层次:

  1. 单个任务。
  2. 任务组(task group)
  3. 全体任务(task universe)

提出一些类MTL框架,包含并行网络结构、串行网络结构,在 ATIS, Snips和一个自有大数据集上表现良好。

Parallel MTL Architecture

Group features、Universe features、Task features并行生成。

在这里插入图片描述
在这里插入图片描述
  • 不同的任务 a, b, c 都会被输入到 Universe Encoder 中,生成 Universe features
  • 同一 group 的任务(x1a, x1b 是一个 group,x2c 是另一个),会送到 Group Encoder 中,生成 Group features;
  • 每个任务都会被输入到 Task Encoder 中,生成 Task features;
  • 每个 Task features 会和 Universe features,Group features 连接,作为 Task Decoder 的输入,得到最后的结果。在这个模型中,三类 feature 是并行生成的。

Serial MTL Architecture

Group features、Universe features、Task features三类特征会又先后顺序生成。

在这里插入图片描述
在这里插入图片描述
  • Serial: Group features 和 Universe features 并行生成,拼接后输入到 Task encoder 去生成 Task features;
  • Serial + Highway:和 a 一样,但是在 Decoder 时,会把 Task features 和前面的 Group features,Universe features 进行拼接;
  • Serial + Highway + Swap:先生成 Task features,然后再生成 Group features 和 Universe features,再和 Task features 进行拼接。

Loss

作者加入对抗损失(adversarial loss)和正交限制(orthogonality constraints),来避免 Task Features 在共享空间中: L all  = L tasks  + λ ∗ L adv  + γ ∗ L ortho  \mathcal{L}_{\text {all }}=\mathcal{L}_{\text {tasks }}+\lambda * \mathcal{L}_{\text {adv }}+\gamma * \mathcal{L}_{\text {ortho }} Lall ​=Ltasks ​+λ∗Ladv ​+γ∗Lortho ​ 具体见: 1.Domain Separation Networks 2.Adversarial multi-task learning for text classification

任务主要包含:ner、intent classification.

ner使用BiLSTM+crf

在这里插入图片描述
在这里插入图片描述

L t a s k = w S F ∗ L S F + w I C ∗ L I C \mathcal{L}_{\mathrm{task}}=w_{\mathrm{SF}} * \mathcal{L}_{\mathrm{SF}}+w_{\mathrm{IC}} * \mathcal{L}_{\mathrm{IC}} Ltask​=wSF​∗LSF​+wIC​∗LIC​

reference

  1. Multi-Task Networks With Universe, Group, and Task Feature Learning
  2. Domain Separation Networks
  3. Adversarial multi-task learning for text classification
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-08-27 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Parallel MTL Architecture
  • Serial MTL Architecture
  • Loss
  • reference
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档