前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >深度学习算法原理——TextCNN

深度学习算法原理——TextCNN

作者头像
felixzhao
发布2019-07-01 10:38:11
1.2K0
发布2019-07-01 10:38:11
举报
文章被收录于专栏:null的专栏null的专栏

论文地址:Convolutional Neural Networks for Sentence Classification

这篇文章是首次将CNN模型应用在文本分类中,在我的工作中,也是经常需要使用到TextCNN这样的文本分类方法。

1. TextCNN的网络结构

在这里插入图片描述
在这里插入图片描述

TextCNN的模型结构中主要包含如下的几个部分:

  • Embedding层:将词映射成对应的向量。以上图为例,7个词被影射到对应的kkk维向量中,构成7×k7\times k7×k的矩阵;
  • Convolutional层:对词映射后的特征做卷积操作,注意,这里的卷积是一维卷积;
  • Pooling层:对卷积后的结果做pooling操作;
  • 全连接层:最后接一层全连接的 softmax 层,输出每个类别的概率。

对此过程,有一张更具体的图,如下所示:

在这里插入图片描述
在这里插入图片描述

2. 词向量的一维卷积

对于上述的7×57\times 57×5的向量,设计666个卷积核,从上到下大小分别为:4×54\times 54×5,4×54\times 54×5,3×53\times 53×5,3×53\times 53×5,2×52\times 52×5和2×52\times 52×5。

3. 词映射成向量

在文中也介绍到词映射成向量,有两种方式:

  • 动态:指利用随机初始化的方法,词的向量也参与到模型的训练过程中;
  • 静态:事先利用word2vec等词向量训练方法,得到固定的词向量,在使用的时候通过查表的方式取得,不参与模型的训练。
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019年06月29日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. TextCNN的网络结构
  • 2. 词向量的一维卷积
  • 3. 词映射成向量
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档