前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Text Matching as Image Recognition

Text Matching as Image Recognition

作者头像
小爷毛毛_卓寿杰
发布2019-06-11 11:26:14
9600
发布2019-06-11 11:26:14
举报
文章被收录于专栏:Soul Joy HubSoul Joy Hub

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sinat_33741547/article/details/80649542

一、概述

MatchPyramid来自Liang Pang等在2016发表的一篇文章Text Matching as Image Recognition,大意为利用图像识别的方式进行文本匹配。

二、思路

对于文本匹配,基本思路如下述公式:

这里写图片描述
这里写图片描述

其中T为文本,函数θθθ代表将文本转换为对应的表示,函数FFF则代表两个文本表示之间的交互关系。 由侧重点不同可分为表示方法与交互方法,即注重θθθ或者FFF,而MatchPyramid应属于后一种。

1、基本方法

构建文本与文本的相似度矩阵,采用CNN对矩阵进行特征抽取,最后用softmax获得分类概率,评价方法为交叉熵,如下:

这里写图片描述
这里写图片描述

2、流程

(1)相似度矩阵

由于CNN针对的是网格型数据,而文本显然属于序列数据,那么就有必要对数据进行转换,论文中提出了三种构建相似度矩阵的方法:

这里写图片描述
这里写图片描述

0-1类型,每个序列对应的词相同为1,不同为0

这里写图片描述
这里写图片描述

cosine距离,使用预训练的Glove将词转为向量,之后计算序列对应的词的cosine距离

这里写图片描述
这里写图片描述

点积,同上,但是将cosine距离改为点积 作者在文中提到,距离矩阵使用点积的效果相对较好。

(2)两层CNN

后续利用两层的CNN对相似度矩阵进行特征抽取,这里要注意的是由于上一层的相似度矩阵shape不一致,在第一层CNN后面进行maxpool的时候,要使用动态pool,有没有其他的小trick就不可得知了。

(3)两层MLP

最后用两层的全连接对CNN的结果进行转换,使用softmax函数得到最终分类概率。

三、其他

作者使用论文中的模型,在kaggle的quora数据集中得到一个相当不错的分数,最终小组成绩达到了第四名。 附实现地址:https://github.com/faneshion/MatchZoo

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年06月11日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、概述
  • 二、思路
    • 1、基本方法
      • 2、流程
        • (1)相似度矩阵
        • (2)两层CNN
        • (3)两层MLP
    • 三、其他
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档