前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于R-Net、QA-Net和BiDAF实现中文观点型问题机器阅读理解

基于R-Net、QA-Net和BiDAF实现中文观点型问题机器阅读理解

作者头像
机器学习AI算法工程
发布2019-10-29 10:01:58
8620
发布2019-10-29 10:01:58
举报
机器阅读理解是指让计算机阅读文本,随后让计算机解答与文中信息相关的问题。本次竞赛将重点针对阅读理解中较为复杂的,需要利用整篇文章中多个句子的信息进行综合才能得到正确答案的观点型问题。

获取项目代码

关注微信公众号 datayx 然后回复 阅读理解 即可获取。

数据说明

每条数据为<问题,篇章,候选答案> 三元组组成

每个问题对应一个篇章(500字以内),以及包含正确答案的三个候选答案

问题:真实用户自然语言问题,从搜索日志中随机选取并由机器初判后人工筛选

篇章:与问题对应的文本段,从问题相关的网页中人工选取

候选答案:人工生成的答案,提供若干(三个)选项,并标注正确答案

数据以JSON格式表示如下样例:

https://challenger.ai/competition/oqmrc2018

模型结构

最好成绩的单模型我们选择加入alternatives语义和feature engineering的方式,基于R-Net改进。

alternatives语义:由于观点型问题的某些备选答案是携带语义信息的,所以我们将备选答案也做encoding处理。

feature engneering:特征工程,我们使用了tf-idf等方法,将提取的特征向量作为深度模型的另一个输入,只用Linear层进行处理。由于阅读理解任务数据的特性,特征工程这部分工作只有微弱提升。


访问AI图谱 技术分享社区

https://loveai.tech


baseline模型借鉴了微软R-Net模型,与R-Net模型不同的是,我们取消了模型尾部的ptrNet结构,取而代之的是一个单向GRU与softmax层。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-03-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习AI算法工程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档