RobustDistant Supervision Relation Extraction via
Deep ReinforcementLearning
秦鹏达,徐蔚然,WilliamYang Wang
北京邮电大学,加州大学圣芭芭拉分校
论文连接:
https://arxiv.org/abs/1805.09927
关系抽取系统致力于将无结构文本信息转化为结构化的三元组信息。近几年,基于深度学习的关系抽取系统进一步推进了关系抽取的表现,但是也暴露了其过分依赖于标注文本数量的问题。人工标注成本昂贵,而且无法满足现实世界中各方各面的需要。为了解决这个问题,目前很多研究工作采用距离监督/弱监督自动生成标注数据。从当前的表现来看,这种方法一定程度上缓解了这个问题,但同时也存在着缺点:噪声数据的干扰。目前流行的方法是,对于一对实体,构建End-to-End的深度学习框架,使网络学着找到一个最好的实例或者通过注意力机制赋予噪声数据较小的权重,来减小噪声的影响。但是我们觉得构建独立于关系抽取网络的噪声过滤器是更好的选择:在关系抽取系统的训练之前,通过这些噪声过滤器对远程监督得到的数据集进行降噪处理,然后利用过滤后的数据集进行训练。基于这个想法,我们采用深度增强学习方法生成对于特定关系的噪声过滤器。
我们构建了一种效果驱动的(performance-driven),基于策略(policy-based)的增强学习方法自动的从距离监督数据集中发现噪声数据。对于一种关系,我们构建一个噪声分类器,所以Agent的工作是:当识别出当前句子是噪声数据,就采取移除操作(Remove);否则采取保留操作(Retain)。当完成对于一种关系的所有实例的一系列操作之后,我们通过过滤后的实例集合在关系抽取任务上的效果计算Reward。随着越来越多的噪声数据被移除,剩下的实例就回具有越来越多的正样本(TruePositive),因此,此数据集在关系抽取任务上的表现也会更好。
在关系抽取系统训练之前,我们利用的噪声过滤器对远程监督得到的训练集进行降噪处理;然后利用该过滤后的数据集训练关系抽取系统,并在远程监督关系抽取数据集RiedelDataset (http://iesl.cs.umass.edu/riedel/ecml/)上验证了效果,同时给出了实例分析。
北邮模式识别实验室PRIS
微信号:pris_2018
领取专属 10元无门槛券
私享最新 技术干货