前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >句法分析(syntactic parsing)在NLP领域的应用是怎样的?

句法分析(syntactic parsing)在NLP领域的应用是怎样的?

作者头像
zenRRan
发布2019-05-13 17:53:47
1.4K0
发布2019-05-13 17:53:47
举报

来自 机器学习算法与自然语言处理

作者 jiangfeng

文章整理自郭江师兄问题回答(被收录于知乎编辑推荐)!已取得师兄授权!

原问题如下:

opinion extraction system,information retrieval system是如何通过syntactic parsing实现的?

解答如下:

这里面有两个问题:1. 在opinion extraction/IR中如何使用句法分析;

2. 句法分析在多大程度上对这两个任务有帮助(原题)。

由于我自己主要还是做句法分析本身,暂时很少做上层应用,所以简单谈谈我对应用的理解,抛砖引玉。

1

在opinion extraction/IR中如何使用句法分析。

举几个例子吧。 比如在opinion extraction中我们常常要抽取评价对象(aspect): 例:“知乎的内容质量很好”

这里 “很好” 形容的是 “内容质量”。通过依存句法分析,就可以抽取出对应的搭配。如下图:

(顺手插个广告,分析结果来自我们实验室的语言云:在线演示 | 语言云(语言技术平台云 LTP-Cloud))

再说说IR,以百度框计算为例。对于以下两个query: Query 1: 谢霆锋的儿子是谁? Query 2: 谢霆锋是谁的儿子? 这两个Query的bag-of-words完全一致,如果不考虑其语法结构,很难直接给用户返回正确的结果。

类似的例子还有很多。在这种情况下,通过句法分析,我们就能够知道用户询问的真正对象是什么。

推而广之,对Query进行更general的需求分析大都离不开描述对象的提取,很多时候句法结构非常关键,更是下一步语义分析的前提。

2

句法分析在多大程度上对这两个任务有帮助(原题)。

原问题很好,可以扩展出很多思考。在炼丹纪到来之前,也许我们可以给一个非常乐观的回答,比如60%。但是现如今,我们需要思虑再三。主要原因在于,RNN/LSTM等强大的时序模型(sequential modeling)能够在一定程度上刻画句子的隐含语法结构。

尽管我们暂时无法提供一个清晰的解释,但是它在很多任务上的确表现出非常promising的性能。

推荐一下车万翔老师前段时间写的一个简单的survey:哈工大车万翔:自然语言处理中的深度学习模型是否依赖于树结构?(google一下就有)

文中的一个性能对比能够说明问题:Tree-LSTM是基于句法结构之上的LSTM,Bi-LSTM则是简单的双向(left<->right)LSTM。

在很多任务上,Bi-LSTM都表现得比Tree-LSTM更好。

但是,这并不说明句法结构是没有用的,详细分析请参考上面提到的survey。

需要提及的是,句法分析目前的性能是防碍其实际应用的一个关键因素,尤其是在open-domain上。 目前在英文WSJ上的parsing性能最高能够做到94%,但是一旦跨领域,性能甚至跌到80%以下,是达不到实际应用标准的。而中文上parsing性能则更低。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-04-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深度学习自然语言处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档