前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >回望2017,基于深度学习的NLP研究大盘点

回望2017,基于深度学习的NLP研究大盘点

作者头像
企鹅号小编
发布2018-01-11 16:04:52
7370
发布2018-01-11 16:04:52
举报

AI 科技评论按:本文是一篇发布于 tryolabs 的文章,作者 Javier Couto 针对 2017 年基于深度学习的自然语言处理研究进行了大盘点。AI 科技评论根据原文进行了编译。

在过去的几年里,深度学习(DL)架构和算法在诸如图像识别和语音处理等领域取得了世人瞩目的进步。然而在最开始的时候,深度学习在自然语言处理(Natural Language Processing, NLP)领域的效果一般,但是现在已经被证实深度学习在自然语言处理领域依然能够发挥巨大的作用。并且在一些常见的自然语言处理任务中,基于深度学习的方法已经取得了最佳的结果。神经网络模型在诸如命名实体识别(Named entity recognition, NER)、词性标注(Part of speech tagging)和情感分析(Sentiment analysis)等任务中的表现已经超越了传统方法,另外在机器翻译上的进步也许是最明显的

在这篇文章中,我将细数 2017 年里基于深度学习技术的自然语言处理所取得的一些进步。另外由于实在是存在着太多的相关论文、框架和工具,所以我并不打算进行详尽的介绍。我只是想和大家分享一下今年产出的我所喜欢的工作,而且我认为 2017 年自然语言处理领域取得的成绩斐然。今年深度学习在自然语言处理领域研究中的应用不断扩大,并且在某些情况下取得了惊人的结果,所有这些迹象都在表明这一应用正方兴未艾。

一、从训练 word2vec 到使用预训练模型

词嵌入(Word embeddings)可以说是自然语言处理众多任务中与深度学习相关的且最广为人知的一项技术。该技术遵循 Harris ( 1954 ) 的分布假说(Distributional hypothesis),根据这个假说,那些具有相似含义的词汇通常出现在相似的语境中。关于词嵌入更详细的解释,我建议你去阅读这篇由Gabriel Mordecki 所写的文章(http://t.cn/RTHPMeI)。

分布词向量样例

诸如 word2vec ( Mikolov et al. , 2013) 和 GloVe ( Pennington et al. , 2014 ) 等算法已经成为该领域的先驱,虽然它们并不能算作深度学习(word2vec 中的神经网络很浅,而 GloVe 则实现了一个基于计数的方法),但是通过这些方法训练出来的模型却在许多的基于深度学习的自然语言处理算法中被作为输入数据而使用。总之,在自然语言处理领域使用词嵌入已经几乎成了行业准则,并且确实带来了很好的实践效果。

一开始,对于一个需要词嵌入的特定自然语言处理问题,我们倾向于从一个领域相关的大型语料库中训练自己的模型。当然,这样使用词嵌入还不够平民化,因此慢慢地便出现了预训练模型。这些模型经过维基百科、推特、谷歌新闻等数据的训练,可以让你轻松地将词嵌入整合到自己深度学习算法中。

今年证实了预训练词嵌入模型仍然是自然语言处理中的一个关键问题。比如说,来自 Facebook 人工智能研究实验室(Facebook AI Research, FAIR)的 fastText 发布了支持 294 种语言的预训练(词)向量,这对我们的社区而言是一项伟大的工作和贡献。除了支持大量的语言之外,fastText还使用了字符 n 元语法(n-grams)作为特征。这样使得 fastText 能够避免出现超出词汇量(Out of Vocabulary, OOV)的问题,因为即使是一个非常罕见的单词也可能与一些更为常见的词汇共享某些字符 n 元语法。从这个意义上来说,fastText 比 word2vec 和 GloVe 表现得更好,而且针对小型数据集而言,fastText 的表现更是超越了它们

虽然我们确实见证了这个领域所取得的进步,但是我们依然还有许多工作需要去完成。比如说,spaCy 是一个非常伟大的自然语言处理框架,它以原生的方式将词嵌入和深度学习模型集成到了命名实体识别和依赖分析(Dependency Parsing)等任务中,并且允许用户更新模型或者使用自定义模型。

依我拙见,将来将会出现许多针对某一特定领域的预训练模型(比如,生物学、文学、经济等),这些模型能够很方便地在自然语言处理框架上进行使用。而在我们的日常使用中,最容易实现也是最锦上添花的功能,可能就是支持对模型的微调(fine-tuning)。同时,适应性词嵌入(Adapting word embedding)方法也开始出现。

以下文章还有 5663 字,主要内容包括:

二、调整通用嵌入(Generic embeddings)模型适配特定用例

三、不可思议的副作用——情感分析

生成极性偏见(Polarity biased)的文本

四、Twitter 上的情感分析

情感评估(SemEval) 2017

BB_twtr 系统

五、一个令人兴奋的摘要生成系统

内部注意力策略

强化学习

优异的结果

六、迈向无监督学习机器翻译的第一步

七、专门的框架与工具

八、其它想法

本文来自企鹅号 - AI科技评论媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - AI科技评论媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档