前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >「自然语言处理(NLP)」自然语言生成(NLG)资料整理

「自然语言处理(NLP)」自然语言生成(NLG)资料整理

作者头像
ShuYini
发布2020-01-02 14:34:53
2.1K0
发布2020-01-02 14:34:53
举报

引言

自然语言生成(NLG)作为自然语言处理的一个子方向,主要目的是降低人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式。现在也受到广大研究学者的重视,今天ShuYini给大家整理了一下自然语言生成的相关资料供大家参考。

本文概要

1

什么是自然语言生成及学术研究介绍?

2

国内外知名大佬博客

3

干货学习资源

正文开始

1

什么是自然语言生成及学术研究介绍?

自然语言生成(NLG)是一种语言技术,其主要目的是构建能够“写”的软件系统的技术,即能够用汉语、英语等其他人类语言生成解释、摘要、叙述等。具体来说就是计算机的“编写语言”,它将结构化数据转换为文本,以人类语言表达。即能够根据一些关键信息及其在机器内部的表达形式,经过一个规划过程,来自动生成一段高质量的自然语言文本。NLG用于Email、手机短信,它可以为您自动创建答复;NLG用于图标说明时,可以根据公司数据自动生成图标说明。前段时间在一个有趣的用例中,美联社利用自然语言生成成功的从公司收益报表中生成了报告。这意味着他们不再需要人类消耗他们的时间和精力去解决这些问题。更重要的是,NLG一旦被完美设置就会自动生成数以千计的报告。

NLG学术界每年都会召开会议,公布NLG的最新发现。这些会议是由ACL SIGGEN组织的,你可以查看其web页面以获取关于即将举行的活动的信息。在这些活动中提交的论文可以通过ACL Anthology在线获得。NLG的商业兴趣日益增长,其中大部分集中在数据到文本,即结合NLG和数据分析的系统,以产生摘要,解释等结构化数据。

SIGGEN组织网址:https://aclweb.org/aclwiki/SIGGEN

ACL Anthology网址:https://www.aclweb.org/anthology/

2

国内知名大佬博客

Ehud Reiter

    Ehud Reiter是阿伯丁大学的计算机科学教授,同时也是Arria NLG的首席科学家,主要专注于自然语言生成(NLG)技术,即利用人工智能和自然语言处理技术,将非语言数据自动生成高质量文本和叙述文章。他的博客Ehud Reiter's Blog主要包括:NLG系统的搭建、NLG系统性能的评估、NLG的学术生活、NLG相关话题、个人生活等五个部分,该博客对NLG技术、评价与应用进行了深入的探讨与反思。其中有一篇文章我觉得写得特别不错‘How do I Learn about NLG?’,主要讲了自己学习NLG的一些方法及感悟,感兴趣的同学可以拜读一下。

Ehud Reiter博客地址:https://ehudreiter.com/blog-index/

万小军

万小军是北京大学王选计算机研究所研究员,主要研究领域有自然语言处理,文本挖掘,人工智能。他是语言计算与互联网挖掘研究室(从属北京大学王选计算机科学技术研究所)的负责人。该研究室以自然语言处理技术、数据挖掘技术与机器学习技术为基础,对互联网上多源异质的文本大数据进行智能分析与深度挖掘,为互联网搜索、舆情与情报分析、写稿与对话机器人等系统提供关键技术支撑,并从事计算机科学与人文社会科学的交叉科学研究。研究室当前研究内容包括:1)语义理解:研制全新的语义分析系统实现对人类语言(尤其是汉语)的深层语义理解;2)机器写作:综合利用自动文摘与自然语言生成等技术让机器写出高质量的各类稿件;3)情感计算:针对多语言互联网文本实现高精度情感、立场与幽默分析;4)其他:兴趣技术探索。

万小军博客地址:https://wanxiaojun.github.io/

3

干货学习资源

文本生成资源大列表

    文本生成资源大列表,该资源主要整理列举了2018年EMNLP的优秀文本生成模型及应用案例(主要以Paper的形式给出)。其中主要包括:模型(GAN based、VAE based、Autoencoder based、Reinforcement learning based、Alternative decode objective、Tool and others)、应用(基于文本的强化学习、基于GAN的对抗学习等)。

文本生成资源列表地址:https://github.com/ChenChengKuan/awesome-text-generation

文本生成必读的几篇论文

1、A Deep Ensemble Model with Slot Alignment for Sequence-to-Sequence Natural Language Generation.

论文地址:https://arxiv.org/pdf/1805.06553.pdf

2、SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient.

论文地址:https://arxiv.org/pdf/1609.05473.pdf

3、Generative Adversarial Text to Image Synthesis.

论文地址:https://arxiv.org/pdf/1605.05396.pdf

GitHub地址:https://github.com/yinizhilian/NLP_Share

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-12-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AINLPer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Ehud Reiter
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档