前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >谷歌全新机器学习架构,轻松改变句子的情绪,复杂性和时态

谷歌全新机器学习架构,轻松改变句子的情绪,复杂性和时态

作者头像
AiTechYun
发布2018-12-24 15:33:25
4540
发布2018-12-24 15:33:25
举报
文章被收录于专栏:ATYUN订阅号ATYUN订阅号

编译:chux

出品:ATYUN订阅号

密歇根大学和谷歌大脑的数据科学家在NeurIPS 2018会议上提交了论文“Content preserving text generation with attribute controls”,描述了一种机器学习架构,它不仅能够生成给定样本的句子,还能在保留其原意的同时,改变原始文本的情绪,复杂性,时态甚至声音。

这种技术可能在未来会用于复述,机器翻译和会话系统。它可以作为11月微软研究所展示的系统的补充,后者利用复杂的自然语言处理技术推理弱结构化文本中的关系。

研究人员表示,“在这项工作中,我们解决了修改句子文本属性的问题,据我们所知,我们演示了第一个如何在没有并行数据的情况下,学习修改给定句子的多个文本属性的实例。”

改变句子的情绪

该团队首先解决了情绪控制问题。他们采用了餐馆评论数据集(Yelp评论数据集的过滤版本),以及大量的IMDB电影评论,分别为447,000和300,000个句子,用于训练系统。

在训练之后,研究人员分别使用128,000个餐厅评论和36,000个电影评论的测试数据集,尝试从具有负面情绪的句子中生成具有正面情绪的文本片段,以及生成从负面到正面的片段。

之后,利用机器翻译文本的标准指标——双语评估替代(BLEU)来进行评估,它的性能优于两种最先进的文本生成方法。而且,它始终能生成与输入句子相关且语法正确的句子,以至于Amazon’s Mechanical Turk上的研究参与者认为它比之前的方法的输出更真实。

生成的句子相当连贯。例如,“柜台后面的人不友好”变成了“柜台上的人非常友好热心。”反例:“这是这部电影另一个有趣的地方”到“这部电影没有可取之处。”

更令人印象深刻的是,另一项测试中的研究人员使用该系统同时控制句子的多种属性,包括情绪,时态,声音和观点。在对多伦多BookCorpus数据集的200万个文本片段的数据集进行训练之后,该模型能够将未来时态中的指示性情绪,如“John将无法在营地里生存”中转化为条件时态中的虚拟语气“John不能住在营地里”。

AI系统可以同时调整多个属性

研究人员表示,“我们证明了模型通过各种实验和指标有效地反映了条件信息,虽然以前的研究主要围绕控制单个属性并在两种样式之间进行转换,但模型很容易扩展到多属性场景。未来我们可能会在此框架中考虑具有连续值的属性,以及更多的语义和句法属性集。”

论文:papers.nips.cc/paper/7757-content-preserving-text-generation-with-attribute-controls.pdf

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-12-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ATYUN订阅号 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
机器翻译
机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档