首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >李磊:智能写作前沿技术与应用

李磊:智能写作前沿技术与应用

作者头像
马上科普尚尚
发布2020-05-13 17:05:10
1.2K0
发布2020-05-13 17:05:10
举报

报告导读

本次报告主要介绍智能写作前沿技术和应用,从内容创作、智能辅助写作助手、机器翻译等方面展开,介绍了智能写作在写稿机器人、赛事解说、智能广告文案、社会公益、经济扶贫等具体场景中的应用案例,对智能写作目前研究上的主要进展和面临的挑战进行了总结概括。

专家介绍

李磊博士,字节跳动人工智能实验室总监、资深科学家,原百度美国深度学习实验室少帅科学家。在机器学习、数据挖掘和自然语言理解领域于国际顶级学术会议发表论文40余篇,拥有三项美国技术发明专利。多次担任国际顶级学术会议的联合主席及程序委员等。主要从事机器学习、数据挖掘和自然语言理解领域的研究。

报告内容

为什么做智能写作呢?先看看每个人每天花多少时间在写文字上。比如写一篇文章、写Email。曾经有个笑话说,一个博士生、研究生回老板的eMail,平均每封要花一天半的时间,花很长时间构思,所以写作非常重要。写作当中的核心算法问题是什么呢?就是通过算法生成文本,使得这些文本像人写出来的文字,必须是自然的文字。另外一点,它需要满足一定的条件,比如要表达一定的意思或者某些关键词必须出现在里面,或者某些知识点必须出现在里面,我后面会介绍如何用技术实现这两点。

我们看一下写作技术为什么重要?有几个方面的应用:第一是内容的创作,比如自动写新闻,自动编辑文档,生成故事、小说、对话等。第二点是智能辅助写作助手,它可以帮助人去写作,你写前两个字,会把后面一句话补全。另外还有机器翻译,因为它们跟写作技术用的是同一个技术。机器翻译在跨语言的文化交流里面,是非常重要的技术。

对研究员来说,这是我们非常想去实现的一点,未来某一天,研究者、学生,只需要跑一下实验,这个实验报告或者论文可以让算法自动生成,当然现在还没有实现。但是现在已经实现了什么呢?在媒体当中,已经出现了一系列写稿机器人,比如腾讯的Dreamwriter,新华社的“快笔小新”,字节跳动设计的“小明”机器人,都有对应的写稿机器人可以写不同题材的文章。

这是“小明”写稿机器人写出来的文章,在去年世界杯的时候写的足球比赛,当然它不仅可以写中文,可以支持6个语种,支持17个比赛。当然不光是体育比赛,它还可以写其它题材,像财经类的,还有其它的稿件。这是一个demo的例子,如何利用视觉信息、多模态的信息,利用数据自动写出一个赛事的报道,这个算法会得到比赛的数据、球员的信息、布阵的信息,重要的关键点,像红黄牌等,根据这些重要的信息生成稿件。

我们做得最近的一个工作,不光要写这个比赛报道,还要解说,解说更难,我们这里做的是斯诺克的解说,也是用计算机视觉的技术识别球台、球形和球的走位。不光做解说,还要做预测,要告诉观众说这个球员下一杆会击打哪个球,利用大数据和机器学习预测球员下一杆击球的策略,根据这些生成对应的解说文字。

当然了,我们还可以把同样的技术运用到更有商业价值的文稿生成,像算法生成广告文案,通过文本理解到底卖什么商品,它的特点是什么,根据这些生成广告文案帮助中小企业设计更好的广告。智能文案生成的技术,同样可以是改进搜索体验,在搜索框里面,用户还没有搜索的时候就可以猜它可能搜索什么样的query(查询),把这些query自动生成出来。当然了,我们的生成技术不光可以用来做商业化的生成,还可以做社会公益方面的生成。比如头条有个公益项目是“头条寻人”,寻找走失的人口,在走失人口的附近对所有头条用户发送一条推送消息,这条消息通过算法自动生成,通过这样的方式可以很快地找到走失的人口。通过这个算法,过去三年已经找到超过一万名走失人口。当然,还可以通过写稿技术帮助经济欠发达地区经济扶贫,帮助他们把农产品和特点通过头条和抖音平台卖出去。需要对他们的农产品做一些描述,这些描述的文章可以通过生成算法来自动生成。

但这些问题的背后有很多技术的挑战,过去几年在学术界,也是做了非常多的工作。包括像贝叶斯的方法,如何做文本的生成。文本表示的方法,如何把语义和语法脱离开来,更好地文本表示,最后做文本生成。如何用对抗的方法做文本生成,以及更好的预训练做文本生成。

当然我们还有很多技术挑战,比如在高维空间里面如何做更好的生成。因为文本和图像不一样,图像是连续的,文本是离散的,而且是比较长的离散空间,在这里面直接搜索是非常困难的。如何做可控的文本生成,这个可控性是非常重要的,我希望这个生成的文本完全满足需求,如何跨模态的生成,有图片、语音,如何生成文字,以及长文本的创作当中,如何生成比较一致性的文字。最后我认为最难的问题是创造性的生成,原先没有的,像诗歌、小说,要给它做一些创造性的方案出来,这个是非常困难的。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-11-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能前沿讲习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
机器翻译
机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档