今日头条写新闻机器人获吴文俊人工智能科技发明奖

2017年12月23日,第七届吴文俊人工智能科学技术奖颁奖盛典在苏州举行。今日头条人工智能实验室凭借“互联网信息摘要与机器写稿关键技术及应用”项目荣获吴文俊人工智能技术发明奖。本年度获得该奖项的机构还包括清华大学、中科院以及北京航空航天大学等国内顶尖高校。

“吴文俊人工智能科学技术奖(以下简称‘吴文俊奖’)”被外界誉为“中国智能科学科技最高奖”,代表中国人工智能学界的重大突破与最高荣誉。今日头条是今年“吴文俊奖”获奖项目中唯一以企业载体获得专业类奖项的机构,打破了该奖历年只授予顶尖高校、重点实验室和科研机构的传统。

目前,该项成果已于去年以头条号xiaomingbot的形式在今日头条上线,至今已创作超过两万篇文章。机器写稿与信息摘要背后的核心技术是自然语言处理,同时会涉及机器学习、数据挖掘、深度学习、知识图谱等多项技术。自然语言处理是人工智能领域难度最大的课题之一。相对于语音和视觉来说,语言是高度抽象化的表现。一方面,人类语言具有复杂性,同一句话可能代表不同含义。另一方面,正确理解人类语言还要有足够的背景知识,比如对成语和歇后语的理解。这些都是自然语言理解进一步发展需要克服的难题。

此次今日头条与北京大学合作研发的“信息摘要与机器写稿关键技术”提出了多类型、跨领域、跨语言的写稿方法,在以下方面取得了较大突破:一是发明了多文档摘要自动提取方法;二是设计了一种全新的图注意力神经网络生成模型,实现文本新闻概括和摘要生成;三是发明了跨语言摘要方法,实现了英文文本新闻的中文摘要生成;四是通过融合体育领域知识进行智能语句筛选,可实现高质量长 篇新闻报道的实时生成。

基于相关成果,该项目发表国际顶级的ACM/IEEE Trans.期刊和CCF A类长文40篇,获得ACL2017杰出论文奖,申请发明专利22项。

今日头条自动写新闻机器人xiaomingbot2016年6月上线后,在里约奥运会期间创作200余篇赛事报道,累计获得200W用户阅读。其撰写速度与电视直播同步,文章内容涵盖比赛时间、实时比分、运动员信息等主要新闻要素,并且可以自动完成插图,可读性与职业记者相差无几。

奥运会后xiaomingbot还在持续撰写NBA、CBA、中超、意甲等体育赛事的文章,包括很多场冷门比赛,xiaomingbot也均有报道。根据今日头条统计,xiaomingbot文章的阅读率与人类创作者基本持平。

近期,xiaomingbot已完成最新一轮升级,除体育新闻,xiaomingbot撰写的文章现已涵盖科技、财经、房产等十几个分类,并可实现多领域每日热点新闻的自动创作。据记者了解,xiaomingbot已与光明网、《财经》杂志、大河报等主流媒体达成战略合作,向其进行优质内容输出。

今日头条人工智能实验室总监李磊博士表示,xiaomingbot的意义在于,一方面能够更大程度的满足长尾的资讯获取需求,另一方面,一些消息类报道使用机器人写作,能使记者从疲于奔命式的抢新闻中解脱出来,对事件背后的新闻线索进行深入挖掘和批判性地思考。

“我们做新闻机器人的目的并不是取代新闻记者,而是帮助记者创作出更高质量的内容。”李磊说,“未来今日头条人工智能实验室将会对对前沿技术进行研究,为信息的创作和分发提供更多支持,更好地实现人与信息的连接。”

本文来自企鹅号 - 中国西藏网媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

如何从初入行者进阶为人工智能先锋青年?

在 NIPS 2016 年公布的当年最佳论文奖里,《Value Iteration Networks》位列其中,这是加州大学伯克利分校华人学生吴翼参与的第一篇获...

3766
来自专栏机器之心

AI 社区有多排外?「外行人」观点引发争议

近日,蒙特利尔 Jewish General Hospital 的生物统计学家 Alexia Jolicoeur-Martineau 在社交网络中抱怨 AI 研...

1142
来自专栏机器之心

观点 | 千名学者抵制Nature机器学习子刊:付费期刊为何不是AI研究的未来

1614
来自专栏量子位

你(也)是吴恩达的学生么?

近日,美国教育媒体EdSurge一篇报道中指出,吴恩达(Andrew Ng)的斯坦福机器学习课自开课以来,6年多后的今天仍是学习平台Coursera上最受欢迎课...

862
来自专栏量子位

Google是否投资你,得看AI支持不支持

GV,全称Google Ventures,Alphabet旗下风险投资资金,2009年正式成立,是首批聘用工程师的VC机构,原先主要为了配合Google战略协同...

1343
来自专栏DT数据侠

20000条数据告诉你,如何正确观看“高逼格”百老汇音乐剧

美国百老汇,歌剧迷们的天堂,从《猫》到《歌剧魅影》再到《妈妈咪呀》,每一部经典作品都享誉世界。如果你想去纽约一睹百老汇的华美,就需要读一读这篇给旅行者的百老汇音...

1163
来自专栏专知

人工智能的算法黑箱与数据正义

【导读】许可:人工智能的算法依赖于大数据,而大数据并非中立。它们从真实社会中抽取,必然带有社会固有的不平等、排斥性和歧视的痕迹。 ? 一个月前,《终极算法》作者...

4096
来自专栏大数据文摘

机器人与关键技术解析

27611
来自专栏CDA数据分析师

如何用人工智能从新型数据中来寻找Alpha

作者 CDA 数据分析师 编者按 随着移动互联网,小型卫星普及等,资产管理公司,尤其对冲基金公司开始利用人工智能从新型数据中来寻找Alpha。 本期精编版嘉宾...

2709
来自专栏腾讯研究院的专栏

李德毅:大数据突破点在于聚类

2015年4月9日,第三届中国电子信息博览会在深圳召开。工业和信息化部电子信息司司长刁石京主持开展了新一代信息技术产业发展高峰论坛。中国工程院院士李德毅发表了...

2056

扫码关注云+社区

领取腾讯云代金券