业界 | 机器人会写稿之后,腾讯还想让它实时整理出一份新闻简报

2015 年 9 月腾讯财经曾推出了一个名为“Dreamwriter”的自动化新闻写作机器人,一时间让广大媒体同行纷纷感叹要“失业”了。不过,写稿机器人受限于一些消息、快讯,也主要应用于体育、财经类报道中,并不能够完全取代编辑记者们的工作。据腾讯财经主编,也是内容机器人团队的负责人刘康回忆,当时需求非常强烈,推出 Dreamwriter 主要是想让新人能把更多精力放在更有创造力的事情上。

4 月 17 日下午,在一场媒体沟通会上,刘康总结了 Dreamwriter 此前所做的一些事情。从 2016 年奥运会期间的 3600 篇稿件,到腾讯体育 APP 上小梦战报的机器人稿件专栏,写稿机器人功劳可不小。

刘康认为,“机器写作从 0 到 1 大家都可以有,但从 1 到 2、到 3 要花费相当大的精力。”他表示“今天的数据量非常细,我们可以描述到每一个数据的颗粒还原。”

他举例此前奥运期间的一篇跳水的稿件。“因为跳水是一个评分制的比赛,比如说我现在是评委,大家在进行比赛,我要给每个动作打分,这些打分都是记录在数据库里的,比如走板、空中姿态、落水姿态、水花这些都是有详实的数据的,它会被录进数据库。然后我们再怎么写它呢?这些数据会被我们通过一定的算法和机器自己的识别,我们先让机器跑几十万篇的数据,跑一个规则出来,它会自己把这些数据重新还原。因为每一个分数都可以还原成一个动作,这样通过一定的算法把它还原成原先的场面。”

但是要做的很好,就非常难。刘康解释到,像财经和体育两个领域都难,但又不难。这是因为,财经本身有强烈的规则和算法模型,做简单的报道没有太多的技术含量,而难在对数据的解读、认知需要一套模型来判断它,甚至将来的预测。至于体育,关于球队比分可以从数据里抓取,但难在描述本身,“只有表示精彩才会看,如果不够精彩我会想去看视频。”

目前,写稿机器人主要针对的稿件领域为财经、体育、科技和新闻,其中新闻则偏向于社会类的、天气等。刘康还提供了一份机器人写稿的数据量。半年的稿件量是 30 万篇,稿件字数 600 万,运营事故 0 起。

针对运营事故,刘康表示他们有一个专门的安全管理平台:

机器自己写的时候会单独做一个算法和规则判断机器写的有没有问题;接着会经过人工安全审核;最后才会推送出来。

三个步骤中间衔接的时间越少,意味着出来的作品越准确越迅速。

现在,他们的三项技术已经拿到了国家专利,包括:智能撰文技术 Dreamwriter、内容抽取技术 Dreamreader、要闻萃取技术 Secretary。接下来,他们希望在不同的领域,不同的频道尝试。

除了回顾此前写稿机器人达到的成果外,这次沟通会刘康特别介绍了一款基于写稿机器人而孵化的新产品——Dreamreader(新闻超秘)。在刘康看来,现在一些资讯应用占据了人们日常的太多时间,有时候不知不觉已经在一款应用上耗费了一两个小时。而 Dreamreader 是想让大家“用完即走”,它可以成为人们的资讯秘书,通过智能算法,将每天的最重要的新闻筛选出来呈现给用户。

据介绍,Dreamreader 是基于 Dreamwriter 的机器写作技术和内容抽取技术而产生的。沟通会现场,AI科技评论试用了这款应用。目前该应用还是 1.0 版本,整个界面只有两个栏目,一个是精选新闻,一个是新闻详情。

同时,一些由 Dreamwriter 撰写的最新资讯会不时进行更新,而精选后的资讯则会用语音读给用户。未来,他们的目标是把它做成一个新闻 AI-个性化资讯生产和服务平台。刘康强调,对于这款产品,重要的是将每天那么多的资讯,按照用户的需求整理成简报,就像秘书一样。

不过,尽管在设计时,采用了“能解放双手”的语音交互方式,但语音朗读十分生硬,而且没有匹配的文字版本,毕竟我们听一段语音要比看一段文字花费的时间长的多。刘康称在之后的 1.5 版本会弱化语音本身,并增加文字版本。

现场AI科技评论所看到的 Dreamreader 所抓取的信息源全部由 Dreamwriter 撰写,至于未来会不会抓取其他信息源,刘康表示,“会抓取腾讯所有版权内容,内容源的使用是合法合规的。”从全网抓取信息整理成简报也是可行的,但是否会涉及到版权问题,这还需要考虑。他称从技术上来说并不难实现。

刘康现在还无法给出 Dreamreader 确定的上线时间,还想把它完善的更好。

虽说这次沟通会的主题是 Dreamreader,但当看到写稿机器人已经能完成大量的快讯后,当天在做的媒体也不禁问道,“腾讯什么时候会把写稿机器人开放给第三方使用?”

刘康透露,现在

“要把全品类兼容好,把像娱乐其他品类全部搞定,优化后可以使用了,然后我们才可以对外开放,不可能在一两个场景内单独开放。如果觉得某一个垂直领域不错,想用的话也可以探讨,因为单独开放之前是没有放在日程上。”

此刻AI科技评论编辑已经不怕机器人抢走“饭碗”了,反倒希望机器人能帮忙出快讯。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-04-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏信安之路

如果是你,你对信安之路会有哪些期望

昨天在 信安之路学习交流群 发了一个小调查,来了解大家对于文章的喜好以及对信安之路未来的期望,希望能够尽可能的满足小伙伴的期望,让信安之路走的更远,让更多的小伙...

1363
来自专栏数据科学与人工智能

【数据科学家】2015年最热门的职业:关于数据科学家的概念、职责、技能素养和学习资源完全手册

你是精通数学、擅长Python或者R并对某一特定行业有着深入理解的Geek么? 如果你的答案是Yes,不妨考虑一下21世纪最性感的职业——数据科学家。 领英最近...

22510
来自专栏华章科技

这里有一份清华大学数据科学学习资料,请注意查收!

在2016年和2017年的全美最佳岗位排行榜中,“数据科学家”一职位已经连续两年位列前茅;

2154
来自专栏腾讯研究院的专栏

社交网络斋戒实验报告

? 腾讯研究院S-Tech研究团队        报告下载:社交斋戒报告节选   1研究综述 1.1研究缘起 过去十余年,我们经历了一场传统社交的革...

2319
来自专栏PPV课数据科学社区

【行业应用】如果,这就是大数据……

中国什么时候才能有自己的《纸牌屋》?或许已经为时不远了。印象中,离互联网很远的娱乐圈,已经开始利用大数据进行各种尝试了。 前几天,黑豆碰到了老夏,他就正在做这样...

35313
来自专栏GopherCoder

Deep reading and Deliberate practiceDeep reading and Deliberate practice12

1795
来自专栏产品成长日志

我重新认识了“观点”

听罗胖的音频,感觉很精彩,但是仔细读了几遍文稿,却没有理清行文逻辑,文稿分了四个部分,(1)从辜鸿铭(保守主义)的故事引出了立场和偏好区别,(2)用陈独秀、胡适...

872
来自专栏大数据文摘

Science:2030年,或将改变生活的5项人工智能技术

1552
来自专栏灯塔大数据

成功数据科学企业家15本必读书—内含他们的成功秘籍!

简介 现在,每5个人里面就有1个人在谈论着他们的创业想法。他们当中有部分甚至曾经创立过自己的公司。但是只有意志坚定的人坚持了下来。在数据科学领域,情况就不太一...

3588
来自专栏Java学习网

结对编程成功的背后

结对编程成功的背后 让我们一起探索分析结对编程成功的特征原因。 结对编程正在逐渐成为主流的编程方式。有着两年结对编程经验的我注意到,结对编程真的很棒,甚至可谓是...

2448

扫码关注云+社区