数据如何生产内容——写作机器人与AI视频剪辑

编者按:本月主题旨在探讨数据与媒体中的内容关系,本文系《媒介杂志》4月号封面文章,全文深入浅出地剖析了数据与内容之间的关系,分为“数据与内容生产”、“数据与内容优化”以及“数据与内容市场”三部分。因原文较长,考虑到微信阅读体验,故分篇推送。

当前媒体面临怎样的时代?技术升级、场景变迁、产品迭代、社交迁徙......在这样的环境下,昨天还只是寓居于想象的未来蜃景,今天能够迅速具象为可感现实。但无论媒体产业如何发展、技术如何迭代,我们发现,“内容”始终是这条产业链中重要的一环。

内容产业似乎从传统时代走来,却也被这个新的时代赋予了新的能量。所以,当前的内容运营者面对的似乎是一个既光怪陆离又一脉相承的时代,它似乎轻车熟路又遍地希望,却也时常让人充满无力感与困惑。

那内容行业该如何解决这份痛点?目前,内容的概念包括得更加宽泛,除了常规意义上的新闻、剧集、图片等,社交内容、广告、搜索页面、交互信息都是我们界定的整体内容行业所能涵盖的范畴。而内容运营的智能化、数据化、程序化等发展的基础也在于对数据的长期积累、挖掘和运用。那么,数据技术是否会成为未来内容行业中的执牛耳者?数据究竟能为内容带来什么?我们需要从行业的实践中找到方向。

从无到有

数据工具辅佐内容生产,提升生产效率

作为内容运营链条中的第一环,内容的采集与生产一直显示出对于人力的严重依赖,属于典型的劳动密集型环节。而伴随技术赋能,数据一方面作为一种工具手段,解放了媒体的内容生产力;另一方面,也让内容生产变得有“据”可循,提升了生产效率。

1

图文内容:新闻产业为代表,迎来升级新契机

图文内容的生产,尤以图文类新闻内容的生产模式最为成熟。数据的加入,也在改变着这类传统的内容形式。在基础业务写作上,人类与数据工具之间的界限越来越模糊,依靠数据为支持的机器人新闻写作工具逐渐得到普遍应用。

以《华盛顿邮报》写作机器人Heliograf为例,它的工作原理是:

1.编辑事先为新闻报道创建固定的“叙事模板”,包括描述潜在结果的关键语句(例如“中国队战完胜韩国队、“泰国队逼平伊朗队”等);

2.把机器人挂到结构化数据源网站上,机器人识别数据并与模板中的短语匹配合并,就能产出稿件并在不同平台上自动发布。

同系列机器人生产内容案例很多,比如美联社也是最早启用机器算法写作新闻的传统机构之一。美联社应用的Wordsmith平台作为机器人写作在行业内较早的实践,它能够抓取公司年报、赛事报道等制式化的公开数据,并将其倒入进编辑模板,最后审核和发布。

此外,还有腾讯Dream Writer和《今日美国》的短视频制作机器人WIBBITZ这样能够将图片和视频剪辑在一起并用合成的语音进行新闻播报的类型;BuzzFeed开发的BUZZBOT能够自动从新闻现场收集信息;路透社的NEWS TRACER智能算法能帮助记者判断消息的真实性,基于传播渠道、可信度和新闻价值为消息评分……

《华盛顿邮报》写作机器人Heliograf

Wordsmith写稿流程:导入数据编辑模板预览发布

从这些案例来看数据写作新闻的发展,我们能部分得见两者的关系,即数据让新闻写作具有数量和速度的优势,从发掘新闻线索到程序化编辑再到生成成熟的新闻稿件,新闻的制作效率、报道范围和质量方面都被大大提升。

2

视频内容:搭建数据资源库,技术促进智能剪辑

不仅是图文内容,近年来,背靠AI技术快速生产视频的“智能剪辑”理念与应用开始进入人们视野。当视频内容占据全网流量“半壁江山”,视频广告规模一路疯长,没有人能够无动于衷。AI处理视频的成本仅为人工处理的千分之三,而视频剪辑的速度则是人工的40倍。所以智能视频剪辑工具,则成为继“机器人写作”之后解放行业生产力的又一救命稻草。

比如于2012年成立的Wochit,就是行业内最早的一家短视频制作服务平台。在发展过程中,Wochit逐渐和路透社、彭博社、美联社、Getty、Stringr等顶级通讯社结合媒体库达成了合作,搭建了自己的内容素材数据库,并且借助AI技术实现视频自动化生产。

目前Wochit在全球已经吸引了超过350家媒体使用其付费服务。首先,Wochit拥有极为智能的内容检索库,输入一个网址或者关键词,系统就会为用户自动搜集相关的视频素材,例如图片、视频片段、推文或者图标。第二步,Wochit在与各大顶级媒体合作搭建成的实时媒体数据库里进一步挑选相关的内容。然后,用户便能在智能Timeline上编辑视频,并在最后一键生成适配各个分享平台的视频。

wochit官网

2016年,IBM旗下人工智能系统Watson也为智能剪辑奉上了一次漂亮的先锋实验——为20世纪福克斯公司于2016年上映的惊悚电影《Morgan》剪辑了预告片。研究团队将100部恐怖电影的预告片中的每个镜头分离出来,对Watson进行训练,Watson会对这些预告片进行视觉、音频、场景构成的分析。接着将完整的影片《Morgan》导入到Watson中,在“观看”了电影后,Watson迅速挑出10个最适合制作预告片的电影场景。最后,Wstson从90分钟的影片中,为制作人筛选出一段长达六分钟的影片,也让预告片的剪辑时间缩减到24小时

惊悚片《Morgan》预告片(Watson剪辑版)

与此同时,国内视频平台也在扶持智能视频剪辑平台的开发。2017年6月9日,由微博、秒拍和亿幕共同推出的PGC视频内容服务平台云剪系统正式开放。这个系统面向媒体和视频机构提供视频素材管理、视频剪辑和发布的服务,据报道最快可以在2分钟内制作出一个达到PGC水平的短视频。

同一天,爱奇艺宣布成立创新实验室“Innovation Lab”,称要“在全球范围内寻找顶尖合作伙伴,共同制定视频领域的AI技术标准”,并提出“AI 艺术家”的口号。技术的进步便是基于此前积累的视频内容素材库里的海量内容数据库。

不论是图文还是视频,数据技术加持下的内容生产看上去已是一片火热。不过也要看到的是,内容数量和浏览量统计起来很容易,但依靠数据实现工具化生产到底给了生产多少价值的提升?以及这种所谓“更高价值的工作”确切的价值是多少去难以估算。以及,数据化生产能够带来的关注度、广告收入以及订阅量的数据,在统计中也尚未明确,还有探索的空间。

除了这种模糊性,数据生产内容也有一些明确的不足有待加强。褪去之前占领编辑部、抢去传统生产者饭碗的话题噱头,它既能带来节省时间、降低成本、帮助人类记者提高出稿效率的扎实效果,也有依赖数据与模板、报道主题有限、暂时处理低阶工作的不足。

本文余下内容:“数据与内容优化”、“数据与内容市场”将于明后两天陆续推出,敬请关注。

(图片来自网络)

媒介杂志《数算力》

现已上线!

欢迎购买订阅~

编辑:陈苡扬

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180423A1OEQX00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券