“进了!进了!”
电视上的足球进入球门的那一刻,德国球迷大路从沙发上跳起来,欢呼跳跃。
“德国进球了呀?”
一旁的伪球迷、大路的女朋友阿丽举起手中的pad:“咦?APP上推送了一条进球新闻。”
“德国队克罗斯在比赛结束前20分钟再进一球,目前德国队比分领先,看台上的球迷欢呼雀跃,主教练则扬起了胜券在握的微笑……”
略微有些机械的女声从视频中传来,多角度的进球分析让伪球迷阿丽也大致看懂了这个精彩的进球。
“等等,怎么球刚进去不过半分钟,你pad上就有了视频新闻,这么高端?”大路怀疑自己看了场假球。
而事实就是这么高端,大路并没有看“假球”。
现在的AI已经不仅仅能生成文字新闻稿了,生成世界杯的视频新闻也只需要20秒。
昨天,在北京新华社总部,能够在20秒内制作新闻视频的AI媒体人机协作平台MAGIC智能生产平台正式发布了。
MAGIC智能生产平台由新华社与阿里巴巴共同投资的AI媒体公司新华智云研发,结合新华社的强大新闻能力与阿里巴巴的AI技术能力,实现日产一万条视频。
该平台即将应用于俄罗斯世界杯的体育新闻报道。
据新华智云联席CEO傅丕毅介绍,MAGIC平台已经为今夏的世界杯做好了准备,预计能够产出包括比赛、花絮、精彩进球集锦在内的超过8000条世界杯相关视频新闻。
MAGIC智能生产平台并不是新华智云第一次亮相,因为,它还有另一个名字,叫做媒体大脑2.0。
它的上一代产品,媒体大脑1.0发布时就以10秒生成两会视频新闻而震撼世人,而2.0的更新版则针对内容的生产做了一些优化。
具体来说,MAGIC智能生产平台由4个系统构成:
智能数据工坊,通过爬虫、埋点,采集各类视频、图片、文字信息,之后进行数据过滤、清洗、去重和抽取,产出结构化的数据。
智能媒资平台,“媒资”这个词是媒体资源的简称,包括各类新闻信息、图片视频等素材,可以理解为一个素材库+知识图谱,记者可以在这个平台上找新闻、找配图、找视频。
不过,这个智能媒资平台并非完全自动运行的,还需要人工给素材打标,比如标注世界杯视频直播中的进球、判罚等信息。
除了素材打标和任务审核分配之外,其他识别过程都是由AI自动进行的,比如:
识别照片中的人物是谁,防止写稿的记者认错人;
识别出由于版权原因而不能出现的旗帜、标识,防止记者一不小心用了不能用的素材而侵权;
从复杂的事件中提取主题;
从数小时的视频直播中,找到重要的画面并自动剪辑;
……
在世界杯足球赛的应用中,它还可以利用视频跟踪算法,标注出场上每位球员的运动轨迹,帮助分析赛场局势。
据新华智云联席CEO徐常亮介绍,通过命名实体识别(NER)、BRF识别技术,智能媒资平台可以达到93%-94%的识别准确率。
智能生产引擎,有了充足的素材后,具体生成一条视频新闻的任务由智能生产引擎来完成。
当拿到一个给定的选题时,智能生产引擎会分析其中的时间、地点、人物等信息,从智能媒资平台中调去相应的素材,进行自动剪辑,生成视频新闻。
智能主题集市,解决“今天写什么”的问题,根据热点、历史规律、相关推荐,为内容生产者提供选题思路。
将这四个系统结合在一起,加上阿里云提供的运算能力,就可以实现20秒生成一条视频、同时处理10000条视频的能力。
新华智云这家公司有两个“爸爸”。
一个爸爸是新华社。
作为一家老牌通讯社,新华社经历了从纸媒到视频到网媒的变迁,报道形式随着科技的进步一直在变化。人工智能时代要来了,新华社需要考虑在新的时代里,内容的产生要如何随着技术而进步。
另一个“爸爸”是马爸爸,马云的马。
国内互联网公司在内容领域的角逐一直十分激烈,拥有强大技术实力的阿里巴巴刚好与新闻能力强大的新华社相合作。
于是,两家合资10亿元,共同创立了新华智云这家公司。
甚至新华智云的CEO都是两位,一位来自新华社,一位来自阿里。
新华智云联席CEO傅丕毅,此前是新华社浙江分社副总编辑,一位十余年的媒体人。当下面临的AI挑战让这位新闻人一直在思考,如何用AI推动内容行业的发展。
另一位联席CEO徐常亮此前曾担任阿里云大数据业务第一任总经理。
加入阿里之前,徐常亮曾在纽约时报负责新闻标签化与搜索,与新闻行业结缘。之后,他回国加入了阿里云。
在阿里工作多年后,徐常亮想尝试换个环境,出来创业。
当时,徐常亮看好三个方向:
一是自己的在普林斯顿读博时的研究方向生物相关的方向;
二是教育行业;
三是曾经在纽约时报接触过的新闻行业。
时势造英雄。拿着三个主意的徐常亮恰逢阿里与新华社筹备新华智云,于是,他果断加入了进来,成为了新华智云的联席CEO。
于是,新华智云成为了不多见的两位CEO的公司,一位懂新闻,一位懂技术,从此相得益彰。
20秒生成一条视频,生成的速度已经远远超过了观看的速度,人类手动制作内容的速度更是远远慢于了机器。
这也意味着,机器生产内容在未来可能成为主流。
熟悉内容行业的人知道,最早的内容——文章也好、图片也好、视频也好,多数是记者、作家、学者等专业内容生产者来生产的,称为专业生产内容(PGC);
而后,当互联网和移动互联网普及之后,每个人都可以创造、上传自己的内容,可以是一篇博客、一条微博、ins上的一张照片、斗鱼上的一场游戏直播或者抖音上的一段短视频,内容生产进入了用户生产内容(UGC)的时代;
如果未来有一天,机器创造内容成为主流,新华智云对此定义了一个新的概念——机器生产内容(MGC)。
傅丕毅预计,未来UGC生产的内容将会仅仅占到10%,剩下的90%都是PGC+MGC,即专业的人与机器协作生产出的内容。
是不是听起来有点钢铁侠的感觉?专业的内容创作者加上机器的武装后,能用更高的效率创作更优秀的作品。
在所有AI可能取代工作岗位的讨论中,媒体人都首当其冲。
但新华社记者出身的傅丕毅却对此十分淡定:“媒体智能化的一大特点是人机协作,目前不寄希望于机器可以完全取代人。”
看来,写AI的量子位暂时不会被AI搞失业。
* 。٩(ˊωˋ)و✧ 请做知识图谱和NLG的同学加油。
MAGIC智能生产平台已经为今年的俄罗斯世界杯准备了831个主题,另外还连接了2010年、2014年两届世界杯的相关数据,足以支持本届世界杯的报道工作。
而除了世界杯之外,新华智云未来一段时间将逐步完善各个领域的内容生产能力,包括但不限于篮球等其他体育方面。
另外,新华智云总部位于杭州,在杭州和北京都有团队。整体团队约150人,其中90%左右都是技术人员,包括来自清华、北大、中科院和国外高校的学生,以及曾就职于阿里、微软、百度和谷歌等技术公司的人才。
目前,新华智云也在寻找NLP、图像/视频处理和大数据等方面的技术人才。