作为“雅妮”第一个抓手,文娱产业有望率先开花结果,但“雅妮”的野心,绝不只是文娱产业。
8月9日,第三届中国“网络文学+”大会开幕式迎来一个特殊女主播,名叫“雅妮”。
在大会开场前,“雅妮”出现在大屏幕上进行暖场播报:“……距离大会正式开始还有一分钟,请各位领导嘉宾回到座位并将手机调至静音或者关闭状态,谢谢合作。”现场嘉宾没有特别反应,直到“雅妮”再次说明:“刚刚大家观看的这段视频并非真人录制,而是由大会专职的人工智能合成主持人雅妮为你播报,我由搜狗公司分身技术打造,作为虚拟主持人,我将在本次大会的多个场合,为与会嘉宾提供服务。”现场嘉宾才惊觉,原来这是AI播报。
01
搜狗分身技术瞄准文娱产业
以假乱真的主播,背后是搜狗分身技术,其原理是基于搜狗AI技术,通过语音智能合成和形象智能合成两大引擎,从图像表情、声音形态、语言习惯和逻辑思维等层面对AI进行拟人化训练,从而生成高度逼真的AI形象或AI分身。在搜狗分身技术出现前,最具代表性的AI应用是智能语音助理,比如Siri,但智能语音助理都没有具化形象,搜狗分身技术让AI变得“有声有色”。
此前搜狗分身技术已经应用在一些场合,比如今年315晚会开播前,搜狗与央视财经频道联合推出的AI主播“姚小松”上岗,在央视对3·15晚会进行预热;再比如6月27日,搜狗与北京互联网法院联合发布全球首个“AI 虚拟法官”……虽然原型不同,其底层却都是搜狗“分身技术”。基于这一技术,只要对特定原型进行声音和形象采集,再进行学习训练,就可以生成虚拟主播,模拟原型语气语调、面部表情、说话逻辑实现智能发声,声情并茂。
“雅妮”是搜狗首个自有形象的AI合成主播,搜狗先是采集了少量真人主持人李雅妮的形象和语音素材,再经由系统自动学习、训练、形象模拟而生成。
搜狗将“雅妮”的处女秀放在“网络文学+”大会上,正是因为看中这一大会在文娱产业的影响力,这一大会致力推动网络文学与影视游戏、人工智能等产业的深度交叉融合,从而建立全新的娱乐消费形态,这与搜狗想要让分身技术在文娱产业落地的目标十分吻合。在“网络文学+”大会开幕式上,搜狗宣布与新华社新媒体中心、掌阅、咪咕达成战略合作,各方将基于搜狗分身技术在网络文学及视频直播等领域展开合作。
搜狗分身技术此前一直在做各种场景的探索,先做应用的广度。从这次亮相和签约来看,搜狗分身技术将在文娱产业重点落地,要做应用的深度,进而实现规模化商用。
02
在文娱产业有哪些应用空间?
1、虚拟文学形象。
文学一直被视作是IP的IP。影视、动漫、游戏许多内容都源自于文学,而咪咕和掌阅均是头部网络文学阅读平台,手握大量文学IP。文学IP与虚拟主播技术结合点非常多。
在本次战略合作中,掌阅宣布将会上线以月关、不信天上掉馅饼两位网络小说作家为原型的“AI合成作家”,用户可以在掌阅App观看“AI合成作家”讲述自己的作品,这一应用可以复制到各种网络阅读App,这背后是一个庞大的有声书市场。
有声书本质是对用户内容消费场景的差异化满足,很多用户因为种种原因习惯“听书”。有声书的创新空间有两个,一个是让作家来说书,比如《蒋勋细说红楼梦》的语音课程有大量的订阅者,但因为蒋勋很忙所以没更新几期,作家很忙,如何让作家自己来说书?二个是能不能让作家出现在屏幕上?这些都是搜狗分身技术的价值。艾媒咨询报告显示,2018有声书市场规模达46.3亿,其中30岁以下用户占比超六成,这一赛道已诞生喜马拉雅这样的独角兽,跟分身技术结合空间非常大。
搜狗分身技术甚至可以让文学作品中的人物走出来,跟用户互动,丰富网络文学消费形式,这针对少儿等用户群将特别有价值,比如让小朋友在看完童话书后,跟通话中的正面形象的虚拟分身互动,寓教于乐。这样的形式也蕴藏着商业化创新的可能,比如虚拟人物与广告的结合。
2、短视频直播游戏。
游戏、二次元、直播、短视频等碎片化的文娱内容产品,可应用分身技术来降低制作成本,实现更多创造可能性。前段时间斗鱼很火的“乔奶奶”是一个老奶奶,靠遮脸欺骗了不少用户。如果有虚拟分身技术,“乔奶奶”就不用担心露馅儿了。虚拟人会成为直播平台上重要的主播类型,用户上直播平台是因为寂寞,需要的是陪伴和快乐,很多时候是否真人不重要。真人只有一个,虚拟主播可以分身,可以对每个人进行个性化、点对点和全程陪伴,举个例子,宅男很多都喜欢林志玲,分身技术可以让每个宅男拥有一个虚拟的林志玲主播,她可以陪你聊天,玩游戏,唱歌等等。
3、影视动漫二次元领域。
分身技术有望改变动画片等以人类为原型的节目的制作方式,基于智能合成技术,真人电影可以智能转化为动画片,大幅降低动画片制作成本;
分身技术可以推动5G时代被寄予厚望的互动视频应用。互动视频让用户参与到影视时间轴,可以决定剧情走向,分身技术可让用户跟角色互动甚至扮演某个角色,就像《西部世界》中的场景一样,这部电视剧中有一座以西部世界为主题的高科技成人乐园,游客可以进入其中满足各种欲望;
分身技术有望率先落地的场景是虚拟偶像。在二次元发达国家日本,虚拟偶像已经成了成熟的产业链,据Cyber-Agent的数据,2017年日本虚拟偶像的市场规模为12.7亿元,相比于2016年增长了2.2倍,近两年更是刮起一阵VirtualYoutuber(虚拟主播)的旋风,全世界最熟悉的虚拟偶像则是“初音未来”,这位日本虚拟歌姬号称“虚拟世界第一天后”,“她”在70多个国家运营,拥有超过6亿粉丝,在全球各大城市举办了40多场演唱会,给日本创造了100亿日元(约5亿人民币)的消费,身价接近10亿,“她”在巴黎唱过歌剧,在日本给MTV颁奖典礼当过嘉宾,在美国给Lady Gaga的演唱会当过嘉宾,堪称世界巨星。
二次元经济在中国正在高速增长,得年轻人得天下,互联网巨头都在布局年轻人,虚拟偶像已成为一门大生意。触漫、克拉克拉等平台上已经在兴起虚拟偶像,它们可以直播、接收礼物、陪伴用户。虚拟偶像正在跟球鞋一样从小众到大众,成为Z次元年轻用户的烧钱主力。虚拟偶像跟搜狗分身技术有着很好的结合点,此前搜狗输入法上线变声技术已经成为爆款功能,说明了“虚拟人物”或者说“模仿人物”本身是刚需,其背后技术原理都是一样的。
4、丰富线下演艺娱乐形式。
将分身技术与全息技术结合,演唱会形式会变得更丰富,虚拟主持人、虚拟嘉宾、虚拟歌手都会出现在演唱会中,已故歌手杰克逊可以在分身技术下复活现身与粉丝见面;张学友60岁的演唱会可以跟年轻时候的自己同台献艺;远在外地的嘉宾可以参与到演唱会的表演中……
不只是演唱会,像相声表演、话剧、歌剧这样的线下表演,未来都可与分身技术结合做一些形式上的创新探索,比如让“虚拟罗永浩”来办一场苹果手机发布会,就会很有看头。
文娱产业链很长,文学、动漫、音乐、短视频、直播、影视、游戏、二次元、电竞、演艺等等,每一个细分产业都跟搜狗分身技术有结合空间。文娱产业一直在被科技深度影响,前些年更多是在改变文娱内容的分发路径,现在科技特别是AI正在深入到文娱内容的生产环节,催生一些创新的文娱业态,促进文娱产业升级。AI+文娱的趋势下,搜狗找到了抓手是基于AI的分身技术,它能和文娱企业们一起玩儿出什么花样值得期待。
03
搜狗分身技术正在各行各业落地
此前,搜狗分身技术已在媒体主播这一场景中不断落地。
央视315晚会与央视财经频道联合推出的“姚小松”虚拟主播;今年搜狗联合俄罗斯塔斯社推出全球首位俄语AI合成主播Lisa;在咪咕70周年专题的主场,搜狗与新华社新媒体中心合作推出“AI合成主播”新小萌将作为彩蛋亮相。人类主播成本高,可能会出错,AI主播基于AI技术智能生成新闻内容,制作成本和出错率大幅降低,可让更多新闻视频化,也可让一个新闻快速生成不同语种版本,甚至生成手语、语音等版本,满足有障碍用户群的新闻获取需求。
理论上媒体同样属于文娱产业,因此可以认为,文娱产业是搜狗分身主播落地的第一场景。在此之外,许多行业都有应用空间。
6月,搜狗与北京互联网法院联合发布全球首个AI虚拟法官,负责科普、解释和引导等法律工作,这是分身技术在法律产业的首次落地。法院背后是公共事业场景,税务、政务、警务、市政、交通、环保等等公共事业都可以用虚拟人做科普、引导、解释,比如现在很多城市在推进的垃圾分类,完全可以用搜狗分身技术合成各种特性的虚拟引导员进行讲解,强化市民认知、培养市民习惯。
“雅妮”这一次担任暖场主播的场景是会议场景,本身是一个产业,未来“雅妮”这样的虚拟主播有望被复制到更多会议场所,增强会议趣味性的同时节省人力成本。会议的形式在分身技术支持下可以创新,比如让乔布斯在分身技术加持下回归苹果发布会舞台,发布下一代iPhone。搜狗在会议这一场景上已有许多业务布局,比如搜狗同传技术、搜狗智能录音笔,都在服务会议场景,现在看来从会前、会中、会后,搜狗都有对应的AI解决方案,已成会议AI解决方案专业户。
分身技术本质是对语言、表情、神态和姿势等人类表达方式的智能化模拟,是继智能助理后AI具象化的又一个重要环节,其应用场景将十分广阔。除了前面提到的各种应用外,在教育、医疗、客服、金融、酒店等行业,可以分别实现虚拟老师、虚拟陪护、虚拟客服、虚拟大堂经理、虚拟前台,降低各行各业的人力成本。
搜狗AI战略的核心是语言,其最擅长的是表达,分身技术实际上就是基于语言AI技术的表达。从搜狗自有形象AI合成主播“雅妮”亮相第三届中国“网络文学+”大会来看,搜狗正在推动分身技术和AI主播在各行各业的落地。
作为“雅妮”第一个抓手,文娱产业有望率先开花结果,但“雅妮”的野心,绝不只是文娱产业。
END