前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如果我不说,你能看出这个主播不是真人吗?

如果我不说,你能看出这个主播不是真人吗?

作者头像
互扯程序
发布2018-12-07 15:47:43
5120
发布2018-12-07 15:47:43
举报
文章被收录于专栏:互扯程序互扯程序

我们先看看几段视频,震撼一下下

视频内容
视频内容

不但有中文版本,还有英文版本

视频内容

自从看了这个后,感觉又一大波人将来要失业了,这就是在2018年11月7日,在第五届世界互联网大会上,搜狗与新华社合作开发、全球第一个“AI合成主播”正式亮相的高科技。

搜狗人工智能的核心技术“搜狗分身”也终于浮出水面,“搜狗分身”技术可以让机器以更逼真自然的形象呈现在用户面前,而不是冷冰冰的“机器人”。

“AI合成主播”

“AI合成主播” 运用最新人工智能技术,“克隆”出与真人主播拥有同样播报能力的“分身”。是通过提取真人主播新闻播报视频中的声音、唇形、表情动作等特征,运用语音、唇形、表情合成以及深度学习等技术联合建模训练而成。该项技术能够将所输入的中英文文本自动生成相应内容的视频,并确保视频中音频和表情、唇动保持自然一致,展现与真人主播无异的信息传达效果。

更可气的是,TA 可以7 * 24小时不吃不喝不间断的工作,这要是人,得花多少money。试想一下,现在的网红主播们,通过深度学习把自己头像表情唇形经过训练后,发布到网上,大把大把钞票就来了,哈哈。

现在人形图像有了,表情和唇形也有了,那是不是可以利用3D全息投影把TA从屏幕里投射到现实世界里呢,生化危机第一集开始......想象是无止境的,未来不知道会发展成什么样。

现在语音合成技术发展到现在,已经比几年前那种电子书的按字阅读的时代不知道要好上多少倍,虽然视频里的主持人说话稍微有那么一点点的生硬,但我相信,不久的将来他肯定能100%模仿人类的发音。

其实现在的科技发展已经完全超出我们的想象了。未来真的已来。

那么如果我不告诉你,当你第一次看的时候,真的认为他是真人吗?大家留言回复讨论讨论你的感受。

如果你是做技术的,都这个时候了,如果你还不懂深度学习技术,以后估计真的会被淘汰了,“无私奉献”(哈哈,no face)的我为大家收集了60 GB深度学习视频教程,我保证完全免费,不需要群发,只需要在公众号回复“深度学习”即可获取下载链接。

我们再来看一个比较有意思理论:“恐怖谷理论”

恐怖谷理论

恐怖谷理论是一个关于人类对机器人和非人类物体的感觉的假设。它在1969年由日本机器人专家森昌弘提出假设,当机器人与人类相像超过95%的时候,由于机器人与人类在外表﹑动作上都相当相似,所以人类亦会对机器人产生正面的情感。直至到了一个特定程度,他们的反应便会突然变得极之反感。哪怕机器人与人类有一点点的差别,都会显得非常显眼刺目,让整个机器人显得非常僵硬恐怖,让人有面对行尸走肉的感觉。人形玩具或机器人的仿真度越高人们越有好感,但当超过一个临界点时,这种好感度会突然降低,越像人越反感恐惧,直至谷底,称之为恐怖谷。可是,当机器人的外表和动作和人类的相似度继续上升的时候,人类对他们的情感反应亦会变回正面,贴近人类与人类之间的移情作用。(来自百度百科)

陛下...看完奏折,点个赞再走吧!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-11-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 互扯程序 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档