前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >怕不怕?第一批AI已经开始干这种事了

怕不怕?第一批AI已经开始干这种事了

作者头像
IT阅读排行榜
发布2018-12-28 12:37:22
7110
发布2018-12-28 12:37:22
举报
文章被收录于专栏:华章科技华章科技

导读:我们曾在《那个陪你聊微信、发自拍的妹子,可能不是人》中提到过跟你自动聊微信的机器人,在本文中我们会给你看更多类似案例。

来源:程序猿(ID:imkuqin)整编,参考:人民网等网络信息

平常和你们聊天的“卖茶小妹”,其实根本不是什么萝莉御姐,而是油腻的中年大叔,甚至可能连人都不是,而是一个代码敲出来的聊天机器人!

还有,前不久人民网报道的,赵女士收到“父亲”让她转账的微信留言,即便赵女士已经确认是父亲口音,却还是被骗了。

但众所周知,目前腾讯公司的官方微信是无法实现语音转发的,那么在骗局中,骗子是如何“瞒天过海”的呢?

其实这类诈骗,只需要安装一个软件,就能够达到转发语音的功能,这类软件在网上不能免费下载,但是有卖家出售。价格在68元到128元不等。

腾讯官方回复称:这些软件都是在未经腾讯许可、擅自篡改微信客户端数据的第三方软件,它们通过模拟自然人的使用行为达到批量或自动操作的目的。

有人就说了声音能造假,那脸还能有假的不成?还真有,去年315晚会就曾曝光的破解人脸识别,而这种高端的作案手段早就存在了。

早在两年前,就有此类案件出现,一名名叫“李小奕LOL”的淘宝店网红,被不法分子用软件合成人脸和声音,搞起了情色直播,获得巨额打赏。

诸如此类的诈骗案件还有很多,下面让我们回到技术层面,看看以上说到的这些诈骗手段都是如何实现的呢?

01 语音合成技术

通过AI语音合成,可以让合成的语音和真人无异,即便是身边亲近的人,也难辨真假。

最早通过神经网络来实现人类语音生成的工具,是DeepMind的WaveNet,通过WaveNet,只要提供一些已经训练好的模型和朗读的素材,WaveNet就会生成一个较为真实的声音。

去年,Lyrebird也发布了语音合成技术,可以在1分钟内模仿人类“讲话”,通过Lyrebird,你就能生成任何一个人的声音,哪怕是让奥巴马、特朗普和希拉里对话也可以。

相比之下,Lyrebird比同一时期的WaveNet要快得多。感兴趣的可以到官网尝试一下。

地址:https://lyrebird.ai/

当然也有国产的,百度今年2月份推出语音合成系统DeepVoice,可以轻松训练AI合成百种英文口音。据百度声称最终版,可以在半个小时内完成对10000种语音数据的学习。

02 人脸图像合成

说完了语音AI合成,我们再来说人脸图像合成,多少宅男程序员都幻想的秒变吴彦祖:

是不是觉得很牛逼,还有更牛逼的,能让女星下海拍片的AI,你见识过么?

一个网名为 deepfakes 的程序员,他通过各种途径获取的女星素材,再通过Keras、TensorFlow等多个开源库,训练深度学习网络,经过反复训练后,让 AI 学习了女明星的面部特征,最后合成到了成人片里的女演员的头部。

《神奇女侠》的扮演者盖尔·加朵的这一面你见过么?

学习样本越多,就可以生成脸谱图的还原度就会越高。

在2016年,德国纽伦堡大学的教授Justus Thies带领团队,做了一个能实时进行面部转换的模型,叫Face2Face

前面提到的利用网红脸直播的不法分子就是通过Face2Face实现的。

03 语音+人脸合成

前不久,我们曾报道过:在今年的乌镇的第五届世界互联网大会上,搜狗联合新华社发布了全球首个合成新闻主播“AI合成主播”。

这项AI技术背后“AI合成主播”是通过提取真人主播新闻播报视频中的声音、唇形、表情动作等特征,运用语音、唇形、表情合成以及深度学习等技术联合建模训练而成。

所以,如果有一天,电信诈骗不再是操着南方口音说自己是东北黑社会,而是模仿你的声音说自己遭遇绑架,甚至是不法分子发送一段你被绑架的视频......

想想真是可怕......AI的发展,从技术层面讲,这是好事,因为它推动时代向前进,但反过来,这样先进的技术一旦被滥用,后果也是不堪设想,希望这些技术都能用到正道上。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-12-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据DT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档