展开

关键词

这家公司用Deepfake帮明星合成语,让他们躺着也能赚

还有许书,由于有了“明星朗读”buff加成,身价和销量也都会大涨。但如果有天你忽然发现,这些其实是由AI出来的呢? 最近,美国家人工智能公司Veritone瞄准了商机,推出了个名叫Marvel.AI的平台,为名人提供服务。? One More Thing近几来,的话题直热度不减。方面是技术上的突破确实令人惊喜。 早在2019,Google团队就提出了种文本语合成(text to speech)神经系统,能通过量样本学习到个不同说话者(speaker)的语特征,并合成他们的讲话频。这个量有? 而且的技术也已被不公司投入实际应用中,如亚马逊、微软、百度等等。

25050

只听几句话,百度AI就能模仿你的 | 附论文

只需要听你说几句话,AI就能“”出你的。这是百度Deep Voice项目最新get的能力。Deep Voice推出于以前,是个能实时合成语的神经网络系统。 这次的“语”研究,是这系统的最新进步。效果究竟如何呢?需要亲耳听听:百度放出了用最新技术合成语的几组例子,上面是量子位转录的其中个,前句是真人,后句是AI出来的。 更例子在这里:https:audiodemos.github.io这些例子中,语系统最用了10段说话人语样本,最只有1个,每段样本只有3秒。 如果只用于说话人嵌入,会拉长所需的时间、降低频质量,但可以用更的参数来表示每个说话人。说话人编码会单独训练个模型,根据要频,结合说话人生成模型,来推理新的说话人嵌入。 男变女、英变美的例子,可以在页面最下边找到:https:audiodemos.github.io听几句话就能模仿你,百度并不是唯家,加拿大AI创业公司Lyrebird去也发布了类似的产品,

2K60
  • 广告
    关闭

    云产品限时秒杀

    云服务器1核2G首年38元,还有多款热门云产品满足您的上云需求

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    用AI打个电话骗走22万欧元,你的语只需5秒录

    用 AI 打电话真的可以骗到?是的。而且,指定人的语只需要段 5 秒的录做样本。 据《华尔街日报》报道,今 3 月份,个不知名的黑客组织利用 AI 语技术打诈骗电话,结果成功骗到了 22 万欧元。? 只需 5 秒的录样本随着自然语言处理技术的进步,用 AI 合成特定人已经不是什么难事。? 今 5 月份,搜狗在场大会上展示了变功能,可以把任何人的转化成特定,让你的秒变志玲、马云、高晓松。而谷歌的项研究甚至可以借助 5 秒钟的参照语任意语。 它是个用于零样本(zero-shot)语的框架,只需要 5 秒钟的参照语。也就是说,如果你的录泄露出去,哪怕只有小段,也很有可能会被坏人利用。

    45230

    AI语诈骗银行高管,取2.2亿如探囊取物

    晴天霹雳的背后是AI语转换直到转完账之后,这位迪拜高管也万万没有想到,电话那头熟悉的老板的,其实是用语技术合成的。这桩诈骗案由福布斯报道,但受害者的名字和其他更细节没有透露。 例如在Github上大火的AI拟项目Real-Time-Voice-Cloning,能够在5s内你的并生成任意内容,还能直接下载或者自行训练合成器。这个视频就是基于该项目的训练成果。 开源项目可以直接从GitHub上直接获取:然后再录入段你的和目标,打出想要读出的文本内容,就可以段输出频了。面对这样以假乱真的效果,也就不难理解这位银行高管为什么会被轻易诈骗了。 但这仅是已知使用语实施巨额诈骗的第二例,已经远比第例英国某能源公司22万欧元诈骗案更为成功,其破坏力可见斑。 在前些时候,语转换技术就曾在央视节目《等着我》中出现,帮助退役的袁爷爷,找回了当时在战场上同作战的老排长的“”。

    8420

    用AI打个电话骗走22万欧元,你的语只需5秒录

    据《华尔街日报》报道,今 3 月份,个不知名的黑客组织利用 AI 语技术打诈骗电话,结果成功骗到了 22 万欧元。? 得逞之后,他们又联系该 CEO,以董事长的身份告诉他这笔会回流到公司账户。但在资金回流之前,黑客再次冒充董事长打来电话,要求 CEO 再转,而且这次是从匈牙利打来的。 只需 5 秒的录样本随着自然语言处理技术的进步,用 AI 合成特定人已经不是什么难事。? 今 5 月份,搜狗在场大会上展示了变功能,可以把任何人的转化成特定,让你的秒变志玲、马云、高晓松。而谷歌的项研究甚至可以借助 5 秒钟的参照语任意语。 它是个用于零样本(zero-shot)语的框架,只需要 5 秒钟的参照语。也就是说,如果你的录泄露出去,哪怕只有小段,也很有可能会被坏人利用。

    33040

    公司高层都在为CEO职位争得头破血流,而马斯竟把职位改成...

    马斯,很人心中的偶像,随着比特币价格的路高歌猛进,似乎马斯的火箭事业又了不资金基础。 不过向语不惊人死不休的马斯最近又次进入大众眼帘并非是他的spacex火箭又出了什么幺蛾子,也不是特斯拉咋样了,而是他自己的公司头衔。很人肯定在想,什么?公司头衔?他不做CEO了吗? 并不是,而是最近,在特斯拉提交给美国证券交易委员会(SEC)的份文件中,作为公司首席执行官(CEO)的埃·马斯和首席财务官(CFO)的扎·科霍恩,两人在公司的职位分别被改成了特斯拉电国王( 就是说,今特斯拉随便买了点比特币赚的,比2020主营业务-卖车带来的净利润还高。这。。。该怎么说呢。。。 真是要美人不要江山啊~小编又想酸酸的感叹句,有 真好~所以这样想想,对于其电国王的称呼,似乎也不奇怪了把~你的看法呢?

    13820

    动态 | 百度新论文带来「」,个半小时的训练数据就可以复制你的

    而且在此基础上,百度的研究人员们打算更进步,尝试只从几秒长度的短句中学习说话者的特点。通常我们把这类问题称为「语」。 在生成语的自然性和相比原讲话人的相似性方面,两种方法也都只需要很样本就可以展现良好的表现。生成的样本可以参见 https:audiodemos.github.io. 。 讲话人适配方法是使用数个样本,通过基于反向传播的优化方法对讲话人语生成模型做精细调节(fine-tune)。 适配方法可以作用于整个模型,或者只作用于低维度的讲话人嵌入;后者表征每个讲话人所需的参数数量要,尽管需要更长的时间,生成的语的质量也要稍差些。 讲话人编码方法中需要训练个单独的模型,用它直接从要的语样本中推断出新的讲话人嵌入,然后再把这个讲话人嵌入用在讲话人语生成模型中。

    53070

    ——用深度学习实时别人的

    这时我们熟悉的谷歌(Google)又出现了,来自谷歌的研究绰号“语”(Voice Cloning)人工智能,它使计算机可以用任何读出信息。 语的工作原理很明显,为了让计算机能够大读出任何,它需要以某种方式理解两件事:它读的是什么以及它是如何读的。 近来,文本-语转换系统在深度学习领域得到了广泛的研究关注。事实上,基于深度学习,有很针对文本到语的解决方案都非常有效。这里的关键是,系统能够将说话者编码器从语中学到的“知识”应用到文本中。 分别编码后,将语和文本组合在个公共的嵌入空间中,然后进行解码,生成最终的输出波形。 代码亏了人工智能社区中开放源码思想的美妙之处,在这里有个公开可用的语实现!你可以这样使用它。 如果你想了解更关于这个算法的工作原理,你可以阅读谷歌的官方NIPS论文。这里还有频样本结果。我将高度存储库,并尝试下这个很棒的系统! End

    2.7K20

    做钥匙?!慢放开锁轨,黑客就能破解常用门锁,从33万种密钥中锁定3种

    比如上个月,黑客造成推特史上最严重的安全事故,马斯奥巴马等位大V账号被黑;或者像8月初英特尔的那起数据泄露事故,足足20GB数据被黑客泄漏。不过,黑客可不止会对大公司下手。 新加坡国立大学的研究人员表示,黑客可以站在你家门附近录下你开锁的;或者黑进你的手机,用他们设计的恶意软件远程录下你开锁的,然后你的钥匙。? 研究人员表示,该系统能够从个有33万种可能密钥的数据库中,将正确的密钥缩小到3种!黑客们这顿操作猛如虎,很可能神不知鬼不觉就拥有了你的钥匙,进了你家大门。 毕竟,如果是用传统的方法撬锁或用种类似于“万能钥匙”的工具来开锁,都会在门锁上留下痕迹;但如果这项技术成熟后,要是被盯上了,很可能家里被偷了都不知道啊...话说回来,黑客竟然能通过出钥匙,这是什么操作 当然,出正确钥匙的条件也很苛刻,比如黑客需要事先“踩点”了解业主是哪种门锁;以及是否能准确录下业主开锁的频中是否有杂等。

    24630

    结合AI和VR,这家公司要打造有感情的虚拟

    不同于传统的人形机器人,这类虚拟没有物理身体。致力于“个性化人工智能”的美国加州创业公司ObEN在与韩国娱乐公司合作为流行乐明星打造虚拟形象,让他们能够借助它来更地与粉丝进行互动。 相反,它们要打造3D虚拟分身,赋予这种虚拟形象人的体型和,以及足够聪明的行动能力——目前至能够执行简单的任务:客服请求,大朗读,进行明星和粉丝之间的互动。 韩国流行乐组合最为红火,比如今卖出100万张唱片的男子乐组合EXO。通过与明星经纪人和经理建立合作,ObEN能够获得非公开的数据,给明星们创建的问答环节。 Soul Machines还计划向客户同时收取订阅费和会话费,收费具体取决于虚拟形象跟人进行对话。另个商业化可能性是,向第三方开发者提供数字化人体的使用权。 贾恩说,用户应该只需要拍张自拍照就能够给自己做个虚拟。短期来看,那也让开发者能够打造简单的O2O应用,比如在扫描二维码以后,跟另个人的虚拟形象起录首合唱歌曲。

    34370

    马斯宣布特斯拉破产,自己哭晕在车旁?

    大早,营长就被 Twitter 推送的消息给吓到了。埃马斯发推宣布:“尽管我们努力筹集资金,包括孤注掷地大规模出售复活节彩蛋,但是我们很遗憾地宣布,特斯拉已经彻彻底底的破产了。 虽然这不是特斯拉第次被唱衰,但是为何最近唱衰的如此之大,就连马斯也要借着愚人节的机会自我调侃下?▌量产问题特斯拉目前最大的问题就是产能不足。 但是就算 Autopilot 2.0 功能不全,相比些竞争对手可能落后了,但它是不是至应该比第代系统更加安全? 明称,汽车的系统发出数次影像提示和提示,要求驾车人双手握住方向盘,但是行车日志显示,驾车人没有采取任何行动。 庆幸的是,这问题暂时还没有引起事故。▌缺的特斯拉 虽然很问题可以用解决,但是特斯拉现在缺的就是

    41060

    喜马拉雅贺雯迪:基于端到端TTS实现更具生动、富有情感的语合成表现

    贺雯迪:我目前在喜马拉雅担任频算法工程师,工作研发方向是TTS前端模块的搭建和优化(文本规整化、分词、字、韵律预测等),后端算法(基于深度生成模型的说话人风格转换,情感控制,、神经码器的优化等方向 如何让机器低成本地学习用户的,也就是你在演讲中将会提到的,这项语合成技术是如何做到通过量的语料模仿不同的呢?贺雯迪:样本以至于单样本、零样本学习在深度学习领域都是很重要的。 比如,如果我们提前有个20个说话人的说话人模型,这其中训练数据里每位说话人的样本可能需要几个小时时长,新的说话人只需要估计10分钟左右时长的频数据,就能通过短时间训练,做到。 通过训练好的学模型,用户只需要输入条几秒钟的个人语,就能出该用户的(通俗来说可以理解为embedded speaker里与该用户最相似的,最大程度去还原)。 当然还有更样本、零样本的研究趋势,其发展和落地依然处于行业内不断探索的过程。

    58620

    喜马拉雅贺雯迪:基于端到端TTS实现更具生动、富有情感的语合成表现

    贺雯迪:我目前在喜马拉雅担任频算法工程师,工作研发方向是TTS前端模块的搭建和优化(文本规整化、分词、字、韵律预测等),后端算法(基于深度生成模型的说话人风格转换,情感控制,、神经码器的优化等方向 如何让机器低成本地学习用户的,也就是你在演讲中将会提到的,这项语合成技术是如何做到通过量的语料模仿不同的呢?贺雯迪:样本以至于单样本、零样本学习在深度学习领域都是很重要的。 比如,如果我们提前有个20个说话人的说话人模型,这其中训练数据里每位说话人的样本可能需要几个小时时长,新的说话人只需要估计10分钟左右时长的频数据,就能通过短时间训练,做到。 通过训练好的学模型,用户只需要输入条几秒钟的个人语,就能出该用户的(通俗来说可以理解为embedded speaker里与该用户最相似的,最大程度去还原)。 当然还有更样本、零样本的研究趋势,其发展和落地依然处于行业内不断探索的过程。

    51030

    替身!仿真虚拟机器人能还你个前女友?

    相反,它们打造的3D虚拟替身拥有人类的形态和,以及足够智慧的行动能力,目前至能够执行些简单的任务:客服请求,大朗读,明星与粉丝之间的互动。 最受欢迎的韩国偶像团体是赚的主力军,例如男子乐组合EXO去卖出了100万张唱片。通过与明星经纪人和经理建立合作,ObEN能够获得非公开的数据,给明星们创建的问答环节。 Soul Machines还计划向客户同时收取订阅费和会话费,收费具体取决于虚拟替身跟人进行对话。另个商业化可能性是,向第三方开发者提供数字化替身的使用权。 Jain表示,用户应该只需要拍张自拍照就能够给自己做个虚拟替身。短期来看,让开发者能够打造简单的O2O应用,比如在扫描二维码以后,跟另个人的虚拟形象起录首合唱歌曲。 如果个人能够将他们的虚拟授权给家公司使用,那他们是否就不能将其用于个人目的或者他们自己的业务呢?当涉及的财产是你或者你的个版本的时候,数字财产的概念很快就会变得错综复杂。

    53270

    大数据那些事(32):风暴,山寨风暴和遥遥无期的风暴二代

    很有意思的个数据。周末遇到个和我差不时候做公众号的大姐闲聊。我做IT码农的,对方做吃喝拉撒的。彼此各做半,我有8000粉对方7万。我篇文章大概2000阅读,对方过万。 我篇文章打赏平均几十人民币,个位数的观众,对方轻松两位数观众,几百人民币。总之就是完败。于是对方教育我说女人和小孩的好赚,你开这公众号写东西给程序猿看。写得再好也难让人掏腰包啊。 所以阿里巴巴在大量使用Storm以后就给山寨了,用JAVA了。这个的东西叫做JStorm。 这算得上是开源界里面当件很牛逼的事情了。至于为什么会用Java了,这个问题到差不以后阿里巴巴集团在西雅图开技术峰会,封大大作为大牛之做了次演讲,演讲结束以后我蹭过去问他。 基于JStorm的Storm2.0也没啥。由不得我不去联想阴谋论和雷大雨点小了。但是无论如何,我觉得JStorm这个项目展现出了中国人在开源的世界里面的拳头和实力。是非常值得骄傲的事情。

    46480

    现在你可以通过深度学习用别人的来说话了

    在打造这样个系统时,个非常有趣的地方是为生成的频选择哪个,是男人还是女人的是大还是小? 因此,谷歌研究人员设计的语系统有两个输入:我们想要读取的文本和我们想要用来阅读文本的语样本。 在过去几中,语合成系统在深度学习社区中得到了很研究关注。事实上,有很基于深度学习针对语合成的解决方案都非常有效。这里的关键是,系统能够将编码器从语中学到的“知识”应用到文本中。 在分别编码后,将语和文本组合在个公共的嵌入空间中,然后进行解码,生成最终的输出波形。 的相关实现代码亏了人工智能社区中开放源码思想的美妙之处,在这里有个公开可用的语实现! 你甚至可以录制你自己的作为输入,只需要点击 “Record one” 按钮。相信我,这会非常有趣! 更进步如果你想了解更关于这个算法的工作原理,你可以阅读谷歌的官方NIPS论文。

    2.5K30

    汽车AI语交互 正在让机器交互更接近真人交互

    1997,如今隶属Nuance旗下的龙系统(Dragon system)推出了“ NaturallySpeaking”软件,这是历史上第个可用的“连续语”听写软件。 03语交互技术上的高山二:个性化,即 如果说自然连续对话为更自由的交互和差异化服务提供可能,那语定制化则将个性化、情感化的语交互率先落地。 如今,国内智能网联行业也首次迎来了语定制——“”产品。斑马智行VENUS系统“”操作流程非常简单。 是车载AI语交互功能的“灵魂”,基于“”技术,斑马智行VENUS系统将为用户提供“千人千”的定制化服务,用户可以“”亲人和爱人的,让陪伴更长久,让驾驶更舒心。 据介绍,斑马智行VENUS系统“”操作流程非常简单。

    23410

    采访马斯:脑机接口内植入人体,孩子名“X Æ A-12​”致敬中国文化

    马斯说,植入物的最初目标是将其用作治疗脑损伤和外伤的手段。“还有很工作要做。” “我们可能会在之内把它植入人体,以帮助人们保持健康,并恢复他们已经失去的某些功能。” 马斯说:“从原则上讲,它可以修复大脑有问题的任何东西。”这不是马斯次说要明实现。早在20197月,他就说过“明就能成”。但脑机接口只是马斯希望Neuralink能实现的小步。 特朗普政府和约翰·霍普金斯大学健康安全中心研究人员制定的重新开放计划认为,每个州应该看到至连续两周新病例减,才能重新开放。任何个州都尚未触及这个门槛 。 为何花时间改造房子? 在周四的采访中,马斯说,这个名字大部分是自己女友的主意,X就是字母X,Æ读与ash相近,A-12则是架侦察机(SR-71侦察机前身)的代号。 参考链接: 伊·马斯表示,他的AI脑芯片公司有可能在内将植入物植入人体https:www.businessinsider.comelon-musk-neuralink-brain-chip-put-in-human-within-year

    18320

    斯坦福博士退学,在 3 个领域改变世界,科技狂人马斯的巅峰之路

    求学北美虽然出生在南非,但埃·马斯注定只是那里的个过客。美国尤其是硅谷,对于马斯来说,意味着最前沿的科技,是探险家的乐园,是实现梦想的地方。 之后,很人问马斯是怎么学会制造火箭的,马斯总是嘿嘿笑,说自己是通过看书学会的,根本没几个人相信。 会议开始了,众人都等着马斯先发言,然后伺机从破产保护中为自己争取最大利益。会议陷入片沉默之中。马斯的眼眶有些泛红,接着用低沉的打破了这种沉默的局面。 在他的方运作下,20106月29日(跟马斯的生日只差天),特斯拉在纳斯达正式上市了,发行价每股17美元,虽然市场上看衰的此起彼伏,但真实的股票价格不会撒谎。 人们质疑的还没落下,马斯已将首批60颗卫星送入太空。……马斯总给人种感觉,他似乎可以上天入地、无所不能。

    33010

    附带深度语伪造检测的语平台

    编辑 | TGS发布 | ATYUN订阅号 人工智能与机器学习是合成语的强大工具。无数研究表明,在最先进的模型中,只需几秒钟就可以精确地模仿受试者的韵律和语调。 例如,百度最新的深度语服务可以用3.7秒的频样本个语,7月份的篇研究论文发布的实现只需要大约5秒。 两人试图将用于语合成的领先机器学习模型调整为可伸缩的,目的是构建种能够从相对较小的数据集中的服务。而在推出语合成产品的同时,他们还推出了种检测深度语伪造的工具。? 在6月和7月的最近次统计中,它发现了14,698个网络上的深度伪造视频,比去12月的7,964个有所增加,仅在7个月内就增长了84%。 当你在我们的平台上发出自己的时,我们会采取切必要措施来维护的所有权,确保你的不会被滥用。”

    77730

    扫码关注云+社区

    领取腾讯云代金券