展开

关键词

真实到可怕!英伟达MIT造出马良的神笔

随着左侧体模型的跳动、位移和肢体不断变换,右侧的真中,主角也在随之舞蹈,无论你想要什样的姿势,变高、变矮、变胖、变瘦,只要把左侧的体模型调整一下,右侧的真就会乖乖的听你调教。 如果应用在生产中,简直可以让抠图小鲜肉们一年拍10000部电影都不成问题。 最后,清晰的效果欢迎大家点开查看: ? 技术细节 这NB的效果,是实现的? 说下要点。 ? 器共有两种,一种处理图片,一种处理。 图片器同时获取输入图像和输出图像,并从多个特征尺度进行评估,这与pix2pixHD类似。器接收Flow maps以及相邻帧以确保时间一致性。 论文中表示,这是一种在生成对抗性学习框架下的新方法:精心设计的生成器和器架构,再加上时空对抗目标。 包括用8个GPU训练,用1个GPU又该设置等等。 ? 你所需要准备的是,一个Linux或者macOS系统,Python 3,以及英伟达GPU+CUDA cuDNN。

34630

AI换率超99.6%,微软用技术应对虚假信息

,如何辨和处理换应用所制造的合成照片、合成是新型科技产品带来的新挑战。 从生成足以以假乱真的名不雅开始,很多使用者将这个“换神器”当成了造假工具,并通过社交网络将虚假信息(disinformation)传播到全世界。 事实上,大约 30% 经过 AI 换的合成照片、合成类仅凭肉眼无法识的,很容易被当作真实信息进行再次传播。这已成为一个亟待解决的社会性问题,面对这个问题,我们应该以及可以做些什? 以技术防御技术,让假无所遁形 为了解决这个问题,学界与业界开始研究如何利用 AI 技术去反向图像、的真伪。 作为目前学术界最大的合成数据库之一,由慕尼黑技术大学的 FaceForensics 数据库涵盖了经过以上三种换算法编辑的公开,以供学术研究使用。

26420
  • 广告
    关闭

    直播应用9.9元起 即刻拥有

    9.9元享100GB流量,1年有效,结合移动直播SDK、美颜特效SDK及小程序直播插件等,构建云+端一体化直播平台,支持电商带货,在线教育,游戏直播,社交直播等多场景

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AI换率超99.6%,微软用技术应对虚假信息

    、合成是新型科技产品带来的新挑战。 从生成足以以假乱真的名不雅开始,很多使用者将这个“换神器”当成了造假工具,并通过社交网络将虚假信息(disinformation)传播到全世界。 事实上,大约 30% 经过 AI 换的合成照片、合成类仅凭肉眼无法识的,很容易被当作真实信息进行再次传播。这已成为一个亟待解决的社会性问题,面对这个问题,我们应该以及可以做些什? 以技术防御技术,让假无所遁形 为了解决这个问题,学界与业界开始研究如何利用 AI 技术去反向图像、的真伪。 作为目前学术界最大的合成数据库之一,由慕尼黑技术大学的 FaceForensics 数据库涵盖了经过以上三种换算法编辑的公开,以供学术研究使用。

    35720

    《甄嬛传》原班马“上演”性转女儿国,AI导的这出戏让网友直呼:还有多少惊喜是朕不知道的

    丰色 发自 凹非寺 量子位 | 公众号 QbitAI 看“四郎”陈斌和“嬛嬛”孙俪性反转,跳韩舞《Trouble Maker》是一种什样的体验? AI性反转有多真实 以上,全部来自微博博主“会火”和“二丁目怪兽”近期转载的两个作品,原版出自b站up主“电影画师-猎罪图”。 由于实在太逼真,大家的代入感太强,各种玩梗简直停不下来。 不过,还真有不明真相的朋友一开始还挺纳闷: “斌还没有孙俪高?” “孙俪可以这帅?” ……这足以证明AI技术有多高超。 长期关注技术的一眼就看出来这是用Deepfake搞的事儿。 在应用方面,奥巴马假、杨幂演朱茵、TikTok上一周吸粉32万的假“阿汤哥”……全球互联网最多的就是这类换明星的娱乐,博得大家饭后茶余的哈哈一笑。 而在几周前,央也曝光了出现在多地的AI换诈骗。 值得注意的是,如今制作一个冒充亲友的只需2-10元。 全民换时代的到来,大家也要注意甄了。

    7720

    论文Express | 谷歌DeepMind最新动作:使用强化对抗学习,理解绘画笔触

    大数据文摘作品 作者:龙牧雪 深度学习合成图像并不是什新鲜事。谷歌自己就做过SketchRNN,能识8条腿的猪有异常,输出4条腿的猪(戳这里看)。 不过这些都依赖于类输入数据的指导。 器能判断某图形是由Agent生成的,还是从真实照片的数据集中采样而来。 如果代理生成的图像成功地骗过了器,就会获得奖励。也就是说,奖励函数本身也是由代理学习得来,类并没有设置奖励函数。 根据谷歌放出的一个绘画,该方法在数字、物肖像的生成上,均取得了不错的效果。 谷歌绘画的 ▼ ? 同时值得注意的是,这里对绘画的笔顺并没有强调,只要画得像,就不管是画出来的了。 ? 在的真实数据集上,强化对抗式学习也取得了不错的效果。 谷歌称,教会工智能从对世界的观察中获得结构关系并表达出来,这是工智能类认知、概括和沟通能力的必由之路。

    41540

    卓伟:腾讯云融合技术构

    4月13日结束的计算机觉沙龙圆满落幕。本期沙龙从构图像识系统的方法切入,讲述腾讯云、文字识核身等技术能力原理与行业应用,为各位开发者带来了一场工智能领域的技术开拓实践之旅。 这有几个图片,比如这里三张图,一个小黄图,一个暴力图、一个政治敏感任务,用户接入后其实不需要关心审核自己的图片,融合的API自动集成了内容审核的黄、暴、政的能力,只要不合规的图片,都会拦截掉 image.png Q:融合的时候,多目标追踪呢?如果是有移动的时候,有交叉。 A:这里面有一个追踪的算法在里面,我可以追踪到你的移动轨迹。 Q:融合,速度是样的?用户的需要多少张?需要不同角度吗?你们这个DeepFake是算法识吗? A:的操作肯定是异步化的操作,耗时较久做成同步是不合适的,因为这涉及到的编解码、截帧、逐帧的检测和特征提取以及替换的过程,我们之前测过900多兆的编解码和截帧可能在3到4分钟,这大的耗时

    93350

    检测与识技术(新?)

    我们都知道,现实生活无论是照片还是,其中的都是在变的,通过镜头的远近,的尺度大小一直在变化,这种尺度变化问题就会导致检测识精度的降低,那现在我们就要针对该问题去解决它。 去解决呢??? 注:如下的方法可能已被大家知晓,但是希望通过这种思考问题的方式,给大家带来小小的灵感,也希望得到更多的指点,学习更过思考问题的方式,去解决更多的实际问题,谢谢支持! 首先,会想到,要不要立一个可变模型,去根据的结构去模,不同尺度大小的变化,必然会带来同等比例的缩放,犹如: ? 那该办??? 这就需要读者您自己慢慢去体会,去处理这方面的问题,也希望通过本次简单的介绍和分析,可以给有帮助的您带来一些解决! ---- 最后再给出一个检测与识的Demo! 注:屏因为压缩,会有些不清楚地方请谅解,还有个几处出现漏检和错检,后期我们会进一步修改,争取做出完美的检测效果,已达到实际的应用价值。

    86860

    造假术,你值得拥有

    我们现在可以政治家、名、演说家的片段,并且不论内容如何。 02 中级阶段:改头换面 在这个阶段里,AI就不是合成了,而是对里的内容进行编辑。 通过检测和五官识,对的关键点实时追踪,让们在动态中可以对自己进行改造。 ? 这一技术属于动作捕捉技术中的一个分支,叫面部捕捉。 AI让越来越多的都有能力进行伪造,但研究员也不断在开发更加精密的技术来增强音、图片和和。通过不断增加造假难度,使得非法分子造假的成本和技能要求越来越高。 现在,AI所做的伪造和处理其实并不难,模糊处理是一种最常见的方法,低分辨率就会让它“一看就是假的。” ? 除了画质,还有画幅的甄。在短里,画面里的一点改动凭借的肉眼是很难识的。 造假不如造回忆 仔细想一想,“造假”似乎总是让有着不好的联想,尤其是多媒体的造假,更是看都觉得可怕。然而,还是那句老话,技术是无罪的,有罪的是那些有着邪恶用心的

    25020

    十个生成模型(GANs)的最佳案例和原理 | 代码+论文

    1、让机器拥有想象力 神经网络对于物体的本质是“想”的? 为了搞懂这个问题,谷歌大脑的研究员使用GAN,让神经网络的“想法”呈现在你的眼前。当然,这些“想法”看起来十分迷幻。 了解物体运动和场景动力学是计算机觉中的一个核心问题。对于任务(如动作分类)和生成任务(如未来预测),需要构一个能理解如何进行转换场景的模型。 这些不是真实的,而是通过生成模型“想象”得来的。虽然看起来不够逼真,但根据训练时所使用的场景类,这些生成动作是合理的。 量子位之前也有过类似报道。 生成器不断学习来生成新的部图像,以愚弄器;反过来,器在竞争过程中可以更好地区分生成部图像和真实部图像。 然后对向量Y执行诸如加法和减法的算术运算,来单张图像,即向量Z是通过戴眼镜的男减去不戴眼镜的男,再加上不戴眼镜的女得到的。

    1.1K60

    AI版“造101”来了!出单曲拍电剧,真偶像失业危机?

    Deep Real技术可以通过工智能虚拟、物体、室内空间、生物以及虚拟自然环境等。现有的虚拟偶像多数是动画师长时间工设计,逐帧图像,打造AI。 然后,AI模型再通过提取关键帧,对齐等技术,让完美“融合”到原。这类仿真度高、欺骗性强,肉眼一般难以识真伪。 ? 2019年11月,我国发布了《网络音信息服务管理规定》,该规定明确指出:网络音信息服务提供者应当部署违法违规音以及非真实音的相关技术方案。 ? 2019年9月,Facebook宣布了全球Deepfake检测挑战赛,旨在号召研究员寻找“打假”的有效方法,提升的技术,维护和谐的网络环境。 随后,Google AI 开源 Deepfake 检测数据集,希望能帮助研究者找到更好的的方法。

    17320

    只要一张照片,说话唱歌自动生成,降维打击Deepfakes丨已开源

    呵呵,真棒,以后坏们被捏到把柄的时候,就都能说“没有的事啦,是假。” 多器结构 如何用一张照片做出连贯?研究员认为,这需要时序生成对抗网络(Temporal GAN)来帮忙。 在Temporal GAN中有两个器,一个为帧器,确保生成的图像清晰详细,另一个是序列器,负责响应听到的声音并产生对应的面部运动,但效果并不那优异。 ? ,使用两个时间器,对生成的进行听对应,来生成逼真的面部动作。 所以,最新版基于语音的合成模型来了。模型由时间生成器和3个器构成,结构如下: ? 帧器(Frame Discriminator)是一个6层的卷积神经网络,来决定一帧为真还是假,同时实现对说话面部的高质量

    1.2K40

    “跨国造假窝点”曝光!这个大规模数据集,帮AI揪出99%换

    有原始的输出RAW、高质量HQ(使用h.264,参数为23进行压缩)和低质量LQ(参数为40)。 效果样呢?肉眼很难分辨。 就算是不那精致的假类判断原始的平均准确率也只有72%,高质量71%,低质量因为相对模糊难以辨认,准确率只有61%。 有了足够多的数据,这个研究团队,就开始“以AI攻AI”,训练神经网络,那些被换AI处理过的假。 他们挑选了6个模型,用这些数据训练一遍之后,识造假的准确率都比类的肉眼高得多。 分是用来换的FaceSwap、deepfake,和用来换表情的Face2Face。 Face2Face和FaceSwap都是通过重面部的3D模型,并在3D模型中进行相应的编辑来完成造假。 其中FaceSwap是一个轻量级的编辑工具,使用比较稀疏的面部标记位置,将一个中的复制到另一个中的上。 相比之下,Face2Face的技术更加复杂,能够进行面部跟踪和模,从而来换表情。

    38830

    只要一张照片,说话唱歌自动生成,降维打击Deepfakes丨已开源

    呵呵,真棒,以后坏们被捏到把柄的时候,就都能说“没有的事啦,是假。” 多器结构 如何用一张照片做出连贯?研究员认为,这需要时序生成对抗网络(Temporal GAN)来帮忙。 在Temporal GAN中有两个器,一个为帧器,确保生成的图像清晰详细,另一个是序列器,负责响应听到的声音并产生对应的面部运动,但效果并不那优异。 ? ,使用两个时间器,对生成的进行听对应,来生成逼真的面部动作。 所以,最新版基于语音的合成模型来了。模型由时间生成器和3个器构成,结构如下: ? 帧器(Frame Discriminator)是一个6层的卷积神经网络,来决定一帧为真还是假,同时实现对说话面部的高质量

    49330

    国内第一案,我们来谈谈国外法规和隐私保护技术

    从抗议滥用,到呼吁相关法律法规设也是必然。 据了解,“Deepfake挑战赛”的目标是,找到一款能检测是否被换过的工具,并且它能被每个便捷操作。 该公司了针对照片和的类似 Twitter 的账户验证系统,在照片被拍摄时将照片打上“正版”的标记。 用区块链技术假图片和假 能够用技术来解决技术问题的,不只有AI,区块链技术同样也能解决假图片问题。 通过这些信息,媒体和用户可以判断出该图片是否经过PS等为修饰,进而判断相关资讯真伪。 除了假图片,区块链技术还能

    73020

    国内第一案,我们来谈谈国外法规和隐私保护技术

    但是,在今年8月,支付宝刚刚宣布投资3亿普及刷技术后,就有发布了一个测试,在中,工作员使用3D打印制作的蜡像头,骗过支付宝的系统,成功买到了一张火车票。 ? 据了解,“Deepfake挑战赛”的目标是,找到一款能检测是否被换过的工具,并且它能被每个便捷操作。 该公司了针对照片和的类似 Twitter 的账户验证系统,在照片被拍摄时将照片打上“正版”的标记。 用区块链技术假图片和假 能够用技术来解决技术问题的,不只有AI,区块链技术同样也能解决假图片问题。 通过这些信息,媒体和用户可以判断出该图片是否经过PS等为修饰,进而判断相关资讯真伪。 除了假图片,区块链技术还能

    61330

    Recorder︱一些图像识公司产品及API搜集ing...

    )、辨识、相似搜索、分组 7、中的图像技术 抖动的自动进行平滑和稳定处理、使用具有高精度的位置检测和跟踪功能来分析,可在一个中最多检测 64 张、测在静态背景的中发生运动的时间 此服务将分析检测到帧运动的输入并输出元数据,还可定义运动发生时所在的精确坐标、自动运动缩略图摘要,让们快速预览你的 . . 3、图普科技(图像识) 国内最大的图像识云服务平台,每日处理数亿的图片及内容。李明强是微信始团队成员之一,曾带领团队打造出QQ邮箱。业界最专业的智能图片黄师。 9、依图科技依图:与您一起构计算机觉的未来 大数据智慧平台 10、tu Simple图森 我们提供最佳的自动驾驶解决方案 11、飞搜 打造最好的在线引擎,提供了校验、属性分析、目标场景识 语音转化 可替您将文字转成语音、文字转成方言(真语音),识语音、歌曲等。 可以为您完成内容收集,字幕识内容定等内容。

    1.6K100

    用GAN还原语义标注图!还能手动改细节

    到底是一回事?上车,我们前去看看论文。 效果惊 有一个官方演示—— pix2pixHD具有通过语义标注的图像还原到现实世界的能力,并且还能根据需要轻松修改和搭配图像。 在中可以看到,你可以一键更换车辆的颜色和型号,改变街道的类型,甚至还可以移除图像内景物甚至增加图像中的树木。 一张语义地图背后,是丰富的现实世界。 和街景类似,根据语义标注的图像,我们可以选择组合物的眼睛、眉毛和胡须等五官特征,还能在标注图上调整五官的大小。 无论是在街景中增加和减少物体,还是改变的五官,都是通过一个可编辑的界面完成的。 多尺度器 高分辨率图片不仅生成起来难,让计算机真假也难。 要高分辨率图像是真实的还是合成的,就需要一个感受野很大的器,也就是说,要用很深的网络,要用很大的卷积核。

    49360

    在阿里“解放”黄师是一种样的体验

    文字时,我们还能通过关键词或者变体词汇来审核,但是对待图片,完全没有能力,都靠工。”薛晖对宅客道说。 所以,接下来宅客道要讲述的是十年 AI 大佬如何从“解放”黄师起步的故事。 ? 所有这些特征的权重组合通过机器学习模型决定,也因此,机器通过颜色、纹理、形状来识黄图,大量肉色的沙发、地板会被“无辜牵连”,机器黄也只能识正经的苍老师,动漫版、大幅度倾斜的小黄图无法识。 从阿里内部跳出来看,“绿网”的竞争对手并不是传统意义的巨头企业,而是各类做计算机觉、自然语言处理的独角兽和业公司。 没什的好办法,只有不断在标准化、通用性、技术先进性上打磨产品。 对薛晖而言,更多技术的落地并没有那容易。光拿下阿里杭州园区的门禁,他们就费了一番力气。园区的行政部门的同事对使用门禁刷有顾虑: 识率到底高不高?园区里这,误识办? “30 个员牺牲,这代价是非常大的,我女儿小学班的家长里有是消防员,曾经组织过小学生和家长去参观消防队工作,所以我也特想到这个点,这是非常重要的工作,我们身边也会有在做这件事情,我有时候在想

    70420

    相关产品

    • 换脸甄别

      换脸甄别

      换脸甄别(ATDF)技术可鉴别视频、图片中的人脸是否为AI换脸算法所生成的假脸,同时可对视频或图片的风险等级进行评估。广泛应用于多种场景下的真假人脸检测、公众人物鉴别等,能有效的帮助支付、内容审核等行业降低风险,提高效率。

    相关资讯

    热门标签

    扫码关注云+社区

    领取腾讯云代金券