专栏首页Jack-Cui这些 AI 算法太强了,我有个大胆的想法!

这些 AI 算法太强了,我有个大胆的想法!

好久没有推荐有趣的算法了,今天 Jack 再带大家逛逛「AI 乐园」,看看最近新出了哪些新奇好玩的 AI 算法。

一、深度估计

不知你有没有发现,最新的视觉技术研究,多了很多 3D 相关的工作。

深度估计就是其中之一。

Facebook 的最新一项研究,根据视频帧序列,就可以稳定地估计图像的深度

图像深度信息有了,就可以做很多有意思的视频特效:

水漫金山」、「漫天飞雪」、「金星环绕」。

论文提出了一种重建单目视频中所有像素密集、几何一致性深度估计算法。

比以往的单目深度估计方法具有更高的精度,同时结果更加稳定。

代码开源,盘它

项目地址:https://github.com/facebookresearch/consistent_depth

二、Wav2Lip

AI 技术可以撑起鬼畜视频的一片天。

Wav2Lip,算法如其名,Wav 音频转嘴唇 Lip。

就是字面的意思,给算法一个音频文件,算法可以让视频里的人物,将这段话自然地念出来

任何人物身份,甚至包括卡通人物,任何语音和语言,都可以将口型视频高精度同步到任何目标语音。

这位老哥甚至还为小白量身打造了网页 Demo,上传音频和视频就可以体验。

网页地址:https://bhaasha.iiit.ac.in/lipsync/

对于有一定编程基础的,可以去 GitHub 下载源代码,只要有你想鬼畜的人的照片或者视频,再输入一段文字,就能合成你想要的视频了。

比如来一段「特朗普热爱中国宣言」,是不是就突然来了灵感。

天啊,我脑海里浮现了好多大胆的想法

有个 Wav2Lip 还不算完,还有个 Lip2Wav

我们可以理解为 AI “读唇术”。

视频的声音没了,Lip2Wav 帮你生成。

根据画面嘴唇的动作,进行“读唇”,给你音频结果。

值得注意的是,Lip2Wav 和 B站 那些机械风格的鬼畜调音不一样。

这个 AI 效果炸裂,你几乎感觉不到是机器配音,就像人类在发言一样。

算法原理就是根据面部特征,对唇部进行编码,再使用 LSTM 进行音频合成。

Wav2Lip 和 Lip2Wav 都有开源代码。

来吧,翻牌子,喜欢哪个点哪个。

Wav2Lip 项目地址:https://github.com/Rudrabha/Wav2Lip

Lip2Wav 项目地址:https://github.com/Rudrabha/Lip2Wav

三、HiFiC

没做过网站的朋友可能不知道。

图片的大小,太影响网页的加载速度了。

过多过大的图片,可能让你的页面加载,就像老太太吃硬饼一样,得慢慢磨。

还在为图像加载犯愁吗?

最新的好消息是,谷歌团队采用了一种 GANs 与基于神经网络的压缩算法相结合的图像压缩方式HiFiC,在码率高度压缩的情况下,仍能对图像高保真还原。

下面是这种算法展现出来的图像与 JPG 格式图像的对比。

左边是 HiFiC 算法压缩效果,右边是同等体积 JPG 格式图片的效果。

可以非常明显地看到,HiFiC 算法压缩的图片要清晰太多了。

代码还没有开源,但是作者老哥说「快了,快了,这次一定!」

想要体验的小伙伴,直接网页走起!

项目地址:https://hific.github.io/

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 我有一个大胆的想法!

    一款名叫“Pluribus”的AI扑克牌机器人在六人无限制德州扑克这项复杂游戏中,碾压了人类职业选手!——这是AI机器人首次在规模超过两人的复杂对局中击败顶级人...

    量化投资与机器学习微信公众号
  • 程序员欢乐送(60):我有一个大胆的想法!

    一直保持的追求有三点:技术、快乐、财富,这里记录每周值得分享的内容,周五把欢乐送达。

    Jack_Cui
  • 视线估计实战,卧槽,我有一个大胆的想法!

    大家好,我是程序员啊潘。今天要分享一个有趣的实战项目——视线估计,一个相对小众的研究方向,但是未来大有可为。

    AI算法与图像处理
  • 一个22万张NSFW图片的鉴黄数据集?我有个大胆的想法……

    内容审核在很多领域都有非常重要的作用,它不仅需要通过分类器识别图像或其它数据不适合展示,同时还能结合语义分割模型对这些限制级图像进行处理(Mask 掉敏感部分)...

    机器之心
  • 我有个大胆的想法,用风格迁移玩《绝地》版的《堡垒之夜》

    本文旨在了解如何将 CycleGAN 用于风格迁移并探索其在游戏图形模型中的应用。

    机器之心
  • 18岁华裔女孩联合斯坦福开发AI评估外科手术,获NIPS workshop最佳论文

    18岁的Amy Jin刚从高中毕业,她热爱街舞、小提琴和英国文学。但她对计算机科学的无比热爱使她成为飞速发展的人工智能领域的超级明星。

    新智元
  • 柯洁说“输得没脾气”?8个问题解读人机大战第一局

    AI科技评论消息,经过四个多小时的对弈,柯洁以四分之一子之差败给了AlphaGo。 比赛后,曾参与训练AlphaGo的棋手樊麾,与围棋九段常昊一同回顾了整个对弈...

    AI科技评论
  • 洪小文独家解读: 直到AI可以自己编程,它才有资格跟 “路人甲” 比智能

    一种普遍被认同的观点是:AI的发展速度会是指数式的,可能现在它看起来还很蠢,但是在你意识到它已经变强之前它就会越过那个“奇点”,迅速超过你,然后将你远远的甩在后...

    AI科技评论
  • 姚期智:量子计算只剩最后一里路;霍金:人类最好移民外太空

    李林 假装发自 北展 量子位 出品 | 公众号 QbitAI 一年一度的腾讯WE大会,今天下午正式开讲。多位中外科学领域的学者登台演讲,分享前沿的科技思想和技术...

    量子位
  • 斯坦福报告:至少现在不用过于担心人工智能取代你的工作

    “人工智能取代人类工作”之类的新闻大标题常常让我们惊出一身冷汗。不过,至少现在你不用过于担心,因为它还处在发展水平最低的阶段。 无论是击败人类顶级围棋手的Alp...

    企鹅号小编
  • Science:AI 相互协作首次战胜人类,机器学习算法学会了“忠诚”

    【新智元导读】人工智能在象棋、围棋甚至扑克等“零和”博弈中都已经超越人类,但迄今对机器相互“合作”以取得所有人利益最大化的研究不多。杨百翰大学的这项研究发现 S...

    新智元
  • 关于人工智能,斯坦福报告说了你不知道的事,金融从业者更应注意

    “人工智能取代人类工作”之类的新闻大标题常常让我们惊出一身冷汗。不过,至少现在你不用过于担心,因为它还处在发展水平初级的阶段。无论是击败人类顶级围棋手的Alph...

    企鹅号小编
  • 【趋势】世界领导人决定:人工智能的下一步是增强人类

    ? 想想人类的增强还需要几十年的时间吗?还是再想想吧。 上周,政府领导人在迪拜世界政府峰会之前会见了专家和创新者。他们的目标?确定AI的未来。 这一事件吸引了...

    AiTechYun
  • 让画面更逼真!这个强化超分辨率GAN让老游戏迎来第二春 | 代码+论文+游戏MOD

    近期就有一群资深游戏玩家,用增强型超分辨率生成对抗网络(ESRGAN)做出了经典游戏的高清化MOD。

    量子位
  • 有了它,AI甚至可以让你知道对方是否真的爱你?

    “你到底爱不爱我?”这或许是恋爱双方出现频率最高的问题,想要知道对方大脑在想什么,并不是什么天方夜谭,通过科学技术还真的有望实现。不过,让如此大胆的想法变为现实...

    AI科技大本营
  • 机器学习、人工智能与网络安全的未来

    如果不是因为黑客也同样拥抱了这些技术,AI和ML真有可能成为网络安全团队真正的游戏规则改变者。这意味着,尽管AI和ML在网络安全解决方案中占比越来越大,它们却也...

    安恒信息
  • 川普的退休生活?不,是AI算法的宅舞演绎。

    给定一张或者多张人物 A 的图像,和一段人物 B 的视频,就可以通过动作迁移算法自动合成一段人物 A 做任务 B 动作的视频。

    Jack_Cui
  • 周末想围观人机德扑大赛?这有10条观(zhuang)战(bi)指南

    大数据文摘
  • 15个未来高科技产品会让你无法想象!这些开脑洞的设计太牛了!

    导读:从衣食住行到生活的方方面面,未来必将会有天翻地覆的变化。大数据、云计算、物联网和人工智能这些年的发展,让我们对并不遥远的未来有了更多想象和期待。那些我们现...

    华章科技

扫码关注云+社区

领取腾讯云代金券