萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 用AI搞视频编解码器,现在路子有点“野”。 插帧、过拟合、语义感知、GAN……你想过这些“脑洞”或AI算法,也能被用到编解码器上面吗? 例如,原本的算法每帧压缩到16.4KB后,树林开始变得无比模糊: 但在用上GAN后,不仅画面更清晰,每帧图像还更小了,只需要14.5KB就能搞定! 又例如,用插帧的思路结合神经编解码器,能让最新压缩算法效果更好…… 这一系列算法的思路,背后究竟是什么原理,用AI搞编解码器,潜力究竟有多大? 我们采访了高通工程技
这段经典的出场画面,来自于 1983 年徐克执导的《蜀山:新蜀山剑侠》,是林青霞的第一部武侠作品。在传统武侠功夫片的内核之中,导演注入了天马行空的想象。这也是港片拍摄中,第一次邀请到好莱坞《星球大战》特效小组支援特技镜头的作品,很多特效制作在当时显得十分前卫和大胆。
《火车进站》是人类历史上的第一部电影,由路易·卢米埃和奥古斯特·卢米埃于 1895 年拍摄于法国一沿海城市,整部电影只有45秒。
视频的帧率已经远远赶不上人民群众的需求了,所以有不少人都在研究如何把普通视频变成高帧率视频。
随后,就是电影《上甘岭》的女主角玉兰上场,虽然看上去未施粉黛,但一点不逊色于今天的女明星~
首先,一位“中国”戏法师举着油纸伞扇着扇子、迈着轻快的小步快速登场,晃悠好几圈之后开始“施法”,biu,一张凳子,biu,又变出一张凳子。
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 一周不到,AI画师又“进阶”了,还是一个大跨步—— 直接1句话生成视频的那种。 输入“一个下午在海滩上奔跑的女人”,立刻就蹦出一个4秒32帧的小片段: 又或是输入“一颗燃烧的心”,就能看见一只被火焰包裹的心: 这个最新的文本-视频生成AI,是清华&智源研究院出品的模型CogVideo。 Demo刚放到网上就火了起来,有网友已经急着要论文了: CogVideo“一脉相承”于文本-图像生成模型CogView2,这个系列的AI模型只支持中文输入,外国朋
内容提要:为了解决视频画面卡顿、不够顺畅等问题,视频插帧大法应运而生。英伟达提出的 Super SloMo 方法在众多方法中一骑绝尘,对于一段普通设备录制的视频,能「脑补」出高帧率慢动作视频。有了这一神器,视频制作的门槛得到进一步降低。
自修复100年前的北京影像后,微博博主@大谷Spitzer这次又用AI工具,复原了民国时期的这场「花生骚」(Fashion Show)。
hi,大家好~我是shadow,一枚设计师/全栈工程师/算法研究员,目前主要研究方向是人工智能写作和人工智能设计,当然偶尔也会跨界到人工智能艺术及其他各种AI产品。
不久前,我们为大家介绍了腾讯明眸这一利用腾讯云领先的编解码和媒体处理技术与AI技术融合打造而成的音视频技术品牌(攻城狮手记 | 既高清又低码?腾讯明眸帮你两者兼得)。接下来我们将通过三期文章,从AI智能处理、编解码优化和容器格式优化三个方面,进一步解读分享腾讯云音视频-明眸研究团队在多媒体领域前沿技术方面积累的经验和成果。 本期我们将先从深度学习AI画质增强开始,为大家分享腾讯明眸在AI方向上的探索及思考。 腾讯明眸核心能力展示 目前我们在画质增强的工作上通过结合深度学习网络,针对性的提出了一些
虽然和真正的高速摄像机至少上千的帧数没法比,但它完全可以做到每秒53帧的视频轻轻松松变成960帧,没有伪影也没有噪声。
近日,这段使用人工智能修复老北京影像的视频在 B 站和微博上火了,引起了极大的关注。仅在 B 站上,阿婆主「大谷的游戏创作小屋」上传的这个旧影像修复视频已经获得 61.9 万的播放量、4.9 万点赞。
正文字数:4204 阅读时长:6分钟 AI就像一个加速器,正在渗透在多媒体应用的方方面面,改进甚至颠覆传统的图像视频处理方法。本文整理自腾讯云高级研发工程师刘兆瑞在LiveVideoStackCon 2020北京站上的演讲,将从超低码率压缩场景下AI技术在前置处理中的优化、AI技术的画质修复探索以及智能编辑场景的落地实践三个方面展开。 文 / 刘兆瑞 整理 / LiveVideoStack 大家好,首先非常荣幸有机会收到LiveVideoStack邀请来和大家分享腾讯视频云在AI视觉上的落地实践与
大家好,首先非常荣幸有机会收到LiveVideoStack邀请来和大家分享腾讯视频云在AI视觉上的落地实践与应用,以及AI视觉泛化应用过程遇到的机遇和挑战。
说来你可能不信,在晚上不扶不行(栏杆)的羊肠小径,刚刚这个「可以打电话的相机」竟然还能拍视频。
近日网上的一个迈克尔杰克逊代表作《Smooth Criminal》MV官方高清修复版,的视频赚足了大家的眼球。这次的高清修复不仅分辨率达到了4K,原本的25帧录像也提升到了60帧。逼真得甚至可以看清MJ领带上得问题,完全就像是使用现代设备拍摄的一样。
这意味着我们玩手机的时候,同时“多开”几个AI应用也没问题。更重要的是,它不仅仅是简单的AI性能提升,更能给用户带来流畅的应用体验感。
内容提要:油管上一位 Up 主,修复历史视频上了瘾。目前,他已经利用 AI 技术修复了百年前的纽约、东京等地的街头视频。继上次感受百年前老北京街景之后,让我们穿越到百年前的东京、纽约街头看看吧!
机器之心报道 作者:杜伟 与传统编解码相比,AI 赋能编解码能带来哪些方面的增益?高通又在这方面做了哪些技术创新和应用?近日,机器之心在与高通工程技术副总裁、人工智能研究方向负责人侯纪磊博士的访谈中,得到了这些问题的答案。 随着通信和互联网技术的进步,特别是智能手机的普及以及 4G、5G 移动通信技术的成熟与发展,语音视频聊天、视频游戏等多样化的休闲娱乐方式层出不穷,普通用户对语音与视频的消费需求也在不断增长。 2020 年《思科可视化网络指数:预测和趋势(2017-2022 年)》报告和 WhatsAp
后来,这个项目另外一个up主做了。显而易见的是,越来越多的企业,在结合 AI 做一些有意义的创新。
前言 人工智能(AI)、深度学习和自然语言处理将成为新一代流媒体行业的关键技术。从生产到消费的各个阶段,它们都将产生非常重大的影响。毫无疑问,随着人工智能在许多不同行业的逐步深入,它也将被更广泛地应用于流媒体领域。 近年来,一些公司已经取得了重要的进展,包括Google云视频智能API,Conviva的视频智能架构,NVIDIA DLA和IBM Watson技术。所有这些技术都在不同程度上部署了AI,尤其是在云计算领域。另外,我们很快也会看到AI被应用于流媒体的其他方面。 人工智能可以用来取代很多人力资源,
近期,《长津湖》电影将大家带回了抗美援朝那年,当画面一帧帧浮现在眼前时,让人忍不住追忆过去、思念故人… 长津湖战役中,中国解放军奋勇杀敌的画面,实在是赚足了小编的眼泪ಥ_ಥ 战乱夺走了多少条生命,拆散了多少个家庭?让我们向中国军人致敬!!!
机器之心报道 机器之心编辑部 近两年来,还没有过一款国产芯片像 V1+ 一样让人如此期待。 你有多久没换手机了? 不知何时开始,在旗舰手机的发布会上,各家厂商都会着重强调芯片的功耗调教能力。由于制程工艺停滞等原因,2022 年的手机芯片性能提升有限,甚至出现功耗持续升高的情况,旗舰手机陷入了同质化竞争的困境,销量比起往年降低了不少。 对于各家大厂来说,在硬件参数上的内卷收效越来越低。打造差异化能力的「独立自研影像芯片」是最有希望的方向。 手机自研芯片是一条高风险高回报的路,但除了华为麒麟,我们仍然很少看到
腾讯云音视频画质增强研究团队专注于多媒体技术领域的前沿前沿技术探索、研发、应用和落地。今天的新知系列课,我们邀请到了来自该研究团队的技术导师 —— 陈铭良,为大家介绍他们团队在媒体画质增强工作上的一些方法积累和能力优势。目前他们在画质增强的工作上积极跟进前沿的深度学习算法,并针对性的提出了一些适合于落地的解决方案。通过数据驱动的自动建模和基于AI的媒体处理,部分方法的效果已经超过了当前学术上的state-of-the-art,领先于竞品。 接下来的几周,每周四晚上7:30,我们都会在腾讯云音视频视频号
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 朋友,你是否也和我一样,为了《Apex英雄》上线PS5已苦等一年半? 那是否也和我一样,在年初听到《Apex英雄》PS5版本被曝出时,迫不及待地购买了4k 120Hz电视和PS5设备? 所以,你一定也听说了前不久《Apex英雄》真的上线PS5的大消息: Emm……看到这个推送后,我当场就愣了。 这是什么?最高只支持4k 60Hz?? 就连一年以前上线PS5的《彩虹六号·围攻》都推出了4k 120Hz版本,你《Apex英雄》磨蹭一年半就给我搞了个这
7月20日是阿波罗登月51周年。1969年7月20日,尼尔阿姆斯特朗成为登月第一人,他在月球上迈出的一步是令人难以置信的一步。
想必你已经猜到了,这样的「魔法」依然是由AI带来,涉及的技术包括图像生成、运动估计等等。
2024年4月27日,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu[1]。本文将对标Sora大模型、国产“类Sora”大模型等,详细介绍新兴国产大模型Vidu的背景、成果、架构等相关知识。
英伟达40系列的RTX 4080从11月16日起正式发售,显存只有一种大小:16GB。
AI 前线导读:视频包含了图像、声音、文字等多种信息,可以表达生动、丰富的内容。随着 AI 时代的带来,互联网视频应用高速发展,视频更成为一种人人可生成的内容,数据量暴涨。如何利用机器学习将海量的视频内容充分利用起来,成为 AI 领域研究人员和企业开发应用的重要课题。本文,我们将分享爱奇艺资深科学家王涛在 AICon 上的精彩演讲,介绍爱奇艺在大规模视频分析理解方面的实践探索。更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)
本期的技术解码 为大家带来腾讯云视频插帧技术的详细解析 随着信息科技与互联网技术的高速发展,视频已逐渐成为人们获取信息的重要来源。为了提升人眼的视觉主观感受,各大厂商的视频采集和播放设备的性能也得到了飞速发展。视频的帧率作为视频质量的一个重要指标,对人眼的主观感受也影响良多。但是高帧率的视频对网络传输带宽、传输设备等的要求也随之增高。因此,为了降低成本,实现对低帧率(Low Frame Rate)的视频适时进行帧率增强是目前视频行业研究的热点问题。另外,针对现存低帧率,网络传输丢帧的视频做插帧增
这里,推荐使用历史版本的potplayer64,因为新版本的功能有点多余,https://www.videohelp.com/download/PotPlayerSetup64-1.7.16291.exe
分辨率从 480p,720p,再到 1080p,现在有了 2K、4K;帧率也从 25FPS 到 60FPS,再到 240FPS,960FPS 甚至更高……
大家好,今天要介绍的是最近出现的一篇关于文本驱动的视频编辑工作NVEdit(Neural Video Fields Editing)。
IFRNet: Intermediate Feature Refine Network for Efficient Frame Interpolation
https://github.com/DWCTOD/ICCV2021-Papers-with-Code-Demo
今天看见箱子里的开发板,就拿出来又玩了~按照官方的课程走一遭。 在联网上面2G的版本没有网卡,我就插网线了。。。 📷 记得分享网络的时候是,WLAN给有线连接 📷 连接之后ping一下,成功 📷 看看ip 📷 看看我能不能读取到 📷 然后ping一下jetson的ip 📷 可以直接SSH连接哦 https://www.nvidia.com/en-us/training/ 📷 课程的位置 📷 需要登录 📷 需要的硬件 摄像头可以使用USB的 📷 这里给出来所有的配件 📷 穷人配置系列 📷
视频、声音、图片是我们日常生活中最常见的三种数据载体,音视频主要处理的也是这三种数据。音视频完整的技术栈是关注这些数据从产生到消费的完整流程,从视觉上、听觉上、感觉上给大家最好的体验。
过去的点点滴滴组成了今天的我们,有一些分离不小心成了永别,老照片承载了一个普通人沉甸甸的过去和回忆。但是随着岁月流逝,老照片逐渐老化腐蚀,珍贵的记忆就要随之离去。
---- 新智元报道 编辑:桃子 如願 【新智元导读】穿越千年之前,外国博主借用AI技术让秦代兵马俑「活了过来」!|融合生态 价值共创——「2022新智者大会」开启,诸多业界大咖,精彩分享不间断!点击预约👇🏻 千年一瞬,他们眨眼的瞬间,仿佛历史重演。 前不久,外国博主Panagiotis Constantinou用AI修复了秦代兵马俑。 更令人惊艳的是,他还让古人做出了细微的动态表情。 快看,兵马俑在向你眨眼、微笑。 去过兵马俑后,大家都会对这些泥塑真人古迹的感到震撼。再看用AI复原后的兵马俑,
今天小编给大家介绍一个AI黑科技,能够完美融合任意两张人脸,并带有丰富的表情,让你不仅凡尔赛地炫个技,还能巧妙风趣地表个白:我觉得咱俩挺合适,可以一起为人类向更美的方向进化作出杰出贡献。
👆点击“博文视点Broadview”,获取更多书讯 深度学习伴随着大数据与云计算技术的崛起而快速发展起来,并在计算机视觉、语音等感知领域迅速取得成功。相对于传统机器学习,深度学习的算法设计更加灵活,可以显著提升针对感知类问题的效果。 随着算力及分布式工程能力的进一步提升,深度学习的参数规模越来越大。可以说,参数越多,模型对知识的理解就越深刻。而深度学习模型也从传统的针对单一任务,比如文本识别、物品识别、语音识别等,向多任务处理发生转移,我们称这种一个模型可以同时处理文本识别与理解、图片识别与理解,实现跨领
曾修复100年前老北京原声录像的up博主 @大谷Spitzer 再次用AI复原了百年前的上海时装秀!通过人工智能完成了上色、补帧、扩大分辨率的步骤。
今天的新知系列课,我们邀请到了来自腾讯明眸·极速高清团队的技术导师 —— 刘兆瑞,为大家介绍腾讯云音视频在视频编码优化以及工程落地上的一些新的方向。本次分享分为4个部分,包括当前媒体处理的行业趋势 ,腾讯明眸产品介绍,腾讯明眸·极速高清技术方案及其优化演进之路以及极速高清方案的未来发展之路。 本周五晚上7:30,我们将会在腾讯云音视频视频号、开源中国、InfoQ、51CTO、云+社区等多个平台进行第六期课程的直播,大家千万不要错过哦~ - 当前媒体处理的行业趋势 - 腾讯视频云作为头部云厂商,服
分享一篇来自CVPR2024的视频插帧工作《Perception-Oriented Video Frame Interpolation via Asymmetric Blending》。
MMEditing 是面向底层视觉任务的工具包,属于 OpenMMLab 开源算法体系。近期,我们在 MMEditing 中拓展了一个新的方向:视频插帧。本文将简要介绍视频插帧的技术原理,并带大家使用 MMEditing 实现一个视频插帧的 Demo。
// 编者按:AI技术的落地是渐渐地从服务器端、云端落地,逐步到移动端及边缘设备上。这些年随着AI技术的进步,轻量级算法模型开始在移动端实时跑起来,并且移动端算法也在不断进行迭代和完善,而对于实时直播场景,也有越来越多的AI算法落地。ZEGO即构科技提出了一套极轻量级AI算法模型,结合移动端硬件特性,差异化优化前馈推理库,让算法模型、推理库、硬件成为一体,使得视频云转码移动端化成为可能。LiveVideoStackCon 2022音视频技术大会上海站邀请到了即构科技的李凯老师,为我们分享产品架构、移
领取专属 10元无门槛券
手把手带您无忧上云