首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

业界 | 实时替换视频背景:谷歌展示全新移动端分割技术

视频分割是一项广泛使用的技术,电影导演和视频内容创作者可以用该技术将场景中的前景从背景中分离出来,并将两者作为两个不同的视觉层。...今天,通过将该技术整合到 stories,谷歌宣布将给 YouTube app 带来精确、实时、便携的移动视频分割体验。...目前仅限于测试版本,stories 是 YouTube 的新轻量视频格式,是特别为 YouTube 创作者而设计的。...该新型分割技术不需要专业设备,让创作者能方便地替换和修改背景,从而轻易地提高视频的制作水准。 ? 在 YouTube stories 中实现神经网络视频分割。...使用高准确率设置时(在验证数据集上达到 94.8% IOU),它在 iPhone 7 上可以达到 100+ FPS,而在 Pixel 2 上可以达到 40+ FPS,在 YouTube stories

1.7K90

youtube的AV1部署情况

AV1部署在youtube之后已经累计服务了超过五十亿小时,并且其使用预期将会猛增到1080p内容的1QPS(每秒点击量,换算下来为每天超过80k次访问),将要覆盖youtube视频观看中的很大一部分,...在性能方面,youtube使用了混合格式,也就是部分分辨率使用VP9,部分使用AV1。具体实现使用了web中的SourceBuffer.changeType(),浏览器将会自动切换解码器。...然后演讲者介绍了他们确定切换分辨率的两个判据,一个是丢帧,另一个是non-networkrebuffer。后者是浏览器发生等待事件的明确标志,或者是在媒体有超过5秒的缓存时无法推进现在时间的标志。...youtube会对用户对视频质量的要求进行建模,从而有针对性的选择给他们的视频分辨率,防止用户因用掉了过多流量而停止观看。...即使如此,影响也不大,因为据统计,移动平台上只有2%的视频在起始时小于等于480p而结束时大于等于720p。

1.9K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    谷歌送上主播福利,手机拍视频实时换背景

    YouTube stories 中的神经网络视频分割(加特效) AI 科技评论按:视频分割是一项用途广泛的技术,把视频的前景和背景分离之后,导演们、视频制作者们就可以把两者作为两个不同的视觉层,便于后续的处理或者替换...不过,以往复杂的背景分割工作,现在仅仅靠一台手机就可以完成了!谷歌今天在 YouTube app 中的 stories 里集成了一个新的视频分割功能,在手机上就可以准确、实时地分割视频的前景背景。...这个功能是专门为 YouTube 视频作者们设计的,在目前的 beta 版中 stories 作为新的轻量级视频格式,可以让视频作者们替换以及更改视频背景,不需要专门的设备就可以轻松增加视频的创作价值。...变换过的图像:对视频的原始图像做薄板样条平滑,模拟摄像头快速移动和转动时拍摄出的画面 演示实时视频分割 网络架构 根据修改过的输入/输出格式,谷歌的研究人员们以标准的沙漏型分割网络架构为基础,做了如下改进...: 使用大卷积核、4 或者更大的大步距在高分辨率的 RGB 输入帧内检测物体特征。

    1.1K40

    视频一键拆分PS层!DeepMind新模型效果碾压同级,物体、背景完美分离,还能脑补

    视频数据中通常会包含动态世界中的复杂信号,比如相机运动、关节移动、复杂的场景效果以及物体之间的交互。...现有方法在推断对象及其效果之间复杂的时空相关性时,只能处理静态背景或带有精确相机和深度估计数据的视频,并且无法补全被遮挡区域,极大限制了可应用范围。...Lumiere inpainting模型对原模型进行微调,输入条件为「遮罩的RGB视频」和「二进制掩码视频」,然后使用相同的SSR,以实现高分辨率质量。...为了获得干净的背景视频,再使用一个背景三元掩码,将所有物体都标记为需要移除的区域,背景标记为可能需要修改的区域。...对象粘贴(Object-Paste),从YouTube-VOS数据集中的真实视频合成了1024个视频元组,使用SegmentAnything2从随机视频裁剪对象,并将其粘贴到目标视频上。

    6800

    INFOCOM 2023 | 基于多核的移动设备上的节能 360 度视频流

    这是因为,在现代移动设备中,由于使用了许多硬件加速器,如硬件解码器、GPU等,大部分360°视频处理中的重型计算都由硬件加速器处理。由于360°视频的分辨率较高,视频处理消耗了大量的能源。...每个视频段被编码为V个副本,对应于V种不同的质量(即,不同的视频分辨率和编码比特率)。例如,与YouTube的常见设置类似,视频被编码为八个质量级别。...让Tkv表示第k个任务,其中视频段以质量级别v编码(v ∈ {1, 2, ..., V})。让Bk表示当客户端请求第k个视频段时,缓冲区中已下载但尚未查看的视频的视频长度(以秒为单位)。...视频的比特率对应于YouTube中的常见视频分辨率,即{144p, 240p, 360p, 480p, 720p, 1080p, 1440p, 2160p}。...此外,作者还发现默认的CPU管理器即使在处理低分辨率视频时也会将CPU设置为高频率,这会消耗更多的能源。

    39750

    AV1和开放媒体联盟(AOM)的发展、成果与未来

    开源编解码技术的背景 十多年前,谷歌推出了两个项目,旨在改善互联网的媒体体验。 谷歌首先启动的第一个项目是WebM,该项目旨在开发免版税的开源视频编解码技术。...随后不久启动了WebRTC项目,为视频会议等应用程序推出了开源免版税的IP通信栈。...即使是最好的新视频标准,也只有在可以应用到所有创建和使用视频的工具和设备上时才有用。...YouTube支持8K视频,而这些8K视频仅在AV1中可用。 让我们来看看YouTube上一次添加新编解码器支持时发生的事情。它在2013年添加了VP9视频编解码技术的支持。...所以,当开始推出AV1时,我们的计划是沿用VP9走过的路,通过AV1在新兴市场提高分辨率和流畅播放,同时在网络连接更好的地区制作高分辨率视频并降低流媒体成本。

    96830

    2D图片3秒变立体,变换视角流畅自然:Adobe实习生的智能景深算法,登上顶级期刊

    完全不是简单的缩放 透视原理决定,前景比背景的移动/缩放更剧烈。 所以,前景移动的时候,背景除了移动,也要跟着修复。 AI的背景修复十分自然,手法明显比“前辈”更高超: ?...不过,这里又会出现一个新的问题——当虚拟摄像机向前移动的时候,对象本身会产生裂隙(下图中高塔右侧像被网格切开了)。 ? 为了解决这个问题,研究人员采取了结合上下文感知修复的方法。...他们在YouTube上搜集了30个人类创造的3D Ken Burns视频,将其分成“风景”,“肖像”,“室内”,“人造室外环境”四组,每组随机抽取三个视频作为样本。 8位志愿者参与到了这个测试之中。...团队为每个志愿者分配了一张静态图,并提供了人类作品作为参考,要求志愿者使用新方法和Adobe After Effects模板、移动App Viewmee这两种Ken Burns制作工具创作类似的效果。...Simon Niklaus在Hacker News上与网友互动时也谈到了研究的开源计划。 他说,自己计划公布代码以及数据集,但还没有得到批准。

    91810

    YouTube高效传输策略:节省14%带宽 用户体验提升

    当您观看视频时,YouTube的播放器会在客户端测量当前的带宽,同时结合用户的终端设备、解码能力、处理能力等,动态选择最佳的视频块,从而能以足够快的速度进行下载。...图1:基于HTTP的自适应视频流 针对特定的分辨率,Youtube会选择使用多少比特来进行编码呢(在编码器允许的范围内)?...给定测量出的观看者可用带宽的分布情况,可以使用相邻分辨率的编码比特率之间的区域来估计实际播放分辨率的分布情况。 我们能够通过播放的统计数据对播放器在不同分辨率之间切换时的行为进行建模。...当我们使用此系统处理高清视频时,我们成功将YouTube播放中的流式传输带宽减少了14%。这一带宽的减少将有助于降低观众在观看YouTube视频时的数据消耗,这对于数据总量受限的用户尤为有帮助。...我们还观察到高清分辨率视频的观看时间增长了6%,这是因为更多人能够在固定和移动网络上传输更高分辨率的视频。 这种方法的另一大好处是提升了观看体验。

    90120

    【视频编码】 Content Aware ABR技术(十一)

    但ABR技术可通过让视频播放器根据用户端可用带宽和设备分辨率等因素自动决定要使用的播放格式来解决此问题。如果带宽状况较好,视频播放器可以选择播放更高质量的节目。...如果带宽降低,播放器可以自动切换到较低质量的节目。例如,YouTube播放器上的“自动”选项设置(上图右)。 通常,编码时选择的分辨率和比特率称为比特率阶梯(bitrate ladder)。...使用不同的比特率和分辨率组合对每个输入视频进行数十次测试编码 2. 采用新的质量测量工具(VMAF)对编码结果进行评估比较 3....目前,视频数据已占网络流量的70%左右,而且到2021年在线视频数据流量预计将翻一番。随着互联网技术的发展和智能移动终端的普及,高性能的视频压缩技术变得越来越重要。...当一个新的视频输入到Mux Video时,它会通过AI模型进行快速分析,并输出最佳的编码阶梯。那么Instant Per-Title Encoding的AI模型准确度如何呢?

    1.5K20

    NVIDIA NVENC编码器 OBS 指南

    视频选项卡设置 基础(画布)分辨率:设置玩游戏时通常所用的分辨率,即您的桌面分辨率(如果在无边框模式下玩游戏),或您通常使用的游戏分辨率(如果在全屏模式下玩游戏)。...但是 H.264 与应用的兼容性最好,因此如果您在使用其他 2 个编码器时遇到任何问题,您可以选回 H.264。...使用相同的带宽可以获得更好的画面质量。 上传带宽是大多数流媒体主播几乎无法控制的变量,因此编解码器效率通常是影响流媒体质量的最大因素。...通过虚拟背景、人像跟踪和麦克风降噪等 AI 功能,提高直播的视频和音频质量。...不进行直播时,此类功能还能加强视频电话会议和语音聊天质量,让 NVIDIA Broadcast 成为直播者和游戏玩家理想的 AI 伴侣。

    5.7K31

    Photoshop打包实现AI图像论文,英伟达在实时视频上PS之路上越走越远

    该公司将 Maxine 描述为一种「云原生」解决方案,使用了 AI 来提升分辨率、降低背景噪声、压缩视频、对齐人脸以及执行实时翻译和转录。 利用英伟达 Maxine 实现的视频会议超分辨率效果。...使用神经网络实现超分辨率 在展示 Maxine 时,英伟达介绍的第一个功能是「超分辨率」,英伟达说这「能实时地将低分辨率视频转换为高分辨率视频」。...这项成果基于英伟达之前的 GAN 研究 ,即将粗略草图映射为细节丰富的图像和绘画。 AI 视频压缩再次表明:当领域狭窄时,深度学习算法能取得格外出色的表现。...另一方面,如果用户使用计算能力有限的移动设备加入会议,则他可以选择放弃本地 AI 压缩,并将虚拟背景和降噪任务交给 Maxine 服务器执行。...很多实验已经表明,当问题的领域范围扩大时,即使最先进的深度学习算法也会损失准确度和稳定性。反过来,当问题的领域范围缩小时,神经网络更有可能接近真实的数据分布。

    65510

    视频分割在移动端的算法进展综述

    视频分割是一项广泛使用的技术,电影电视特效、短视频直播等可以用该技术将场景中的前景从背景中分离出来,通过修改或替换背景,可以将任务设置在现实不存在不存在或不易实现的场景、强化信息的冲击力。...,详细介绍Google为youtube app设计的移动端视频分割方法, 以及CVPR2019视频分割领域取得的最新进展,简单介绍RVOS、重点介绍在分割精度和实时性取得平衡的FEELVOS和SiamMask...将视频分割整合stories,给 YouTube app 带来精确、实时、便携的移动视频分割体验(需要访问外国网站体验)。...在模型训练时没有视频首帧的mask,所以需要使用算法把ground truth mask 转化成可能的Prior Mask。...当遮挡时,它预测的mask是两个物体的mask。VOS领域处理遮挡和消失也比较困难。 以上仅为个人阅读论文后的理解、总结和思考。观点难免偏差,望读者以怀疑批判态度阅读,欢迎交流指正。

    2.1K10

    基于BigGAN,生成高保真视频

    论文地址: https://arxiv.org/pdf/1907.06571.pdf 研究人员表示,由于“高效计算”组件和技术的使用,再加上新的定制数据集,他们训练出的最佳性能模型:双视频鉴别器GAN(...至于训练数据集(Kinetics-600),这是根据最初为人类行为识别策划的500,000个10秒高分辨率YouTube剪辑编制的,研究人员称该数据集具有“多样化”和“非受限”的特点,他们声称这些特征消除了过拟合的风险...(在机器学习中,过拟合是指与特定数据集过于紧密对应的模型,因此无法可靠地预测未来的观测结果。)...该团队在论文中表示,在经过Google加速的第三代TPU训练12到96小时后,DVD-GAN成功创建了包括目标结构、移动,甚至是复杂纹理的视频。...但研究人员指出,在UCF-101(13,320个人类行为视频的较小数据集)上评估时,DVD-GAN生成的样本的最好成绩分数为32.97。

    1.2K30

    你这个视频背景太假了?

    最近相信大家都被一个二创梗刷爆短视频:“你这背景太假了!”。视频中是一位主播“疆域阿力木”在直播时,被网友质疑背景太假,因此他发布了自证清白的视频。 但这个视频发布后,再次被网友“二次创作”。...说到视频背景太假,让我想到了之前看到过的一个替换背景的AI算法。它能够在原始视频上生成"高清绿幕背景",最高分辨率达4K。...这里我尝试了一下,把原版的“你的背景太假”的视频进行输入,得到了比较好的绿幕结果:(左边是原版视频,中间是蒙版,右边是绿幕背景) 当然,该项目也集成了换背景功能,并且目前已经开源。...而这篇文章能够做到4K的30fps视频背景替换。这主要的挑战在于:需要计算高质量的蒙版的同时,在实时处理高分辨率图像中保留头发等更为精确的细节。因此这篇文章主要使用了两个网络来实现这个目标。...具体可以看它视频的介绍~ https://www.youtube.com/watch?v=oMfPTeYDF9g 这期就到这里了,我是leo,欢迎关注我的公众号/知乎“算法一只狗”,我们下期再见~

    62720

    前端-玩转video

    比如常见的清晰度切换,我们是无法像youtube那样做到无缝切换的。...图1.2 Youtube视频下载请求过程 这两张图不难看出,在默认情况下 mp4 使用一次 http 请求所有的视频数据,Youtube 则分次请求。当然这个描述很不专业,但确实形象。...这个需求大家都不陌生,但是直接使用 mp4 格式做无缝清晰度切换,难度还挺大的。先解释下“无缝清晰度切换”的概念:从播放一个分辨率的视频到另一个分辨率且保证画面、声音不停顿的平滑切换过程。...属性与之同步,切换仍然看到画面闪烁,基本无法和 Youtube 无缝切换的体验匹敌。...不过这种看上去可行的方式实际上会带来很大的成本开销,如将大量视频做转码会消耗高昂的机器资源、双倍存储的费用、CDN的双倍费用等等。其实我们也是在这种背景下研究出来新的技术问题解决清晰度无缝切换的。

    2K10

    AnyMP4 Screen Recorder for Mac(录屏软件)

    AnyMP4 Screen Recorder Mac版是一款界面简约、操作轻松、功能实用的屏幕录制软件,使用AnyMP4 Screen Recorder可以让你自由的录制屏幕上任意一处地方,并且还可以进行录音...无论您玩的是英雄联盟,魔兽世界,Dota 2还是《守望先锋》,您都可以轻松捕获PC游戏中的视频,并获得更高的输出质量。操作舒适简单,并且对游戏录制的分辨率和时间没有限制。...录制后,您可以将视频游戏上传到YouTube或Twitch,并与全世界分享。预览录制的视频和音频文件录制完成后,您可以提前播放录制的视频并观看并直接收听音频文件。...然后,您可以与朋友分享录制的视频,或将其上传到YouTube,Vimeo,DailyMotion等社交网络。灵活的录制设置录制程序为您提供了一个选项,可以调整视频和音频录制的长度。...您可以定义自己的颜色,因此鼠标指针非常适合作为背景。该程序具有许多热键,可让您启动/停止,暂停,继续和拍摄屏幕截图。可以在设置中轻松定义热键。

    1K30

    opera mini 9携视频压缩技术全新上线

    在收购 skyfire 一年之后,视频压缩技术正式被 opera mini 9 采用。该技术能够对网络视频进行重新压缩,以适应移动设备的带宽。...据第三方公司 Ooyala 统计,在美国使用蜂窝网络收看视频时,有41%左右的视频会遇到缓冲问题。...在功能机时代,opera 曾经红极一时,但在移动平台进入智能化时代后,safari 以及 chrome 的快速发展使得 opera 得不到任何毫无喘息的机会。...但使用服务器中转也导致了一个不可避免的问题:无法处理加密传输页面。 YouTube 目前正使用加密传输来保障数据安全,而 Vimeo 也计划迁移至 HTTPS 加密连接。...在收看这类网站的视频时,opera 将无法提供流量压缩。 另一方面,高分辨率设备的普及也带来了新的问题:视频压缩技术很难在保持流量压缩比例的同时,在高清晰屏幕上保持足够的画质。

    40120

    Demuxed:编解码器和压缩的未来

    整个工作流程基于云,并涉及在AWS C5.18 X-Large实例上对云中的70 Mbps输入源进行转码。 图1.使用HDR10进行FIFA世界杯4K传送时使用的实例详细信息和编码梯形图。...感知视频质量是我们工作的核心,Twitter的Sebastiaan Van Leuven的演讲“移动设备的主观视频质量评估”就直接解决了这个问题。...作为背景,Sonnati是数字视频编码的先驱,其关于每个标题编码和FFmpeg的文章为包括我自己在内的许多从业者提供了重要的基础。这是我第一次亲自见到Fabio并看到他讲话。...在操作上,Sonnati声称这些增强功能可以在使用WebGL的现代浏览器中实现,包括在可以提供最大利益的移动设备上。但是,在广泛部署之前,必须解决性能调优和逻辑方面的考虑。...在他的演讲中,Galardi讨论了三种不同的改进方案,其中最快的一种在使用HEVC编解码器编码高分辨率文件时,速度提高了2.43x,而没有质量损失。

    42930

    关于「视频社交」的观察和思考

    讨论视频社交还要从YouTube的创立说起。2005 年初,26岁eBay工程师陈士骏离职创办 YouTube。...8K超高清视频拥有更大的亮度动态范围、更广的色域范围以及高度清晰等特征,高达7680×4320的分辨率像素和100°水平观看的角度,能够为观众展现更多视频信息和真实感细节。...5G技术的高速率、低延时,能让用户体验8K视频的高分辨率以及逼真的成像还原,带给观者近距离观看的舒适感和沉浸式的临场感觉。...对于极度敏感、特别好“面子”的中国人来说,视频社交的压力可能与线下见面差不多。 2.无法碎片化。因是实时同步,无法做到一边聊天一边干其他事情,必须沉浸其中。 3.容易太刺激。...以陌生人面具匹配和发现附近的人入手进行第一步冷启动,期望可以像当年微信的摇一摇和附近的人那样,完成初期用户的集聚。

    1.2K10

    Domain Adaptation for Object Detection on Foggy Days

    4、实验结果为了对我们的方法进行实验评估,我们选择了来自YouTube的公共视频,其中包括雾天的各种场景[33-36]。在雾天获得的50个视频序列包括在这个评估中。...如果使用所有帧对背景模型进行训练,那么训练过程的时间成本会非常高。为了消除训练样本之间的冗余,我们每隔五帧随机选取一帧。在每一个实验中,我们都将输入帧的分辨率保持为帧的原始分辨率。...与深度信息相比,颜色信息对远离摄像机的目标检测效果更好。利用颜色信息得到的结果存在点噪声。因此,我们观察到,当使用深度信息时,I和II场景中的一些遥远的物体被遗漏了。...产生这种误差的原因是我们的方法使用的深度信息是由简单的基于暗渠先验模型的无标度测量给出的,这种方法效率高但分辨率低。...从表1的得分可以看出,虽然我们的方法在天气好的情况下无法达到我们的性能,但是我们的方法在大多数情况下是可以使用的,因为帕PASCAL准则C > 0.5的平均得分表明检测和跟踪是成功的。?

    1.1K00
    领券