首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Web ML+ WebAssembly 支持实现 Google Meet 背景模糊功能

首先,我们解决方案通过将用户,和他们背景进行分割(稍后将详细介绍我们分割模型),来处理每个视频帧,使用ML推理来计算出一个低分辨率蒙版。或者,我们还可以进一步细化蒙版,以使其与图像边界对齐。...然后通过WebGL2使用蒙版来渲染视频,实现背景模糊或替换。 在当前版本中,模型推理客户端CPU执行,实现低功耗和最大设备覆盖范围。...XNNPACK和SIMD加速下,该分割模型可以Web实时速度运行。 MediaPipe灵活配置支持下,背景模糊/替换解决方案可根据设备能力,调整其处理过程。...高端设备,它运行完整工作流,提供最佳视觉质量,而在低端设备,通过使用轻量级ML模型进行计算,并且绕过蒙版细化,它仍然可以保持较高性能。...分割模型细分 设备机器学习模型必须是超轻量级实现快速推理、低功耗和较小下载大小。

1.1K20

Web ML+ WebAssembly 支持实现 Google Meet 背景模糊功能

首先,我们解决方案通过将用户,和他们背景进行分割(稍后将详细介绍我们分割模型),来处理每个视频帧,使用ML推理来计算出一个低分辨率蒙版。或者,我们还可以进一步细化蒙版,以使其与图像边界对齐。...在当前版本中,模型推理客户端CPU执行,实现低功耗和最大设备覆盖范围。...XNNPACK和SIMD加速下,该分割模型可以Web实时速度运行。 MediaPipe灵活配置支持下,背景模糊/替换解决方案可根据设备能力,调整其处理过程。...高端设备,它运行完整工作流,提供最佳视觉质量,而在低端设备,通过使用轻量级ML模型进行计算,并且绕过蒙版细化,它仍然可以保持较高性能。...分割模型细分 设备机器学习模型必须是超轻量级实现快速推理、低功耗和较小下载大小。

71830
您找到你想要的搜索结果了吗?
是的
没有找到

万圣节恐怖表演、内衣检测器......2019 年二十大有趣机器学习项目盘点

,Gucci 等零售商正在探索使用户能够在家中舒适地(地铁或工作场所)使用其产品方法。...在这里,Laan Labs(专门从事边缘技术ML / CV商店)人体分割模型应用了溶解粒子效果。 ?...这个项目则着眼于 iOS 使用 BERT 进行问答实现。 ? 代码:https://github.com/huggingface/swift-coreml-transformers?...source=post_page-----e74d7d347c2---------------------- 蒙版和图像修补把自拍照中手机抹掉 —Abhishek Singh 镜子里自拍没有手机实际是镜像自拍...不论是什么,Abhishek Singh 可以分 3 步把招聘中手机抹掉: 分割模型对属于对象手机类每个像素进行分类。 对分割手机进行像素级蒙版。 对分割手机进行图像修补创建模糊效果。 ?

68110

Google Meet背后技术揭秘

通过增强隐私或有趣视觉功能来改善体验,可以帮助我们将注意力集中会议本身上。...作为这个目标的一部分,我们最近发布了 Google Meet 中模糊和替换背景方法,它使用机器学习来更好地突出参与者,而不管他们周围环境如何。...我们解决方案首先通过将用户从背景中分割出来(后面将详细介绍我们分割模型),利用机器学习推理计算一个低分辨率 mask 来处理每个视频帧。另外,我们还可以进一步精修 mask,使其与图像边界对齐。...高端设备,它运行整个 pipeline 提供最高视觉质量,而在低端设备,它通过切换到轻量级机器学习模型并绕过 mask 精修高速运行。...开发功能甚至低功耗设备实现了实时性能和低功耗。

1.7K31

Google将跨平台AI管道框架MediaPipe引入网络

基本,这是一种快速方法,可以通过流行机器学习框架(例如Google自己TensorFlow和TensorFlow Lite)模块化方式执行对象检测、面部检测、手部跟踪、多手跟踪、头发分割以及其他此类任务...图形和渲染方面,MediaPipe现在会自动直接进入WebGL,这是一个JavaScript API,用于在任何兼容Web浏览器中渲染交互式2D和3D图形,从而使该浏览器在运行时创建一个虚拟机,可以非常快速地执行指令...API促进了JavaScript与C ++之间通信,从而允许用户直接使用JavaScript更改MediaPipe图形并与之交互。...MediaPipe团队成员Michael Hays和Tyler Mullen博客中解释说:“由于一切都直接在浏览器中运行,因此视频永远不会离开用户计算机,并且每次迭代都可以实时网络摄像头流(以及很快任意视频...用户可以使用鼠标和滚轮平移并放大图形表示形式,并且可视化效果实时反映在编辑器中所做更改。 Hays和Mullen指出,当前基于WebMediaPipe支持仅限于Google提供演示图。

1.5K20

谷歌发布 MediaPipe Holistic,实现移动端同时进行人脸、手部和人体关键点检测跟踪

还将引入 MediaPipe即用型 API,用于研究(Python端)和网页推理(JavaScript端),以方便更多人使用。...MediaPipe Holistic pipeline 概览 MediaPipe Holistic 使用姿势预测(每一帧作为额外 ROI 先验,来减少对快速运动做出反应时 pipeline 响应时间...使用TFLite GPU各种中端设备性能,每秒帧数(FPS)衡量 由于 pipeline 多级性,性能又多两个优点。...为了展示 MediaPipe Holistic 质量和性能,作者构建了一个简单远程控制界面,该界面浏览器中本地运行,无需鼠标或键盘,就能实现令人注目的用户交互。...依靠精准手部检测与后续手势识别映射到固定在用户肩部 "触控板 "空间之下,可实现 4 米范围内远程控制。 当其他人机交互方式不方便时候,这种手势控制技术可以开启各种新颖使用场景。

1.2K20

业界 | 谷歌用 AI 让自拍一键变表情包,斗图从此立于不败之地

AI科技评论按:为了让你在聊天斗图中立于不败之地,谷歌使用机器学习技术,最新开发了一个可以让你用自拍生成个人专属表情包工具,更新自家聊天软件Allo。...拍照、分享、再查看——自拍已经成为很多人日常习惯,我们和香车自拍、美装自拍、旅行自拍,还有“早晨,我醒了~”诸如此类自拍自拍已经成为人类社会行为一部分,长久以来被用来展示自我。...但正如谷歌用户体验项目的负责人,Jason Cornwell所指出那样,制作某一个人的卡通画并不是最终目标。“如何做一些不只能表现你自己外貌颜值,还能投射你个性东西?”...相反,也许这将是一个用户专属形象,可以为自己重新塑造出一个表情神秘女性形象,还可以跨越不同文化和时代。但是目前我们惠特尼双年展还没有发现什么酷炫东西,也许需要由谷歌这样公司来打破僵局。...例如,艺术家最初设计发型,用于实验人工介入下,训练网络为自拍匹配相应漫画。之后,人工评判输出表情和输入照片匹配程度,了解工具表现。

93580

4米以内实现远程手势控制!谷歌AI新研究让你抛掉键鼠操控屏幕

MediaPipe Holistic 作为 MediaPipe 一部分发布,可以移动设备(Android、 iOS)和桌面上使用。...例如,姿态估计模型较低分辨率(256x256)作为输入。但是如果从图像中剪切手部和脸部区域来传递给他们各自模型,图像分辨率会太低,无法精确清晰表达。...然而,快速移动过程中,跟踪器可能会丢失目标,这就要求探测器图像中重新定位目标。 MediaPipe Holistic使用姿态预测(每一帧)作为额外 ROI,减少快速移动时管道响应时间。...用户可以操作屏幕对象,坐在沙发上时虚拟键盘上打字,指向或触摸特定脸部区域(例如,静音或关闭摄像头)。...在下面,它依靠精确手势检测,然后将手势识别映射到固定在用户肩膀“轨迹板”空间,从而实现4米以内远程控制。

35120

没关系,微视用AI打造你我舞林大会,一张照片就可以

人体动作迁移实现过程中,动作跨度大、像素搬移多、纹理复杂、动作自由度高和遮挡频繁等干扰因素导致生成指定姿态的人体一直比较困难。...对于遮挡用户图表现较好,但其纹理生成来源于纹理 embedding,导致复杂纹理条件下还原度不高。...精准的人体分割还可以更好地帮助背景 inpainting 网络完成背景修补。因此,人体分割可以作为姿态迁移 GAN 网络多任务监督之一,更好地约束用户目标姿态下 shape 生成。...其中,QQ 相机漫画脸特效使用技术是光影实验室研算法 GYSeg,该算法 MIT 场景解析国际竞赛(Scene Parsing Benchmark)中斩获冠军;微视 APP 中迪士尼童话脸特效则是全球首家在手机上为用户提供实时个性化...此外,作为从人脸动作迁移到人体姿态迁移巨大跨越,新增跳舞功能使得用户微视 APP 中体验更加丰富有趣,同时也为用户之间交流提供了更丰富内容。

57320

Adobe等新研究把「自拍」变「他拍」,效果感人!

要想解决这个问题,可以选择随身携带三脚架或自拍杆,也可以选择随身携带一个朋友作为摄影师(该方法对单身狗极其不友好)。 或者,你还可以选择相信后期修图艺术。...因此,他们提出借助合成「自拍 - 他拍」图像对和监督学习方法来解决上述问题。...UV 空间中修补身体纹理,空间中大部分是不变原始身体姿态,因此面临合成数据瑕疵时更具鲁棒性。...总的来说,为了解决「unselfie」任务,研究者提出了下图所示三段式 pipeline: 首先在数据库中搜索最相近他拍姿势,然后执行基于坐标的身体纹理修补,最后使用合成模块来细化结果,并在背景合成它们...研究者 Amazon Mechanical Turk (AMT)对该方法以及 DPIG、VUNET 和 PATN 方法进行了用户研究。结果显示,该方法优于其他方法(如下表 1 所示)。 ?

54330

谷歌开源基于 ML 手部跟踪算法:手机端实时检测,多个手势同时捕捉

概述 能够对手形状和运动轨迹进行感知是改善用户不同技术领域和平台上体验一个重要组成部分。...利用上述技术,我们实现了对手掌平均检测精度为 95.7%;而使用常规交叉熵损失并且没有解码器情况下,检测精度基准仅为 86.22%。...图 3 第一行图片为对齐手部通过实时标注传递到跟踪网络;第二行图片为使用实时标注渲染合成手部图像。 然而,单纯合成数据很难推广到更广泛领域。...Mediapipe 附带了一组可扩展计算器,可用于解决各种设备和平台模型推理、媒体处理算法以及数据转换等任务。而像裁剪、渲染和神经网络计算这样单个计算器,可以独立 GPU 执行。...我们通过从当前帧中计算所得手部关键点来推断后续视频帧中手部位置实现手部跟踪,从而无需每个帧运行掌上检测器。

2K30

一周AI最火论文 | 迈向强人工智能四个步骤

此类设备可以进行实时医疗保健监控,让用户参与到监控之中并为他们提供长期医疗支持。此外,它们还减少了用户们花费治疗时间以及需要去医院时间。...近日一项研究中,研究人员试图改善步态分析硬件和软件组件。他们使用安装在移动遥控机器人低成本RGB摄像头设计了一种新型无标记步态分析设备。...远程机器人是半自动机器人,可以使用无线网络进行远程控制。该设备支持远程控制、实时视频聊天、自动应答和平衡。...使用手动标记2D和3D地面真实数据测试了该方法后,结果表明,与商用多摄像机运动捕捉系统相比,该方法具有竞争优势,并且硬件成本更低 这是朝着在家庭环境中进行稳健步态分析迈出一大步,这反过来又可以实现早期医疗干预并减少用户医疗费用...AutoFlip是建立MediaPipe框架基础MediaPipe框架支持开发用于处理时间序列多模式数据管道。

53021

MediaPipe:Google Research 开源跨平台多媒体机器学习模型应用框架

使用。...MediaPipe 演示案例 今年六月举行 CVPR 会议,Google Research 开源了 MediaPipe 预览版。为方便开发者学习和使用,我们提供了多个桌面系统和移动端示例。...MediaPipe 开源了多个由谷歌内部团队实现计算单元(Calculator)同时,也向用户提供定制新计算单元接口。...创建一个新 Calculator,需要用户实现 Open(),Process(),Close() 去分别定义 Calculator 初始化,针对数据流处理方法,以及 Calculator 完成所有运算后关闭步骤...我们最近在 谷歌 AI 博客发表了一篇相关文章: “使用 MediaPipe 实现设备端实时手部追踪”介绍了我们如何使用 MediaPipe 来搭建这个应用。

5.4K42

使用MediaPipe进行设备实时手部跟踪

来源 | googleblog 编辑 | 代码医生团队 能够感知手形状和运动,这是改善各种技术领域和平台用户体验重要组成部分。...今天宣布发布一种新手感知方法,6月份预览了CVPR 2019,MediaPipe实现- 一个开源跨平台框架,用于构建管道处理不同模态感知数据,如视频和音频。...通过MediaPipe实现 使用MediaPipe,可以将此感知管道构建为模块化组件有向图,称为计算器。...Mediapipe附带了一组可扩展计算器,可以解决各种设备和平台上模型推理,媒体处理算法和数据转换等任务。单独计算器,如裁剪,渲染和神经网络计算,可以专门GPU执行。...通过从当前帧中计算手部关键点推断后续视频帧中手部位置来实现这一点,从而消除了每个帧运行手掌检测器需要。

9.1K21

谷歌发布MediaPipe Diffusion插件,「移动端」可用图像生成控制模型

从噪声图像开始,每个步骤中,扩散模型会逐渐对图像进行降噪生成符合目标概念图像,将文本提示作为条件可以大大提升图像生成效果。...T2I Adapter是一个较小网络(7700万参数),可控生成中可以实现类似的效果,只需要将条件图像作为输入,其输出在所有扩散迭代中共享。 不过T2I适配器模型并不是为便携式移动设备设计。...插件网络是一个轻量级模型,只有600万参数,使用MobileNetv2中深度卷积和反向瓶颈(inverted bottleneck)移动设备实现快速推理。...S23)测量了三种模型性能:服务器使用50个扩散步骤运行所有三个模型;移动端上,使用MediaPipe图像生成应用程序运行20个扩散步骤。...插件不同移动设备推理时间(ms) 总结 在这项工作中,研究人员提出了MediaPipe,一个可在移动端使用、有条件文本到图像生成插件,将从条件图像中提取特征注入扩散模型,从而控制图像生成过程

52720

腾讯云AI「开了一个脑洞」

最后是用户个性化形象定制,通过自拍或上传照片,可将用户人脸融合在不同形象中,打造独特个人形象。...今年六一儿童节,腾讯云AI通过年龄变化能力推出《童年照》,帮助用户实现一键回到童年时代,上线3小时就有超过15万人体验。...用户可以现场通过自己手机体验换景自拍、换装自拍等功能,现场用户生成照片将会实时显示大屏幕“照片背景墙”中,用户也可以对生成照片进行实时分享,为新中国点赞。...当然,分割只是第一步,你也可以植入更多营销创意: 人像分割:识别图像中的人像并抠出,然后选择任意指定图像作为背景进行合成,实现背景图像替换与合成,有效降低P图成本。...人像分割+人脸特效:使用人像分割进行抠像处理,对人脸进行美颜,然后利用人脸融合、人脸性别转换、人脸年龄变换、人脸贴纸等做进一步特效处理,打造最具趣味性娱乐玩法。

2.6K30

动手画个二次元老婆,科大团队这个APP刚上线就火出圈,网友:我学废了

「WAND」刚发布就火出了圈,社交网络看,很多人已经率先试用了,作品是这样: 画出了各种漂亮小姐姐: 嗯,三次元也可以,还可以这样操作: 虽然但是,一部分手残党失败案例,也会让自己...一旦选择「Realistic」,再来张自拍,你或许会陷入深深思(jue)考(xing)之中…… 最终,用户们悟到了这个 App 真谛: 其实,使用时候也有一些小技巧。...相信用不了太久,Android 用户就可以自己手机上亲手画二次元老婆了,同时「老公版」WAND 也正在制作中。...SOF 能够在任意视图渲染一致 2D 语义分割图,然后将其与生成纹理图融合并使用语义 instance-wise(SIW)模块将其风格化为人像图像。...渲染阶段,给定任意查询视点,该方法将使用光线移动框架将 SOF 映射为 2D 分割图。SOF 使用确保了视图一致性。

28010

每日学术速递8.29

我们严格评估现有的最先进方法,并强调它们自我为中心场景中局限性,特别是多人跟踪方面。...最近研究探索了大规模监督训练,实现几乎任何图像风格零样本分割,以及无监督训练,实现无需密集注释分割。然而,构建一个能够没有任何注释情况下零样本方式分割任何内容模型仍然具有挑战性。...本文中,我们建议利用稳定扩散模型中注意力层来实现这一目标,因为预训练稳定扩散模型已经在其注意力层中学习了对象固有概念。... COCO-Stuff-27 ,我们方法像素精度上超越了先前无监督零样本 SOTA 方法绝对 26%,平均 IoU 上超越了 17%。...因此,我们首先将输入压缩到低维潜在空间,然后在其训练扩散模型。具体来说,我们将输入 3D 纹理形状编码为三平面特征图,表示输入有符号距离和纹理字段。

21420

web端实现AR人脸特效

前言 直播、短视频、在线会议等应用越来越多地进入人们生活,随之诞生是丰富各类创意玩法与新鲜体验,其中大量应用了AI检测和图形渲染为基础AR技术。...而随着Web技术不断成熟,AR技术Web实现成为了一种可能。今天就总结了Web端实现此功能几个技术要点,跟大家一起探讨一下。...tensorflow加载人脸识别模型生成FaceMesh 根据FaceMesh生成三角网格并进行UV贴图 FaceMesh MediaPipe Face Mesh是一种脸部几何解决方案,即使移动设备...它采用 机器学习 (ML)来推断3D表面几何形状,只需要单个摄像机输入,而无需专用深度传感器。该解决方案利用轻量级模型架构以及整个管线中GPU加速,可提供对实时体验至关重要实时性能。...UV Map用来描述三维物体表面与图像纹理(Texture) 映射关系,有了UV Map,我们就可以将二维图像纹理粘贴到三维物体表面。

1.3K10
领券