腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
媒矿工厂
专栏作者
举报
881
文章
1034179
阅读量
235
订阅数
订阅专栏
申请加入专栏
全部文章(881)
模型(116)
编程算法(98)
图像处理(92)
数据(87)
视频(81)
tcp/ip(69)
其他(67)
api(64)
神经网络(56)
深度学习(53)
网络(53)
编码(51)
文件存储(50)
cdn(50)
http(49)
腾讯云测试服务(44)
渲染(44)
机器学习(41)
云直播(40)
人工智能(37)
性能(36)
网络安全(32)
https(29)
函数(26)
框架(26)
优化(26)
网站(25)
开源(25)
视频处理(24)
设计(24)
缓存(23)
云点播(22)
压缩(22)
video(21)
存储(20)
javascript(18)
算法(18)
5g(17)
论文(17)
对象(14)
工作(13)
量化(13)
流媒体(13)
系统(13)
打包(11)
游戏(11)
数据分析(11)
media(11)
音频(11)
ide(10)
容器(10)
uml(10)
vr(10)
unix(9)
分布式(9)
udp(9)
媒体处理(9)
scale(9)
变量(9)
测试(9)
python(8)
linux(8)
微服务(8)
工作流(8)
php(7)
html(7)
云计算(7)
动画(7)
架构(7)
连接(7)
android(6)
github(6)
移动直播(6)
安全(6)
nat(6)
视频分析(6)
点云压缩(6)
rtc(6)
streaming(6)
效率(6)
ios(5)
node.js(5)
git(5)
自动化(5)
html5(5)
dns(5)
系统架构(5)
fpga(5)
虚拟化(5)
沉浸式媒体(5)
db(5)
facebook(5)
iso(5)
youtube(5)
二进制(5)
工具(5)
内存(5)
索引(5)
NAT 网关(4)
图像识别(4)
强化学习(4)
flash(4)
机器人(4)
windows(4)
webgl(4)
sdn(4)
ip(4)
profile(4)
text(4)
web(4)
基础(4)
客户端(4)
流量(4)
排序(4)
视频编码(4)
协议(4)
虚拟现实(4)
重构(4)
区块链(3)
tensorflow(3)
bash(3)
css(3)
批量计算(3)
命令行工具(3)
监督学习(3)
unity(3)
socket编程(3)
数据结构(3)
canvas(3)
processing(3)
sdk(3)
云游戏(3)
自由视角(3)
acm(3)
aws(3)
bit(3)
codec(3)
ffmpeg(3)
image(3)
jpeg(3)
live(3)
time(3)
程序(3)
代理(3)
路由(3)
配置(3)
实时通信(3)
搜索(3)
通信(3)
音视频(3)
元宇宙(3)
人脸识别(2)
go(2)
react(2)
json(2)
arm(2)
硬件开发(2)
数据库(2)
apache(2)
nginx(2)
spring(2)
短视频(2)
SSL 证书(2)
vr 视频解决方案(2)
serverless(2)
卷积神经网络(2)
二叉树(2)
迁移学习(2)
大数据(2)
物联网(2)
腾讯云开发者社区(2)
腾讯云图数据可视化(2)
alpha(2)
amazon(2)
apple(2)
broadcast(2)
buffer(2)
data(2)
dynamic(2)
gaussian(2)
google(2)
it(2)
metrics(2)
precision(2)
project(2)
self(2)
simulation(2)
slice(2)
sum(2)
transfer(2)
布局(2)
队列(2)
互联网(2)
计算机视觉(2)
可视化(2)
内核(2)
日志(2)
事件(2)
硬件(2)
语法(2)
语音(2)
费用中心(1)
云服务器(1)
云硬盘(1)
数字货币(1)
NLP 服务(1)
iphone(1)
swift(1)
xcode(1)
c++(1)
c#(1)
.net(1)
jquery ui(1)
xml(1)
typescript(1)
qt(1)
单片机(1)
嵌入式(1)
sql(1)
容器镜像服务(1)
访问管理(1)
对等连接(1)
人脸融合(1)
机器翻译(1)
通用视频解决方案(1)
DevOps 解决方案(1)
高性能计算(1)
企业(1)
正则表达式(1)
gui(1)
推荐系统(1)
决策树(1)
线性回归(1)
pytorch(1)
rpc(1)
gcc(1)
ntp(1)
数据可视化(1)
内容安全(1)
腾讯会议(1)
ipv6(1)
迁移(1)
性能测试(1)
负载测试(1)
es(1)
学习方法(1)
服务网格(1)
多媒体处理(1)
应用安全开发(1)
手势识别(1)
视频理解(1)
即时通信 IM(1)
汽车(1)
adapter(1)
adobe(1)
aes(1)
animation(1)
app(1)
backbone(1)
bandwidth(1)
bi(1)
camera(1)
com(1)
comparison(1)
cpu(1)
dataset(1)
directshow(1)
distribution(1)
draw(1)
driver(1)
dst(1)
edge(1)
expression(1)
feed(1)
flatten(1)
format(1)
frame(1)
gnu(1)
gps(1)
gpt(1)
gpu(1)
icon(1)
instagram(1)
intel(1)
io(1)
label(1)
load(1)
lock(1)
ls(1)
mask(1)
matrix(1)
maya(1)
meta(1)
microsoft(1)
mime(1)
model(1)
mp3(1)
nas(1)
network(1)
networkx(1)
nvidia(1)
package(1)
post(1)
protocols(1)
ref(1)
rgb(1)
scaling(1)
screen(1)
set(1)
sf(1)
show(1)
simd(1)
similarity(1)
src(1)
standards(1)
state(1)
static(1)
stream(1)
super(1)
svm(1)
system(1)
title(1)
tizen(1)
token(1)
transactions(1)
union(1)
unmanaged(1)
vimeo(1)
voiceover(1)
vpn(1)
webrtc(1)
xmpp(1)
zero(1)
遍历(1)
编译(1)
表格(1)
递归(1)
反射(1)
翻译(1)
服务(1)
服务器(1)
高性能(1)
集合(1)
计算机网络(1)
脚本(1)
教程(1)
交换机(1)
解决方案(1)
开发者(1)
开源框架(1)
开源软件(1)
跨域(1)
路由器(1)
苹果(1)
数据存储(1)
数据类型(1)
数学(1)
数组(1)
图表(1)
网络协议(1)
隐私(1)
主机(1)
LLM(1)
搜索文章
搜索
搜索
关闭
CVPR 2022 | DiffusionCLIP: 用于稳健图像处理的文本引导扩散模型
图像处理
变量
函数
模型
数据
近期,结合对比语言-图像预训练(CLIP)的 GAN 反演方法在零样本图像操作方面引起了广泛关注,它可以根据文本提示进行图像操作。然而,由于 GAN 反演性能有限,它在各种类型的真实世界图像上的应用仍然很棘手。具体而言,成功的图像操作应该将图像属性转换为目标属性,同时不会对输入内容产生意外变化。然而,目前最先进的基于编码器的 GAN 反演方法往往不能成功重建具有新姿势、视角和细节的图像。当处理高变异数据集(如 LSUN-Church 和 ImageNet )中的图像时,这个问题变得更加严重。 最近,扩散模型,如去噪扩散概率模型(DDPM)和基于分数的生成模型在图像生成任务上取得了巨大的成功。最新的研究表明,与变分自编码器(VAEs)、流动模型、自回归模型和生成对抗网络(GANs)相比,这些模型在图像合成性能方面具有更高的质量。此外,最近的去噪扩散隐式模型(DDIM)进一步加速了采样过程,并实现了几乎完美的反演。 基于此,本文提出了一种新的 DiffusionCLIP 方法,这是一种通过扩散模型进行 CLIP 引导的强大图像操作方法。其关键思想是使用基于文本提示的 CLIP 损失来微调反向扩散过程中的评分函数,以控制生成图像的属性。这种方法可以成功地在训练过和未见过的领域中进行图像操作,甚至可以将图像从一个未见过的领域转换为另一个未见过的领域,或者从草图中生成未见过的领域的图像。此外,通过简单地将多个经过微调模型预测的噪声组合在一起,可以通过仅进行一次采样过程同时改变多个属性。另外,DiffusionCLIP 通过操作来自广泛多样的 ImageNet 数据集的图像,在 GAN 反演方面取得了一步进展。此前由于其较差的重建效果,该数据集很少被探索。本文还提出了一种系统的方法来寻找导致高质量和快速图像操作的最佳采样条件。
用户1324186
2023-09-09
438
0
ECCV 2022|码流信息辅助的压缩视频超分框架
编程算法
文件存储
图像处理
神经网络
目前网络上的电影、网络广播、自媒体视频等大部分是分辨率较低的压缩视频,而智能手机、平板电脑、电视等终端设备正逐渐配备 2K、4K 甚至 8K 清晰度的屏幕,因此端侧的视频超分辨率(VSR)算法引起越来越广泛的关注。与图像超分辨率(SISR)相比,视频超分辨率(VSR)可以通过沿视频时间维度利用邻近帧的信息来提高超分辨率的效果。视频超分辨率算法大致可以分为两类:基于滑窗的视频超分算法(Sliding-window)和基于循环神经网络的视频超分算法(Recurrent VSR)。基于滑窗的视频超分算法会重复的提取邻近帧的特征,而基于循环神经网络的视频超分辨率算法避免了重复的特征提取,还可以高效的传递长期时间依赖信息,鉴于端侧运算单元和内存有限的情况来说是一个更具潜力的方案。在视频超分中,视频帧之间的对齐对超分辨率性能有着重要的影响。目前的视频超分算法通过光流估计、可形变卷积、注意力和相关性机制等方式来设计复杂的运动估计网络来提升视频超分的性能。而目前商用终端设备很难为视频超分辨率算法提供足够的计算单元和内存来支撑视频帧之间复杂的运动估计以及大量的冗余特征计算。
用户1324186
2022-11-07
1.8K
0
视角合成视频的质量评价
图像处理
基于深度图像的渲染(Depth-image-based rendering, DIBR)是一种广泛使用的视图合成技术。DIBR 包含 3D warping 和孔填充技术。在三维扭曲中,通过将给定的参考彩色视频映射到相关深度视频所需的虚拟视点来生成扭曲视频。在这个过程中,由于可以看到被前景遮挡的背景,所以在扭曲的视频中可能会出现孔洞区域,接下来是填充扭曲视频的洞区域。
用户1324186
2022-05-25
1.7K
0
视频编解码器的现状 (2022)
https
网络安全
硬件开发
图像处理
在这个 2022 年的编解码器进展中,我将介绍去年与 H.264、VP9、HEVC、AV1、多功能视频编码(VVC)、低复杂度增强型视频编码(LCEVC)和基本视频编码(EVC)有关的最重要的公告。编解码器有很多,但篇幅有限,所以本文只是简单介绍。
用户1324186
2022-05-25
1.9K
0
W3C: 媒体制作 API (3)
编程算法
网站
api
图像处理
来自 WebCodecs 的技术主管 Chris Cunningham 将首先介绍一些 WebCodecs 的 API,并会介绍一些关于视频编码器的设置。
用户1324186
2022-05-25
990
0
8K@60fps编码用48Mbps就够吗?
云直播
图像处理
https
网络安全
在我们对 8K 视频编码这一新兴领域永无止境的探索中,我们一直试图了解编解码器随着分辨率的提高是否会变得更加高效。如果用 bit/pixel 这个标准来定义的话,这当然是不言而喻的。那么如果要深入探究这个标准,那么就必须回答一个问题:8K 内容所需的真实比特率是多少,更具体地说 8K/60Hz/10bit/HDR 内容编码的比特率是多少?它又取决于什么?
用户1324186
2022-05-25
1.2K
0
使用体积视频创建数字人
图像处理
http
python
如图所示是微软混合现实(由 metastage 运营)创建数字人的方法,使用 53 个 RGB 相机和 IR 相机动态捕捉人物动作,然后拼接成点云,进一步生成包含纹理的 mesh,最终变成可传输的 mp4。
用户1324186
2022-04-11
1K
0
什么是体积视频?
图像处理
uml
unity
体积视频在三维空间中捕捉实时画面,并且将其转换为 3D 模型,该模型可以放置在任何 3D 环境中,如虚拟现实环境,元宇宙或者增强现实等。在消费级别,捕获体积视频可以只包括一个深度相机,在生产级别,这可能包括大量的相机,几十台或上百台相机指向目标场景,并且有相同数量的深度相机用于捕捉深度信息,进一步生成点云。将所有的数据进行融合,从而可以得到体积视频。
用户1324186
2022-04-11
4.4K
0
AV1编码现状(2022.1)
android
图像处理
cdn
此前业内认为,AV1 虽然是性能较佳的编码器,但由于其生态尚不完备,因此实用性有待考量。但事实上,在 2022 年的现在看来,AV1 已经显示了一定的部署和应用前景:
用户1324186
2022-04-11
4.6K
0
用于 6-DoF 视听内容捕获和制作的工具
图像处理
unity
虽然该灵活的制片过程主要针对XR应用,因为捕获的6自由度素材可以在给定的运动范围内,并且从任何角度查看。但与此同时,它也可以被用于传统的常规制片流程,只需要在虚拟视角下对所捕获的内容进行框选即可。
用户1324186
2022-04-11
820
0
MPEG 第 137 次会议进展
图像处理
文件存储
MPEG 第 137 次会议于 2022-01-17 至 2022-01-21 在线举行。
用户1324186
2022-02-18
778
0
针对 YUV420 颜色空间的深度图像压缩研究
图像处理
文件存储
目前,大多数深度图像压缩方法被设计用来压缩 RGB 颜色空间的图像。然而传统的视频编码标准,则主要设计来压缩 YUV420 色彩空间的图像。在这个研究中,作者首先研究如何调整 RGB 图像的深度压缩框架,以压缩 YUV420 图像。然后研究了调整 YUV 通道的训练失真权重时对编码性能的影响,并将实验结果与 HEVC 和 VVC AI 配置进行比较。提出的方法适用于图像压缩和视频压缩的帧内编码。
用户1324186
2022-02-18
956
0
基于显著性的感知视频编码
腾讯云测试服务
图像处理
深度学习
显著性是某些事物突出的特性。对于图片来说,当图片的内容不是很复杂时,显著性区域可以比较容易的划分出来。一般来说,在图片中存在运动物体、前景物体、以及不相关的物体时,会导致显著性检测的结果更容易出现问题。
用户1324186
2022-02-18
1.1K
0
掌握量化技术是视频压缩的关键
图像处理
编程算法
视频编码利用信号的信息冗余来降低数据率。无损编码依赖于:差分预测编码、变换、熵编码。有损编码通过添加量化过程来进一步提高压缩效率。
用户1324186
2022-02-18
2.4K
0
EVC,VVC,LCEVC 测试:最新的 MPEG 编解码器性能如何?
图像处理
腾讯云测试服务
https
网络安全
视频处理
据我所知,这是第一次有研究对代表基本视频编码(Essential Video Coding,EVC)、通用视频编码(Versatile Video Coding,VVC)和低复杂度增强视频编码(Low Complexity Enhancement Video Coding,LCEVC)的编解码器以及 AV1、HEVC 和 H.264 的质量和性能进行比较。它并不像我希望的那样详尽,但结果应该有助于你了解三个较新的 MPEG 编解码器的目标,以及它们与旧编解码器的对比情况。
用户1324186
2022-02-18
3.6K
0
通用场景下的开源优化 VVC 编码器
腾讯云测试服务
图像处理
经测试,VVC 编码标准比 HEVC 有 50% 的码率节省,并广泛支持各种视频内容和用例。与 HEVC 不同的是,第一版 VVC 标准已经具备屏幕内容编码、高层语义划分等功能,并支持各种特殊视频格式:10 bit 位深的高动态范围 (High Dynamic Range, HDR)、可选的色度采样格式 (包括 4:4:4)、分辨率缩放和参考帧重采样。目前,VVC 标准的第二版制定工作正在进行中,该版标准将支持 10 bit 以上位深和更高分辨率视频编码。
用户1324186
2022-02-18
2K
0
大话实时视频编码中的人工智能(下)
图像处理
processing
硬件开发
神经网络
机器学习
上述大多数文献都报告了显著的改进,它们与开源参考软件相比,有令人印象深刻的速度提升。但我们都知道,这些参考代码库远未优化,其速度以“每帧秒数”而非“每秒帧数”表示。要证明相对于这些代码库的速度提升是很容易的,但如果与经过专家调优、用汇编指令集优化并在高帧率和分辨率下实时运行的优化编码器相比,就会变得非常困难。
用户1324186
2022-02-18
559
0
大话实时视频编码中的人工智能(上)
图像处理
processing
linux
神经网络
机器学习
在过去的十年中,已经出现了数千篇主张 AI 和 ML 有益处的文章。其中一些是现实的,而另一些则夸大了 ML 技术在大量应用中可能带来的好处。那么真正的好处在哪里,市场营销部门在哪里越过界线,变成了无稽之谈?在诸如实时(视频)处理或编码等严格条件下的应用呢?考虑到计算开销、延迟和成本限制后,能保留了多少净收益?
用户1324186
2022-02-18
794
0
为编码器的实现计算整数范围
腾讯云测试服务
图像处理
Jonathan 首先介绍了视频编解码器产生的整数溢出失真,如下图所示。事实上,很难计算出编解码器中整数需要多大才能避免这个问题。设计的足够大的整数实际上并不够大,当然太大的整数也会造成实现成本上升。
用户1324186
2022-02-18
476
0
有丢包信道下的带宽受限无线视频通信
腾讯云测试服务
图像处理
随着移动设备数量快速增长,国防监控需求也在增大。然而由于无线通信本身就可能出现丢包,因此在编码、视频质量以及误码纠错中一直都有着权衡。
用户1324186
2022-01-20
1.1K
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档