腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
音视频技术
专栏作者
举报
1271
文章
1364154
阅读量
287
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
编程算法(298)
图像处理(227)
api(200)
云直播(192)
https(141)
视频处理(140)
网络安全(127)
开源(108)
视频(105)
深度学习(96)
cdn(82)
音视频(82)
云点播(81)
网站(80)
神经网络(71)
tcp/ip(62)
文件存储(61)
短视频(61)
机器学习(56)
实时音视频(53)
ide(52)
腾讯云测试服务(52)
http(50)
android(49)
sdk(45)
人工智能(43)
ios(42)
自动驾驶(41)
5g(41)
移动直播(38)
无人驾驶(35)
游戏(34)
硬件开发(33)
缓存(33)
渲染(31)
udp(30)
实践(29)
模型(28)
fpga(27)
算法(27)
优化(27)
数据(26)
linux(24)
行业(23)
javascript(22)
云游戏(22)
编码(22)
物联网(21)
服务(20)
音频(20)
html(18)
企业(18)
云计算(18)
微信(17)
产品(17)
元宇宙(17)
网络(16)
腾讯(15)
人脸识别(13)
存储(13)
视频分析(13)
架构设计(12)
二维码(12)
研发(12)
语音识别(11)
python(11)
打包(11)
媒体处理(11)
工作(11)
流媒体(11)
github(10)
互动直播(10)
SSL 证书(10)
语音合成(10)
uml(10)
微服务(10)
开发(10)
opengl(9)
图像识别(9)
数据分析(9)
webgl(9)
科技(9)
系统(9)
iphone(8)
访问管理(8)
opencv(8)
nat(8)
百度(8)
架构(8)
硬件(8)
语音(8)
区块链(7)
c++(7)
git(7)
kubernetes(7)
dns(7)
flash(7)
安全(7)
腾讯会议(7)
工程师(7)
设计(7)
协议(7)
芯片(7)
NLP 服务(6)
php(6)
node.js(6)
数据库(6)
unix(6)
NAT 网关(6)
内容理解(6)
容器(6)
html5(6)
卷积神经网络(6)
gcc(6)
小程序(6)
windows(6)
互动白板(6)
快直播(6)
腾讯云(6)
工具(6)
客户端(6)
tensorflow(5)
mac os(5)
java(5)
arm(5)
apache(5)
nginx(5)
X-P2P(5)
分布式(5)
数据处理(5)
系统架构(5)
腾讯云开发者社区(5)
实时互动-工业能源版(5)
汽车(5)
教育(5)
web(5)
互联网(5)
解决方案(5)
终端(5)
sql(4)
容器镜像服务(4)
电商(4)
运维(4)
数据迁移(4)
大数据(4)
processing(4)
图片加速(4)
学习方法(4)
即时通信 IM(4)
七牛云(4)
手机(4)
费用中心(3)
对象存储(3)
json(3)
webview(3)
云数据迁移(3)
通用视频解决方案(3)
vr 视频解决方案(3)
工业物联(3)
serverless(3)
压力测试(3)
强化学习(3)
单元测试(3)
socket编程(3)
canvas(3)
flutter(3)
aigc(3)
codec(3)
com(3)
gpt(3)
iot(3)
架构师(3)
开发者(3)
软件(3)
事件(3)
实时通信(3)
性能(3)
压缩(3)
用户体验(3)
云服务器(2)
其他(2)
go(2)
qt(2)
nosql(2)
access(2)
医疗(2)
智能硬件(2)
自动化(2)
spring boot(2)
监督学习(2)
自动化测试(2)
rpc(2)
任务调度(2)
sdn(2)
ipv6(2)
负载测试(2)
es(2)
内容识别(2)
联邦学习(2)
应用安全开发(2)
点云压缩(2)
智能家居(2)
apple(2)
bit(2)
db(2)
google(2)
media(2)
mozilla(2)
na(2)
rtc(2)
streaming(2)
title(2)
url(2)
vr(2)
youtube(2)
布局(2)
插件(2)
创业(2)
动画(2)
动效(2)
服务端(2)
基础(2)
框架(2)
流量(2)
视频编码(2)
搜索(2)
同步(2)
通信(2)
虚拟现实(2)
云服务(2)
在线教育(2)
私有网络(1)
负载均衡(1)
官方文档(1)
objective-c(1)
swift(1)
c 语言(1)
.net(1)
jquery ui(1)
xml(1)
css(1)
ecmascript(1)
android studio(1)
单片机(1)
汇编语言(1)
oracle(1)
jar(1)
ubuntu(1)
windows server(1)
负载均衡缓存(1)
mapreduce(1)
云函数(1)
批量计算(1)
对等连接(1)
音视频点播加速(1)
移动解析 HTTPDNS(1)
文字识别(1)
人脸融合(1)
云转码(1)
DevOps 解决方案(1)
互动课堂(1)
游戏解决方案(1)
直播安全(1)
数据安全(1)
微信小程序音视频(1)
electron(1)
webpack(1)
rollup.js(1)
移动开发(1)
爬虫(1)
spark(1)
wordpress(1)
gui(1)
面向对象编程(1)
dubbo(1)
ddos(1)
敏捷开发(1)
kernel(1)
迁移学习(1)
数据结构(1)
网站建设(1)
超级播放器(1)
数字版权管理(1)
kafka(1)
虚拟化(1)
内容安全(1)
聚类算法(1)
ascii(1)
迁移(1)
rust(1)
测试策略(1)
链路测试(1)
raft(1)
腾讯云剪(1)
图片处理(1)
极速高清(1)
云桌面(1)
智能创作(1)
流计算 Oceanus(1)
测试服务(1)
沉浸式媒体(1)
在线课堂(1)
智能穿戴(1)
标准直播(1)
虚拟直播(1)
amd(1)
app(1)
arm64(1)
chat(1)
decode(1)
delay(1)
difference(1)
display(1)
encode(1)
endpoint(1)
event(1)
facebook(1)
ffmpeg(1)
figure(1)
filter(1)
firefox(1)
gstreamer(1)
handler(1)
instagram(1)
intel(1)
kill(1)
linkedin(1)
max(1)
medium(1)
mobile(1)
nlp(1)
nsq(1)
profile(1)
project(1)
session(1)
show(1)
store(1)
sum(1)
table(1)
tcp(1)
testing(1)
time(1)
twitter(1)
ui(1)
usb(1)
video(1)
vimeo(1)
vlc(1)
边缘计算(1)
表格(1)
并发(1)
部署(1)
产品经理(1)
低代码(1)
队列(1)
管理(1)
函数(1)
后台(1)
华为(1)
集群(1)
即时通讯(1)
跨平台(1)
连接(1)
量化(1)
浏览器(1)
论文(1)
苹果(1)
数据中心(1)
图表(1)
线程(1)
效率(1)
异常(1)
隐私(1)
远程工作(1)
云平台(1)
搜索文章
搜索
搜索
关闭
音视频技术开发周刊 | 278
图像处理
语音合成
https
网络安全
语音识别
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 ---- AI双眼皮,让您重焕“睛”彩 AI 双眼皮生成是快手 Y-tech 自研的人像美化项目,提出的基于形状和纹理显示分离的生成式算法解决了 domain 间小风格迁移的难题,所生成的双眼皮能够兼顾真实和美感,已经上线“一甜相机"app->美型->眼睛->双眼皮 和"快手"app拍摄页面->美化->医美级->双眼皮,欢迎关注和使用。 KALOS.art AI 作品每周精选 001 2022年
LiveVideoStack
2023-02-23
581
0
音视频技术开发周刊 | 247
深度学习
开源
android
实时音视频
语音合成
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 QoS和QoE初学者指南 本篇文章从宏观角度向大家介绍QoS和QoE。我会先从它们的定义开始,然后讨论它们之间的关联。接着,我们再来简单了解公司如何衡量和使用QoS和QoE。 视频修复:无监督流对齐的序列对序列学习方法S2SVR(ICML 2022) 本文将 Seq2Seq 的架构引入到了视频超分中,其次针对光流不准的问题,之前的文章选择使用DCN进行替代,本篇论文『Unsupervised F
LiveVideoStack
2022-05-30
742
0
【专题介绍】LiveVideoStackCon 2022 上海站主题演讲
语音合成
” “音视频+无限可能”是一扇 LiveVideoStackCon面向新兴领域开启的大门,在移动互联网红利消失、内卷的局面下,智能车、制造、金融、医疗、出海等新兴领域还在迫切追寻新技术带来的增值。在“音视频+无限可能”,提前看到新机会、新案例、新实践。 6月24日-25日,LiveVideoStackCon 2022 上海站,和你一同开启通向未来的大门。 主题演讲 音视频技术在整体大环境的影响下,近年来呈现出迅猛的发展趋势。一方面,视频技术能力的普及,面向现有业务及场景视频化发展的道路存在相当激烈的竞争,从
LiveVideoStack
2022-05-23
592
0
开源声码器WORLD在语音合成中的应用
编程算法
语音合成
神经网络
📷 语音合成(TTS)是语音AI平台的基础设施,而声码器则决定着其中的声学模型以及合成质量。喜马拉雅FM音视频高级工程师 马力在LiveVideoStack线上交流分享中详细介绍了新一代合成音质更高,
LiveVideoStack
2021-09-01
1.3K
0
搞多媒体开发?吴威麒:先拉个书单看看
processing
开源
语音识别
语音合成
视频处理
LiveVideoStack:吴威麒你好,能否简要介绍下自己,包括目前的主要工作及关注领域?
LiveVideoStack
2021-09-01
282
0
基于Tacotron汉语语音合成的开源实践
python
api
语音合成
语音合成(Text to Speech Synthesis)是一种将文本转化为自然语音输出的技术,在各行各业有着广泛用途。传统TTS是基于拼接和参数合成技术,效果上同真人语音的自然度尚有一定差距,效果已经达到上限,在实现上也依赖于复杂流水线,比如以文本分析为前端的语言模型、语音持续时间模型、声学特征预测模型、将频谱恢复成时域波形的声码器(vocoder)。这些组件都是基于大量领域专业知识,设计上很艰难,需要投入大量工程努力,对于手头资源有限的中小型玩家来说,这种“高大上”的技术似乎有些玩不起。
LiveVideoStack
2021-09-01
1.1K
0
情感语音合成技术难点突破与未来展望
数据库
sql
语音合成
语音识别
神经网络
回放链接:https://www.livevideostack.cn/video/sillon/
LiveVideoStack
2020-07-10
1.8K
0
喜马拉雅贺雯迪:基于端到端TTS实现更具生动、富有情感的语音合成表现
语音合成
编程算法
LiveVideoStack:贺雯迪,你好,感谢你接受LiveVideoStack的采访,作为本次大会AI与多媒体内容生产创作专场的讲师,请先和大家介绍一下你目前负责的工作方向和演讲内容。
LiveVideoStack
2020-05-09
1.1K
0
喜马拉雅贺雯迪:基于端到端TTS实现更具生动、富有情感的语音合成表现
语音合成
编程算法
贺雯迪:我目前在喜马拉雅担任音频算法工程师,工作研发方向是TTS前端模块的搭建和优化(文本规整化、分词、多音字、韵律预测等),后端算法(基于深度生成模型的说话人风格转换,情感控制,音色克隆、神经声码器的优化等方向)。演讲的方向是基于现在语音合成领域中比较具有发展前瞻性和讨论性的:语音合成中风格迁移、情感合成、音色克隆等衍生方向上技术和应用方面的探讨。
LiveVideoStack
2020-05-08
1.2K
0
从音视频技术看AI的机会和挑战
编程算法
语音识别
内容理解
深度学习
语音合成
我关注AI完全是被动的,直到两件事改变了我对AI的看法。第一件发生在2017年5月,AlphaGo以3比0战胜柯洁。我的一个朋友当时在乌镇现场感受了这场人机大战,她向我描述了柯洁被逼到走投无路的无奈与绝望表情。另一件事在2018年初,现场聆听了蒋涛关于AI的分享,其中介绍了在Google内部,AI已经在大部分产品上应用,包括Youtube。由于工作关系,Youtube在AI方面的应用自然引起了我的注意,比如通过AI理解视频内容,自动截取最能表现视频内容的关键帧,可用于生成视频封面。
LiveVideoStack
2019-08-16
871
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档