首页
学习
活动
专区
工具
TVP
发布

音视频技术

专栏作者
1271
文章
1364154
阅读量
287
订阅数
音视频技术开发周刊 | 278
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 ---- AI双眼皮,让您重焕“睛”彩 AI 双眼皮生成是快手 Y-tech 自研的人像美化项目,提出的基于形状和纹理显示分离的生成式算法解决了 domain 间小风格迁移的难题,所生成的双眼皮能够兼顾真实和美感,已经上线“一甜相机"app->美型->眼睛->双眼皮 和"快手"app拍摄页面->美化->医美级->双眼皮,欢迎关注和使用。 KALOS.art AI 作品每周精选 001 2022年
LiveVideoStack
2023-02-23
5810
音视频技术开发周刊 | 247
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 QoS和QoE初学者指南 本篇文章从宏观角度向大家介绍QoS和QoE。我会先从它们的定义开始,然后讨论它们之间的关联。接着,我们再来简单了解公司如何衡量和使用QoS和QoE。 视频修复:无监督流对齐的序列对序列学习方法S2SVR(ICML 2022) 本文将 Seq2Seq 的架构引入到了视频超分中,其次针对光流不准的问题,之前的文章选择使用DCN进行替代,本篇论文『Unsupervised F
LiveVideoStack
2022-05-30
7420
【专题介绍】LiveVideoStackCon 2022 上海站主题演讲
” “音视频+无限可能”是一扇 LiveVideoStackCon面向新兴领域开启的大门,在移动互联网红利消失、内卷的局面下,智能车、制造、金融、医疗、出海等新兴领域还在迫切追寻新技术带来的增值。在“音视频+无限可能”,提前看到新机会、新案例、新实践。 6月24日-25日,LiveVideoStackCon 2022 上海站,和你一同开启通向未来的大门。 主题演讲 音视频技术在整体大环境的影响下,近年来呈现出迅猛的发展趋势。一方面,视频技术能力的普及,面向现有业务及场景视频化发展的道路存在相当激烈的竞争,从
LiveVideoStack
2022-05-23
5920
开源声码器WORLD在语音合成中的应用
📷 语音合成(TTS)是语音AI平台的基础设施,而声码器则决定着其中的声学模型以及合成质量。喜马拉雅FM音视频高级工程师 马力在LiveVideoStack线上交流分享中详细介绍了新一代合成音质更高,
LiveVideoStack
2021-09-01
1.3K0
搞多媒体开发?吴威麒:先拉个书单看看
LiveVideoStack:吴威麒你好,能否简要介绍下自己,包括目前的主要工作及关注领域?
LiveVideoStack
2021-09-01
2820
基于Tacotron汉语语音合成的开源实践
语音合成(Text to Speech Synthesis)是一种将文本转化为自然语音输出的技术,在各行各业有着广泛用途。传统TTS是基于拼接和参数合成技术,效果上同真人语音的自然度尚有一定差距,效果已经达到上限,在实现上也依赖于复杂流水线,比如以文本分析为前端的语言模型、语音持续时间模型、声学特征预测模型、将频谱恢复成时域波形的声码器(vocoder)。这些组件都是基于大量领域专业知识,设计上很艰难,需要投入大量工程努力,对于手头资源有限的中小型玩家来说,这种“高大上”的技术似乎有些玩不起。
LiveVideoStack
2021-09-01
1.1K0
情感语音合成技术难点突破与未来展望
回放链接:https://www.livevideostack.cn/video/sillon/
LiveVideoStack
2020-07-10
1.8K0
喜马拉雅贺雯迪:基于端到端TTS实现更具生动、富有情感的语音合成表现
LiveVideoStack:贺雯迪,你好,感谢你接受LiveVideoStack的采访,作为本次大会AI与多媒体内容生产创作专场的讲师,请先和大家介绍一下你目前负责的工作方向和演讲内容。
LiveVideoStack
2020-05-09
1.1K0
喜马拉雅贺雯迪:基于端到端TTS实现更具生动、富有情感的语音合成表现
贺雯迪:我目前在喜马拉雅担任音频算法工程师,工作研发方向是TTS前端模块的搭建和优化(文本规整化、分词、多音字、韵律预测等),后端算法(基于深度生成模型的说话人风格转换,情感控制,音色克隆、神经声码器的优化等方向)。演讲的方向是基于现在语音合成领域中比较具有发展前瞻性和讨论性的:语音合成中风格迁移、情感合成、音色克隆等衍生方向上技术和应用方面的探讨。
LiveVideoStack
2020-05-08
1.2K0
从音视频技术看AI的机会和挑战
我关注AI完全是被动的,直到两件事改变了我对AI的看法。第一件发生在2017年5月,AlphaGo以3比0战胜柯洁。我的一个朋友当时在乌镇现场感受了这场人机大战,她向我描述了柯洁被逼到走投无路的无奈与绝望表情。另一件事在2018年初,现场聆听了蒋涛关于AI的分享,其中介绍了在Google内部,AI已经在大部分产品上应用,包括Youtube。由于工作关系,Youtube在AI方面的应用自然引起了我的注意,比如通过AI理解视频内容,自动截取最能表现视频内容的关键帧,可用于生成视频封面。
LiveVideoStack
2019-08-16
8710
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档