首页
学习
活动
专区
工具
TVP
发布

音视频技术

专栏作者
1271
文章
1363654
阅读量
287
订阅数
基于无监督预训练的语音识别技术落地实践 火山语音表示有话要说
 点击上方“LiveVideoStack”关注我们 ▲扫描图中二维码或点击阅读原文▲ 了解音视频技术大会更多信息 ---- 一直以来,火山语音团队都为时下风靡的视频平台提供基于语音识别技术的智能视频字幕解决方案,简单来说就是可以自动将视频中的语音和歌词转化成文字,来辅助视频创作的功能。但伴随平台用户的快速增长以及对语言种类更加丰富多样的要求,传统采用有监督学习技术来解决的办法日渐遭遇瓶颈,这让团队着实犯了难。 众所周知,传统的有监督学习会对人工标注的有监督数据产生严重依赖,尤其在大语种的持续优化以及小语
LiveVideoStack
2023-04-04
5970
AR下的RTC技术与应用
 点击上方“LiveVideoStack”关注我们 ▲扫描图中二维码或点击阅读原文▲ 了解音视频技术大会更多信息 编者按:LiveVideoStack很荣幸地邀请到了来自Rokid应用平台算法负责人,王文兵老师,为我们分享介绍AR下的RTC技术与应用。 文/王文兵 整理/LiveVideoStack‍‍ 我是王文兵,Rokid应用平台的算法负责人,曾就职于百度、MTK,现在在Rokid负责AR以及语音识别系统、视觉识别系统的框架设计和算法研发,今天为大家带来的topic是AR下的RTC技术与应用。 很高
LiveVideoStack
2023-02-23
3840
坐席辅助系统中语音与文本的碰撞
 点击上方“LiveVideoStack”关注我们 ▲扫描图中二维码或点击阅读原文▲ 了解音视频技术大会更多信息 编者按:在贷后催收行业中,每个公司每天的录音量可达上万小时,因此语音识别功能对其非常重要。今天LiveVideoStack大会邀请到了洞听智能的张玉腾老师,为我们介绍在坐席辅助系统中,语音与文本的碰撞。 文/张玉腾 整理/LiveVideoStack‍‍ 大家好!我是青岛洞听智能的算法工程师张玉腾,我们公司在去年四月份成立。在2016年,我们已经是联信集团的一个智能化部门,一直在做语音与文本相
LiveVideoStack
2023-02-23
5450
音视频技术开发周刊 | 278
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 ---- AI双眼皮,让您重焕“睛”彩 AI 双眼皮生成是快手 Y-tech 自研的人像美化项目,提出的基于形状和纹理显示分离的生成式算法解决了 domain 间小风格迁移的难题,所生成的双眼皮能够兼顾真实和美感,已经上线“一甜相机"app->美型->眼睛->双眼皮 和"快手"app拍摄页面->美化->医美级->双眼皮,欢迎关注和使用。 KALOS.art AI 作品每周精选 001 2022年
LiveVideoStack
2023-02-23
5810
免费开放丨Kaldi语音识别理论与实践课
---- 距Kaldi语音识别理论与实践课上线已经过去了两个月,本课程作为语音识别领域的敲门砖,受到同学们的力荐。鉴于kaldi在行业上越趋普及,但仍有许多AI语音爱好者及小白无法掌握和入门而被劝退,为促进产学研的快速发展,助力AI语音落地,帮助更多的同学了解Kaldi语音识别的相关知识,语音之家工匠学堂现将《Kaldi语音识别理论与实践》免费开放! 本课程为2022年秋季正在更新的与时俱进的实战课程,由清华大学语音识别实验室讲师教研教学,如果你想独立构造一套基础的语音识别系统, 或者你是一名零基础的语音
LiveVideoStack
2022-09-06
1K0
邓滨:信号处理+深度学习才能实现语音交互
📷 本文来自小鱼在家首席音频科学家邓滨在LiveVideoStackCon 2018讲师热身分享,并由LiveVideoStack整理而成。邓滨认为,传统的信号处理与前沿的深度学习技术结合,才能实现准
LiveVideoStack
2021-09-01
6240
搞多媒体开发?吴威麒:先拉个书单看看
LiveVideoStack:吴威麒你好,能否简要介绍下自己,包括目前的主要工作及关注领域?
LiveVideoStack
2021-09-01
2810
使用VoiceFliter-Lite改进设备上的语音识别
原文链接 / https://ai.googleblog.com/2020/11/improving-on-device-speech-recognition.html
LiveVideoStack
2020-12-02
6920
情感语音合成技术难点突破与未来展望
回放链接:https://www.livevideostack.cn/video/sillon/
LiveVideoStack
2020-07-10
1.8K0
从音视频技术看AI的机会和挑战
我关注AI完全是被动的,直到两件事改变了我对AI的看法。第一件发生在2017年5月,AlphaGo以3比0战胜柯洁。我的一个朋友当时在乌镇现场感受了这场人机大战,她向我描述了柯洁被逼到走投无路的无奈与绝望表情。另一件事在2018年初,现场聆听了蒋涛关于AI的分享,其中介绍了在Google内部,AI已经在大部分产品上应用,包括Youtube。由于工作关系,Youtube在AI方面的应用自然引起了我的注意,比如通过AI理解视频内容,自动截取最能表现视频内容的关键帧,可用于生成视频封面。
LiveVideoStack
2019-08-16
8710
滴滴李先刚:语音识别在复杂场景的性能将显著提升
李先刚:我目前任职于滴滴出行AI Labs首席算法工程师,负责滴滴语音相关的技术和应用,关注的领域包括语音相关前沿算法(包括语音识别、说话人识别和自然语言处理等)和他们的产业应用(尤其是在出行场景中的应用)。
LiveVideoStack
2019-07-15
1.7K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档