每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。
据抓包是我们做业务测试、竞品分析的常用方法,在直播、短视频等常见的音视频业务场景能有好的数据抓包工具帮助,很多时候也能事半功倍,这里我们就介绍两款常见的数据抓包工具。
可视化音视频分析工具:好用工具大集锦,快转发给你兄弟看看丨音视频工具
工欲善其事,必先利其器。在音视频开发中,为了方便、快捷、直观的分析音视频数据,最好能有一些可视化的分析工具来帮助我们,这篇文章就来介绍一下常见的可视化音视频分析工具。
最近,GitHub 上一个图像超分辨率的项目火了,一个叫做 Real-CUGAN 的工具可以把动画图像的质量提升 2 到 4 倍,qq 上斗图的表情包也能给你脑补成 4k 品质。
声网Agora Lipsync 技术揭秘:通过实时语音驱动人像模拟真人说话
详解低延时高音质:丢包、抖动与 last mile 优化那些事儿
本篇是「详解低延时高音质系列」的第三篇技术分享。我们这次要将视角放大,从整个音频引擎链路的角度,来讲讲在时变的网络下,针对不同的应用场景,如何权衡音质和互动的实时性。
当我们使用的鱼眼镜头视角大于160°时,OpenCV中用于校准镜头“经典”方法的效果可能就不是和理想了。如果小伙伴也遇到了类似情况,那么这篇文章可能会对大家有一定的帮助。
近日,弗吉尼亚理工等机构开发出了一种语境感知分层深度修复技术,它利用基于学习的修复模型来迭代地合成新的颜色和深度信息,并借助标准图形引擎将这些老照片渲染成 3D 照片。
FFMpeg 源码分析-命令行总结
前面四篇文章已经把 ffmpeg_parse_options() 的内部逻辑以及内部函数分析完毕,下面画一张整体的流程图做为总结。
https://juejin.cn/post/7052335797558575117
WebRTC社区头部开源项目介绍
最近WebRTC相关的开源项目非常活跃,作者搜集了一部分,包括在github上star超过1k的开源项目,排名不分先后。
https://zhuanlan.zhihu.com/p/466992446
疫情期间,WebRTC 发挥了至关重要的作用,让所有人都保持联系,许多人对它的工作原理和所做的技术决定感到惊讶和困惑。这次演讲旨在为这些决定提供一些历史背景,希望能减少关于这些决定的困惑。
腾讯发布国内首份可解释 AI 报告:详解打开算法黑箱的理念与实践|附报告下载
研究表明,黑客可以使用内置运动传感器的流行虚拟现实(AR/VR)头盔,记录与语音相关的微妙面部动态,窃取通过语音命令交流的敏感信息,包括信用卡数据和密码。
分类器可视化解释StylEx:谷歌、MIT等找到了影响图像分类的关键属性
本文中,来自谷歌、 希伯来大学、 MIT 等机构的研究者提出了一种新的分类器可视化解释方法 StylEx,该方法能以不同方式修改图像属性来更改其分类器输出。
DMV 2021自动驾驶报告:Waymo平均接管里程骤跌,数据价值仍遭质疑
阅读推荐
对话OTTVerse创始人Krishna Rao Vijayanagar:创业之初,挑战与机遇并存
活动推荐
点击「阅读原文」,立即预约火山引擎视频云科技原力峰会直播。
本文分享自 LiveVideoStack 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!