每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。
本文介绍了体积视频(Volumetric Video)的解释,创建体积视频所需的设备,并给出了具体的用例。
想从事(入门或者转行)音视频开发,要怎么做?很多人对此都有疑惑,不光有工作多年的职场老司机,也有求学期间的研究生同学们,本文帮你分析到底要不要从事音视频开发工作,以及如果从事音视频开发要怎么做?
如何让用户快速甚至实时地回顾到直播中的精彩镜头成了我们关注的问题,直接的人工剪辑需要耗费大量人力,我们希望通过设计算法来自动剪辑,将好看的精彩镜头实时呈现给观众。
在本文中,我们将深入了解谷歌的Widevine DRM解决方案——它是一种流行的DRM解决方案,在Web和移动生态系统中获得了广泛支持。
FFmpeg 源码分析-转码6
本系列 以 FFmpeg4.2 源码为准,FFmpeg 源码分析系列以一条简单的命令开始,ffmpeg -i a.mp4 b.flv,分析其内部逻辑。本文主要分析 process_input_packet() 的内部逻辑。
https://juejin.cn/post/7052338839527882766
iOS AVDemo(6):音频渲染,免费获得源码丨音视频工程示例
本文给出了HEVC重建环路的相关背景知识,并在此基础上分析了VLSI实现下重建环路所面临的实际问题,并有针对地在模块层次和架构层次对重建环路进行了优化。
本文主要对 AV1 编码器就如下几方面进行概述:发展历程、2022 年应用情况、设备部署和性能。此外,主讲还简要介绍了基于 Bitmovin 编码器的 AV1 编码流程。
本文收集整理了多个小目标检测、图像识别、图像分类等方向的开源数据集,本次还有猫咪、斯坦福狗狗数据集以及3D MNIST数字识别等~
今天,我们将研究如何在OpenCV框架中使用YOLO。YOLO于2016年问世,用于多目标检测,它与OpenCV框架兼容,但我们需要下载“ yolov3.weights”和“yolov3.cfg”。
本次演讲主要介绍了在视频云服务中的传输问题,介绍了其中同步的重要性,并给出了对于视频处理和传输流程中的延时记录和同步处理的解决框架。
在本教程中,我将回顾创建流媒体过程,测试我们制作的流的延迟,并介绍一些有价值的资源,让你熟悉 LL HLS 的当前性能包络。
GNN for Science: 腾讯AI Lab、清华共同发文综述等变图神经网络
在这篇综述里面,我们系统性的梳理了近年等变图神经网络的发展脉络,并且提供了一个简洁的视角帮助读者能够很快的理解这类网络的内涵。我们还详尽阐释了当前的挑战和未来的可能方向。
PP-YoLoE | PP-YoLov2全面升级Anchor-Free,速度精度完美超越YoLoX和YoLov5
第1部分介绍了问题陈述的设置、数据预处理、迁移学习背后的直觉、特征提取、微调和模型评估。
FP-DETR:通过完全预训练提升transformer目标检测器
最近,Detection Transformer[4,5,6,7]提供了一种简洁的目标检测框架,在实现端到端的同时也取得了不错的检测性能。
庞贝古城千年废墟复活:VR模型与眼动追踪复现被火山灰掩埋的建筑
VR技术现在已经进展到,即使古迹被火山灰埋了两千年,也可以复现出当年的原貌,还能为游客定制观景体验啦。
2022年GDC在美国旧金山于3月21日至25日召开。本次大会上出现了诸多令人眼前一亮的精彩瞬间,本文将会为大家呈现。
ICCV 2021 | R-MSFM: 用于单目深度估计的循环多尺度特征调制
图像拼接是计算机视觉中最成功的应用之一。如今,很难找到不包含此功能的手机或图像处理API。在这篇文章中,我们将讨论如何使用Python和OpenCV执行图像拼接。
波恩大学最新开源!自动驾驶场景自监督三维点云表征学习无需标注
在本文中,我们提出了一种在自动驾驶场景中 3D 点云数据的表征学习算法。我们提出了一种新的对比方法,旨在学习场景中不同结构和物体之间的关系和特征。
阅读推荐
我们有幸地采访到了七牛云技术总监陈辉,聊一聊这半年来七牛云在以音画质量为主线,结合自身 QRTC 产品进行的迭代和创新;以及七牛云未来在 RTC 方面的规划等内容。
本文由LiveVideoStack和赵加雨的对话整理而成,旨在还原一名技术创业者的思考,涉及创业、RTC与音视频PaaS、to B SaaS、出海和钉钉生态。
屏幕发声 | 扬声器和麦克风二合一的智能屏幕离我们还有多远?
活动推荐
【品牌专场】七牛云音画质量优化
在 2021 年的 LiveVideoStackCon 2021北京站大会中,七牛云音视频团队发布了结合行业特定属性的音画质量分析系统QoE。该系统可通过对通用音视频评价维度的打分和基于质量美学维度的评分相结合,客观综合地对数据源进行评价。至今发布,已有多家行业头部客户完成测试并上线,这一系统正在切实地助力客户业务发展。在即将开幕的LiveVideoStackCon 2022音视频技术大会上海站中,七牛云将继续以音画质量为主线,结合自身QRTC的产品,给大家带来这半年的迭代和创新。
活动时间:2022年5月21日 9:30~12:15
活动地点:上海·海神诺富特大酒店 麦哲伦3厅
报名地址:点击「阅读原文」立即报名。
本文分享自 LiveVideoStack 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!