音视频技术开发周刊 | 234

LiveVideoStack

发布于 2022-03-04 13:13:31

7150

发布于 2022-03-04 13:13:31

文章被收录于专栏：音视频技术

每周一期，纵览音视频技术领域的干货。新闻投稿：contribute@livevideostack.com。

视频图像色彩增强的主要方法与落地实践

色彩增强作为视频后处理中画质增强技术的一部分，配合视频降噪，暗光增强，对比度调整，边缘增强等技术，可以对视频画质起到较大的提升作用。

26 fps 的视频超分辨率模型 DAP！在线输出720P视频

不同于现阶段VSR的两大热点研究方向：真实世界/盲VSR、VSR与传输，本文作者在实时在线领域超分方向实现突破，这与IPRRN一文的出发点类似。本文DAP的效果堪比EDVR，但是时间缩短了三倍，180P视频在线可达26FPS！

Seek 策略以及在有 B 帧情况下的处理

音视频开发入门：音频基础

什么是声音?介质振动在听觉系统中产生的反应。是一种波。因为是一种波，所以我们可以用频率、振幅等描述。有两个基本的物理属性：频率与振幅。

https://blog.jianchihu.net/av-develop-audio-basis.html

Apple又获空间音频新专利，揭秘AirPods Max设计的空间音频渲染处理器背后的技术特性

美国专利商标局公布了Apple的一项专利申请，该专利申请涉及用于AirPods Max的空间音频渲染处理器，该处理器可校准音频波束成形阵列处理算法，以响应可穿戴音频设备物理形状的变化。

iOS AVDemo（1）：音频采集，免费获取全部源码丨音视频工程示例

这个 Demo 里包含以下内容：1）实现一个音频采集模块；2）实现音频采集逻辑并将采集的音频存储为 PCM 数据；3）详尽的代码注释，帮你理解代码逻辑和原理。

视频编解码芯片设计原理--02 视频编码技术框架与标准

本系列主要介绍视频编解码芯片的设计，以HEVC视频编码标准为基础，简要介绍编解码芯片的整体硬件架构设计以及各核心模块的算法优化与硬件流水线设计。本文将介绍视频编码技术的混合编码框架和国内外主流编码标准的发展历程与特点。

小型深度学习框架 | TinyGrad，不到1K行代码（附代码下载）

最近，天才黑客 George Hotz 开源了一个小型深度学习框架 tinygrad，兼具 PyTorch 和 micrograd 的功能。tinygrad 的代码数量不到 1000 行，目前该项目获得了 GitHub 1400 星。

目标检测算法终结篇-YOLOv7正式开源

请注意，这里的7，不是下一代YOLO，而是一个幸运数字，姑且可以看作是一个代号。它的目的是让YOLO全面开花，不仅仅只是做目标检测。也不是简单的加一个semantic head做分割，而是做一个体系的目标检测积木模块，即插即用，使之能够更简单的做复杂的上层任务，比如多个分类head，实例分割，甚至是加上姿态检测等等。

https://zhuanlan.zhihu.com/p/464007111

FFmpeg 音视频倍速控制

本文除了会讲到通过命令行处理倍速，还会讲到通过FFmpeg api的方式去处理音频倍速和视频倍速，进而合并成支持倍速的音视频发布成rtmp或者存成flv文件。

FFmpeg 源码分析-转码1

本系列主要分析 transcode() 转码的内部逻辑。本文主要分析 transcode_init() 的内部逻辑。

https://juejin.cn/post/7052334621618831390

喧喧音视频迁移到 SRS 的总结

喧喧是一款具备音视频会议功能的私有部署的聊天协同办公软件。近期，我们集成了SRS作为喧喧中可选的音视频后端，让部署使用更加方便。