前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数字音频基础知识

数字音频基础知识

作者头像
ke1th
发布2019-05-28 15:51:51
1.5K0
发布2019-05-28 15:51:51
举报
文章被收录于专栏:漫漫深度学习路

了解声音

声波

声音始于空气中的振动,如吉他弦、人的声带或扬声器纸盆产生的振动。这些振动一起推动邻近的空气分子,而轻微增加空气压力。压力下的空气分子随后推动周围的空气分子,后者又推动下一组分子,依此类推。高压区域穿过空气时,在后面留下低压区域。当这些压力波的变化到达人耳时,会振动耳中的神经末梢,我们将这些振动听为声音。

当您看到表示音频的可视化波形时,它反映了这些空气压力波。波形中的零位线是静止时的空气压力。当曲线向上摆动到波峰时,表示较高压力;当曲线向下摆动到波谷时,表示较低压力。

表现为可视化波形的声波

这里写图片描述
这里写图片描述

表现为可视化波形的声波

A. 零位线 B. 低压区域 C. 高压区域


波形测量

几个测量值描述了波形:

振幅: 反映从波形波峰到波谷的压力变化。高振幅波形的声音较大;低振幅波形的声音较安静。 周期: 描述单一、重复的压力变化序列,从零压力,到高压,再到低压,最后恢复为零。 频率: 以赫兹 (Hz) 为单位测量,描述每秒周期数。(例如,1000 Hz 波形每秒有 1000 个周期。)频率越高,音乐音调越高。 相位: 以度为单位测量,共 360 度,表示周期中的波形位置。零度为起点,随后 90º 为高压点,180º 为中间点,270º 为低压点,360º 为终点。 波长: 以英寸或厘米等单位测量,是具有相同相位度的两个点之间的距离。波长随频率的增加而减少。

这里写图片描述
这里写图片描述

左侧为单个周期;右侧为完整的 20 Hz 波形

A. 波长 B. 相位度 C. 振幅 D. 一秒


声波如何互相作用

在两个或更多声波相遇时,它们会彼此相加和减去。如果它们的波峰和波谷完全同相,则互相加强,因此产生的波形的振幅高于任何单个波形的振幅。

如果两个波形的波峰和波谷完全异相,则会相互抵消,导致完全没有波形。

然而,在大多数情况下,各种声波会存在不同程度的异相,产生比单个波形更复杂的组合波形。例如,表示音乐、语音、噪声和其他声音的复杂波形结合了各种声音的波形。

注意: 因为其独特的物理结构,单个乐器可以产生极复杂的声波。这就是小提琴和小号即使演奏相同音符但听起来不同的原因。

Examples:

这里写图片描述
这里写图片描述

同相声波互相加强。

这里写图片描述
这里写图片描述

异相声波互相抵消。

这里写图片描述
这里写图片描述

两个简单的声波组合成复杂的声波。


数字化音频

比较模拟和数字音频

在模拟和数字音频中,声音的传送和储存方式非常不同。

模拟音频:正负电压 麦克风将声音压力波转换成电线中的电压变化:高压成为正电压,低压成为负电压。当这些电压变化通过麦克风电线传输时,可以在磁带上记录成磁场强度的变化或在黑胶唱片上记录成沟槽大小的变化。扬声器的工作方式与麦克风相反,即通过音频录音和振动中的电压信号重新产生压力波。

数字音频:零和一 与磁带或黑胶唱片等模拟存储介质不同,计算机以数字方式将音频信息存储成一系列零和一。在数字存储中,原始波形被分成各个称为采样的快照。此过程通常称为数字化或采样音频,但有时称为模数转换。

从麦克风录制到计算机时,例如,模数转换器将模拟信号转换为计算机能够存储和处理的数字样本。


了解采样率

采样率表示音频信号每秒的数字快照数。该速率决定了音频文件的频率范围 。采样率越高,数字波形的形状越接近原始模拟波形。低采样率会限制可录制的频率范围,这可导致录音表现原始声音的效果不佳。

这里写图片描述
这里写图片描述

两个采样率

A. 使原始声波扭曲的低采样率。 B. 完全重现原始声波的高采样率。

为了重现给定频率,采样率必须至少是该频率的两倍。例如,CD 的采样率为每秒 44,100 个采样,因此可重现最高为 22,050 Hz 的频率,此频率刚好超过人类的听力极限 20,000 Hz。

以下是数字音频最常用的采样率:

这里写图片描述
这里写图片描述

了解位深度

位深度决定动态范围。采样声波时,为每个采样指定最接近原始声波振幅的振幅值。较高的位深度可提供更多可能的振幅值,产生更大的动态范围、更低的噪声基准和更高的保真度。

这里写图片描述
这里写图片描述

位深度越高,提供的动态范围越大。


以 dBFS 为单位测量振幅

在数字音频中,幅度以满量程的分贝数或 dBFS 为单位测量。最大可能的振幅为 0 dBFS;所有低于该值的振幅均表示为负数。

注意: 给定的 dBFS 值不直接对应于以声学 dB 为单位测量的原始声音压力级别。


音频文件的内容和大小

硬盘中的音频文件(如 WAV 文件),包含一个表示采样率和位深度的小标头,然后是一长列数字,每个采样一个数字。这些文件可能非常大。例如,在每秒 44,100 个采样和每采样 16 位下,一个单声道文件每秒需要 86 KB,每分钟大约 5 MB。对于具有两个声道的立体声文件,该数字将翻倍到每分钟 10 MB。

参考资料

https://helpx.adobe.com/cn/audition/user-guide.html?topic=/cn/zh-Hans/audition/morehelp/digital_audio_fundamentals.ug.js

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年03月13日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 了解声音
    • 声波
      • 波形测量
        • 声波如何互相作用
        • 数字化音频
          • 比较模拟和数字音频
            • 了解采样率
              • 了解位深度
                • 以 dBFS 为单位测量振幅
                  • 音频文件的内容和大小
                  • 参考资料
                  领券
                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档