监控声音

合理建议

接下来让我们谈一谈关于声音性质的基本情况!

声音是由机械振动(如扬声器或人的声带)在空气中引起的压缩波。压缩波以类似于水面上泛起的一圈圈涟漪的方式通过空气传播。人耳拾取这些振动,并将它们解读为声音。

振动的频率将决定感知到的音高。频率较低就会感知到低音,频率较高就会感知到高音。人耳可听到 20 赫兹(每秒钟振动次数)至 20 千赫兹之间的任何频率。随着年龄的增大,该上限会略有降低。人的声音通常在 150 赫兹到 5 千赫兹的范围内。

要录制声音,我们首先需要一个麦克风。麦克风中的薄膜对传入的压力变化作出响应,并开始以相同频率振动。该振动会产生不同电压,可被放大并经由电线传输。如果该电压变化反馈到扬声器中,振动将再次传输到空气中,造成声音再现。

录制时,电信号在每秒钟将被采样(检查或读取)数千次。与您要录制的声音频率相比,采样率至少应为录制声音频率的两倍,因此对于高达 11 千赫兹的任何声音,采样频率至少应为每秒种 22,000 次。

图 1:低采样率与高采样率对比图。

位深度控制每次采样的分辨率。位深度越高,每次采样的信号电平存储的精确度就越高。

图 2:低位速率与高位速率对比图。

如果您将采样率乘以位深度即可得到位速率 — 数字传送或存储声音所需的实际数据带宽。对数字数据进行编码将会对其进行压缩,从而降低位速率。某些编码器可实现此目的,如 G.711 或高级音频编解码器。

更接近