監視におけるサウンド

音について

音の基本的な性質について見てみましょう。

音とは、トランペットスピーカーや人の声帯などの機械的振動により生じる空気中の圧縮波のことです。圧縮波は、波紋と同じような方法で空気中に拡散します。人の耳はこの振動を拾って、音として認識します。

振動の周波数によって、認識される音の高さが変わります。低周波数は低音として、高周波数はトレブルまたは高音として認識されます。人の耳が認識することのできる音の周波数の範囲は、20 Hz (周波数/秒) から20 kHzとされていますが、年齢とともに、上限がわずかに低下します。人の声による音の範囲は、通常150 Hzから5 kHzです。

録音するには、マイクが必要です。マイクの中の薄い膜が入ってくる圧力変動に反応し、同じ周波数で振動を開始します。この振動によって変動する電圧が発生し、増幅されたり、導体 (ワイヤー) によって伝搬されたりします。この電圧変動がトランペットスピーカーに送られると、もとの振動が空気に再度伝搬され、音を再生します。

録音中は、電気信号が1秒間に数千回標本化 (サンプリング/採取) されます。録音したい周波数の最低でも2倍のサンプリング周波数が必要です。すなわち11 kHzまでの音声を録音する場合は、最低でも毎秒22,000回のサンプリング周波数が必要です。

図1:サンプリング周波数が低い場合と高い場合。

ビット深度は、各サンプルの解像度を制御します。ビット深度が高いと、各サンプルの信号レベルはより正確に保存されます。

図2:ビットレートが低い場合と高い場合。

サンプリング周波数とビット深度を掛けると、音声をデジタル方式で伝送または保存する際に必要な実データの帯域幅、すなわちビットレートを得ることができます。デジタルデータをエンコードすると圧縮され、ビットレートが低下します。G.711またはアドバンスト・オーディオコーデックなど、こうしてビットレートを低下させるエンコーダを複数取り揃えています。

より近くへ