감시 시스템의 사운드

소리 관련 정보

소리의 기본적인 특성 관련 기본 사항을 살펴보겠습니다.

소리는 스피커나 사람의 성대가 물리적으로 진동하면서 발생시킨 공기 중의 압축파입니다.이러한 압축파는 물결과 유사한 방식으로 공기를 통해 전파됩니다.사람의 귀는 이러한 진동을 포착한 후 소리로 해석합니다.

진동 주파수는 사람이 인식하는 소리의 높이를 결정합니다.저주파는 베이스 톤으로 들리고, 고주파는 고음 또는 높은 톤으로 들립니다.사람의 귀는 20 hz(초당 진동수) ~ 20 khz 사이의 주파수를 감지할 수 있습니다. 나이가 들면 고주파수 한계가 약간 감소합니다.사람의 음성은 일반적으로 150 hz ~ 5 khz 사이입니다.

소리를 녹음하려면 마이크가 필요합니다.마이크의 얇은 막이 들어오는 압력 변화에 반응하며 동일한 주파수로 진동하기 시작합니다.이러한 진동은 가변 전기 전압을 생성하며, 가변 전기 전압은 증폭되어 도체(와이어)를 통해 전송될 수 있습니다.스피커로 공급된 가변 전압은 원래의 진동을 공기로 다시 전환하며, 소리가 재생됩니다.

녹음 시 전기 신호에는 초당 수천 회의 샘플링이 실시됩니다.샘플 레이트는 기록하고자 하는 주파수의 최소 두 배가 되어야 합니다. 따라서 최대 11 khz의 소리에 대해서는 초당 최소 22,000회의 샘플링이 실시되어야 합니다.

그림 1: 낮은 샘플 레이트 vs 높은 샘플 레이트.

비트 심도는 각 샘플의 해상도를 조절합니다.비트 심도가 높으면 각 샘플의 신호 레벨을 높은 정밀도로 저장할 수 있습니다.

그림 2: 낮은 비트 레이트 vs 높은 비트 레이트.

비트 심도에 샘플 레이트를 곱하면 소리를 디지털로 전송하거나 저장하는 데 필요한 실제 데이터 대역폭인 비트 레이트를 구할 수 있습니다. 엔코딩은 이러한 디지털 데이터를 압축하여 비트 레이트를 감소시키는 것입니다.이러한 목적으로 G.711 또는 Advanced Audio Codec 등과 같은 여러 엔코더를 사용할 수 있습니다.

더욱 가까이