Audio

영상 감시 시스템에서 아직은 오디오가 널리 사용되고 있지는 않지만 오디 오를 사용하면 시스템의 이벤트 감지 및 해석 능력이 향상되며 IP 네트워크 를 통한 오디오 통신이 가능합니다. 하지만 일부 국가에서는 오디오 사용을 제한할 수 있으므로 지역 당국에 확인해보는 것이 좋습니다.

이 장에서는 응용 시나리오, 오디오 장비, 오디오 모드, 오디오 디텍션 알람, 오디오 압축, 오디오/비디오 동기화 등에 대해 설명합니다. 

오디오 응용

오디오를 영상 감시 시스템의 일부분으로 통합하면 시스템의 이벤트와 긴급 상황 감 지 및 해석 능력을 눈에 띄게 향상시킬 수 있습니다. 오디오 기능이 전방위적으로 작 동하므로 영상 감시 시스템을 통해 카메라 화각 이면의 상황까지도 감지할 수 있습 니다. 이를 통해 오디오 알람을 시각적으로 확인하도록 PTZ 카메라에 지시(또는 운 영자에게 경고)할 수 있습니다. 

또한 오디오는 사용자가 어떤 영역에서 나는 소리를 듣는 것뿐만 아니라 방문자나 침입자에게 명령 또는 요청을 전달하는 데에도 사용할 수 있습니다. 예를 들어, 카 메라 화각 내에 있는 어떤 사람이 현금인출기 근처에서 서성거리거나 제한 구역에 들어가는 등 의심스러운 행동을 보일 경우, 원격에 있는 보안 담당자가 그 사람에게 구두 경고를 보낼 수 있습니다. 어떤 사람이 부상을 당한 상황일 경우, 피해자와 원 격 통신을 하여 구조대가 도착할 것이라는 사실을 알릴 수 있는 점 역시 장점이라고 할 수 있습니다. 출입구의 원격 ‘경비원’이라 할 수 있는 출입 통제(Access Control) 는 또 다른 응용 사례입니다. 다른 응용 사례로는 원격 안내소(예: 무인 주차장), 화상 회의 등을 꼽을 수 있습니다. 시청각 감시 시스템은 원격 사용자의 정보 수신 및 전 달 능력을 향상시킴으로써 보안 또는 원격 모니터링 솔루션의 효율성을 높여줍니다.

오디오 지원 및 장비

오디오 지원은 아날로그 CCTV 시스템보다 네트워크 비디오 시스템에서 더 쉽게 구현 할 수 있습니다. 아날로그 시스템에서는 엔드포인트에서 엔드포인트까지 즉, 카메라와 마이크 위치에서 관찰/녹화 위치까지 별도의 오디오 및 비디오 케이블을 포설해야 합 니다. 마이크와 스테이션 간의 거리가 너무 길면 안정된 오디오 장비를 사용해야 하는 데, 이 경우 설치 비용이 증가하고 설치가 어렵습니다. 네트워크 비디오 시스템에서는 오디오가 지원되는 네트워크 카메라가 동일한 네트워크 케이블을 통해 오디오를 처리 하고 오디오와 비디오를 둘 다 전송하여 모니터링 및/또는 녹화를 합니다. 따라서 별도 의 케이블이 필요하지 않으며 오디오 및 비디오를 더 쉽게 동기화할 수 있습니다

통합 오디오 지원이 가능한 네트워크 비디오 시스템. 오디오와 비디오 스트림은 동일한 네트워크 케이블로 전송됩니다.

 일부 비디오 엔코더에는 내장형 오디오가 있어, 설치에 아날로그 카메라를 사용한 경우라 하더라도 오디오를 추가할 수 있습니다.

통합 오디오 기능이 있는 네트워크 카메라 또는 비디오 엔코더에는 내장형 마이크 및/또는 마이크 입력/라인 입력 잭이 제공되는 경우가 많습니다. 마이크 입력/라인 입력이 지원되면 사용자는 카메라 또는 비디오 엔코더에 내장된 것과는 다른 마이크 유형이나 품질을 사용할 수 있습니다. 이뿐만 아니라 네트워크 비디오 제품을 두 개 이상의 마이크에 연결하는 것이 가능해지며, 마이크를 카메라에서 조금 떨어진 곳 에 설치할 수 있습니다. 마이크는 노이즈를 줄이기 위해 항상 소리가 나는 곳에서 최 대한 가까운 곳에 두어야 합니다. 양방향 전이중 모드에서 마이크는 스피커로부터 의 피드백을 줄이기 위해 스피커에서 반대쪽으로 약간 떨어진 곳에 놓아야 합니다.

많은 Axis 네트워크 비디오 제품에는 스피커가 내장되어 있지 않습니다. 액티브 스피 커(증폭기가 내장된 스피커)를 오디오를 지원하는 네트워크 비디오 제품에 직접 연 결할 수 있습니다. 스피커에 증폭기가 내장되어 있지 않은 경우, 먼저 증폭기에 연결 한 다음 네트워크 카메라/비디오 엔코더에 연결해야 합니다.

방해 전파와 노이즈를 최소화하기 위해서는 항상 차폐된 오디오 케이블을 사용해야 하며, 전원 케이블과 고주파수 전환 신호를 전달하는 케이블 옆에 해당 케이블을 배 선하지 않도록 합니다. 또한 오디오 케이블은 최대한 짧아야 합니다. 긴 오디오 케이 블이 필요할 경우에 노이즈를 줄이려면 케이블, 증폭기, 마이크가 모두 평형 상태인 안정된 오디오 장비를 사용해야 합니다.

오디오 모드

애플리케이션에 따라 단방향 또는 양방향으로 오디오를 전송해야 하는 경우가 있는 데, 이러한 전송은 동시에 또는 한 번에 한 방향에서 이루어질 수 있습니다. 오디오 통신에는 단방향, 반이중, 전이중의 세 가지 기본 모드가 있습니다.

단방향

 단방향 모드에서 오디오는 한 방향으로만 전송됩니다. 이 경우, 카메라를 통해 오디오가 운영자에게 전송됩니다. 응용 분야로는 원격 모니터링 및 영상 감시가 있습니다.

In this example of a simplex mode, audio is sent by the operator to the camera. It can be used, for instance, to provide spoken instructions to a person seen on the camera or to scare a potential car thief away from a parking lot.

반이중

 반이중 모드에서 오디오는 양방향으로 전송되지만 한 번에 한쪽에서만 전송할 수 있습니 다. 무전기와 유사합니다.

전이중

I전이중 모드에서는 운영자가 동시에 오디오를 수신 및 전송할 수 있습니다. 이러한 통신 모드는 전화 통화와 유사합니다. 전이중 모드를 사용하려면 클라이언트 PC에 전이중 오디오를 지원 하는 사운드 카드가 장착되어 있어야 합니다.

오디오 디텍션 알람

오디오 디텍션 알람은 비디오 모션 디텍션 기능이 제대로 작동하기에는 너무 어두운 영역에서 발생하는 이벤트에 반응할 수 있으므로, 비디오 모션 디텍션 기능을 보완 하는 용도로 사용할 수 있습니다. 또한 카메라 시야 밖에 있는 영역에서 일어나는 활 동을 감지하는 데에도 사용할 수 있습니다.

창문을 깨는 소리나 방 안의 목소리와 같은 소리가 감지되면 네트워크 카메라가 비 디오와 오디오의 전송 및 녹화를 시작하고, 이메일이나 기타 경고 메시지를 전송하 며, 알람 등의 외부 장치를 가동시킵니다. 이와 마찬가지로, 모션 디텍션이나 문 접촉 과 같은 알람 입력을 통해 비디오 및 오디오 녹화를 시작하도록 할 수 있습니다. PTZ 카메라에서는 오디오 디텍션을 사용해 카메라가 자동으로 특정 창문 등과 같은 사전 설정 위치로 이동하도록 할 수 있습니다.

오디오 압축

아날로그 오디오 신호는 효율적으로 전송 및 저장할 수 있도록 샘플링 과정을 통해 디지털 오디오로 변환한 다음, 압축하여 크기를 줄여야 합니다. 변환과 압축은 오디 오 코덱, 즉 오디오 데이터를 코딩하고 디코딩하는 알고리즘을 사용하여 수행됩니다.

샘플링 주파수

다양한 샘플링 주파수와 압축 수준을 지원하는 여러 가지 다양한 오디오 코덱이 있 습니다. 샘플링 주파수는 초 당 아날로그 오디오 신호 샘플이 포착되는 횟수를 의미 하며, 헤르츠(Hz) 단위로 정의됩니다. 일반적으로 샘플링 주파수가 높을수록 오디오 품질이 좋고 대역폭과 저장 공간의 필요도 높아집니다.

비트 레이트

비트 레이트에 따라 압축 수준이 결정되고 이에 따라 오디오 품질이 결정되기 때문 에, 비트 레이트는 오디오에서 중요한 설정입니다. 일반적으로 압축 수준이 높을수록 (비트 레이트가 낮을수록) 오디오 품질은 낮아집니다. 코덱의 오디오 품질 차이는 압 축 수준이 높을 때(비트 레이트가 낮을 때) 특히 눈에 띌 수 있지만 압축 수준이 낮을 때(비트 레이트가 높을 때)는 그렇지 않습니다. 또한 압축 수준이 높을수록 대기 시 간이나 지연 시간이 증가하지만 대역폭이나 저장 공간은 훨씬 절약할 수 있습니다.

오디오 코덱에서 가장 자주 선택되는 비트 레이트는 32kbit/s와 64kbit/s 사이입니다. 오디오 비트 레이트는 비디오 비트 레이트와 마찬가지로 전체 대역폭과 스토리지 요 구 사항 계산 시 고려해야 할 중요한 사항입니다.

오디오 코덱

Axis 네트워크 비디오 제품은 세 가지 오디오 코덱을 지원합니다. 첫 번째는 AACLC(Advanced Audio Coding-Low Complexity)인데, 이는 MPEG-4 AAC로도 알려져 있으며 라이센스가 필요합니다. 특히 샘플링 레이트가 16kHz 이상이고 비트 레이트 가 64kbit/s 이상인 조건에서 최상의 오디오 품질이 필요한 경우에 사용하도록 권장 하는 코덱이 AAC-LC입니다. 나머지 두 가지 코덱은 라이센스가 없는 ITU-T 표준인
G.711과 G.726입니다. 이 두 표준은 AAC-LC에 비해 지연 시간이 짧고 컴퓨팅 성능이 덜 필요합니다. G.711 및 G.726은 전화 통신에서 주로 사용되는 음성 코덱으로서 오 디오 품질이 낮습니다. 두 표준의 샘플링 레이트는 8kHz입니다. G.711의 비트 레이 트는 64kbit/s입니다. Axis의 G.726 구현은 24kbit/s 및 32kbit/s를 지원합니다. Axis 제품은 G.711 표준의 두 음향 압축 알고리즘 중 하나인 μ-law만을 지원합니다. G.711
사용 시, 클라이언트에서도 μ-law 압축을 사용해야 합니다.

오디오 및 비디오 동기화

오디오 및 비디오 데이터의 동기화는 미디어 플레이어(멀티미디어 파일 재생에 사 용되는 컴퓨터 소프트웨어 프로그램) 또는 멀티미디어 파일을 처리하는 애플리케이 션 프로그래밍 인터페이스의 모음인 Microsoft DirectX 등과 같은 멀티미디어 프레 임워크로 처리됩니다. 

오디오와 비디오는 두 가지 분리된 패킷 스트림으로 네트워크를 통해 전송됩니다. 클라이언트나 플레이어가 오디오와 비디오 스트림을 완벽하게 동기화할 수 있으려 면 오디오와 비디오 패킷에 타임스탬프를 지정해야 합니다. Motion JPEG 압축을 사 용한 비디오 패킷 타임스탬핑이 네트워크 카메라에서 항상 지원되는 것은 아닙니 다. 그러한 경우에 비디오 및 오디오의 동기화가 중요하다면 MPEG-4나 H.264 비디
오 형식을 선택하도록 합니다. 그러한 비디오 스트림은 오디오 스트림과 함께 비디 오 및 오디오 패킷에 타임스탬프를 지정하는 RTP(실시간 전송 프로토콜)를 사용하여 전송됩니다. 하지만, 동기화된 오디오가 덜 중요하거나 심지어 바람직하지 않은 경 우도 많이 있습니다. 예를 들어, 오디오를 모니터링해야 하지만 녹음은 하지 않아야 하는 경우를 들 수 있습니다.