Audio

A pesar de que el uso de audio en sistemas de videovigilancia todavía no se ha extendido, el hecho es que puede mejorar la capacidad de un sistema para detectar e interpretar eventos, así como permitir la comunicación de audio a través de una red IP. Sin embargo, el uso de audio puede estar restringido en algunos países, de modo que previamente se debería verificar con las autoridades locales.

Aplicaciones de audio

El audio integrado en un sistema de videovigilancia puede suponer una gran ventaja para un sistema a la hora de detectar e interpretar eventos y situaciones de emergencia. La capacidad del audio de cubrir un área de 360 grados permite que el sistema de videovigilancia amplíe su cobertura más allá del campo de visión de la cámara. Puede dar órdenes a una cámara PTZ o una cámara domo PTZ (o alertar a quien las opere) para comprobar visualmente una alarma de audio.

El audio también se puede utilizar para proporcionar a los usuarios la capacidad de escuchar lo que pasa en un área, además de comunicar órdenes o peticiones a los visitantes o intrusos. Por ejemplo, si una persona que se encuentra en el campo de visión de la cámara muestra un comportamiento sospechoso, como merodear cerca de un cajero automático, o es vista entrando en un área restringida, un guardia de seguridad remoto puede advertir verbalmente a esa persona. En una situación en la que una persona resulta herida también puede ser beneficioso poder comunicarse a distancia con ella o avisarle de que ya acuden en su ayuda. Otra área de aplicación es el control de acceso, es decir, un “portero” remoto en la entrada. Otras aplicaciones incluyen una situación de asistencia remota (por ejemplo, un garaje no controlado) y la videoconferencia. Un sistema de vigilancia audiovisual aumenta la efectividad de una solución de seguridad o supervisión a distancia gracias a la mejora de la capacidad del usuario para recibir y comunicar información a distancia.

Soporte de audio y equipo

El soporte de audio es más fácil de implementar en un sistema de vídeo en red que en un sistema analógico CCTV. En un sistema analógico, los distintos cables de audio y vídeo se deben instalar de extremo a extremo, es decir: desde la ubicación de la cámara y el micrófono hasta la ubicación de visualización/grabación. Si la distancia entre el micrófono y la estación de vigilancia es demasiado grande, se deberá utilizar un equipo de línea equilibrada de audio, lo que aumenta el coste y las dificultades de instalación. En un sistema de vídeo en red, una cámara de red con soporte de audio procesa el audio y envía tanto el audio como el vídeo a través del mismo cable de red para supervisarlo o grabarlo. Esto elimina la necesidad de un cable adicional y facilita la tarea de sincronización de audio y vídeo.

Un sistema de vídeo en red con soporte de audio integrado. Las transmisiones de audio y vídeo se envían a través del mismo cable.

Algunos codificadores de vídeo tienen audio integrado, lo que hace posible añadir audio incluso si se utilizan cámaras analógicas en la instalación.

Una cámara de red o un codificador de vídeo con la funcionalidad de audio integrado incluye a menudo un micrófono integrado y/o toma de entrada de micrófono/línea. Con el soporte de entrada de micrófono/línea los usuarios tienen la opción de utilizar otro tipo o calidad de micrófono que el que integra la cámara o codificador de vídeo. También permite que el producto de vídeo en red se conecte a más de un micrófono, y éste puede ubicarse a cierta distancia de la cámara. El micrófono se debería colocar siempre lo más cerca posible a la fuente de sonido para poder reducir el ruido. En el modo bidireccional dúplex completo, el micrófono se debería colocar de espaldas y a cierta distancia del altavoz para reducir la realimentación del mismo.

Muchos productos de vídeo en red Axis no llevan el altavoz integrado. Un altavoz activo — un altavoz con un amplificador integrado — se puede conectar directamente a un producto de vídeo en red con soporte de audio. Si un altavoz no tiene un amplificador integrado, primero deberá conectarse a un amplificador, que a su vez estará conectado a una cámara de red o codificador de vídeo.

Para minimizar el ruido y las interrupciones, siempre se debe utilizar un cable de audio blindado y evitar soltar el cable cerca de cables eléctricos o cables que transporten señales de conexión de alta frecuencia. Asimismo, los cables de audio deberían tener la menor longitud posible. Si se necesita un cable de audio largo, se debe usar un equipo de línea equilibrada de audio — es decir, cable, amplificador y micrófono con línea equilibrada.

Modos de audio

En función de la aplicación, es posible que sea necesario enviar audio sólo en una dirección o en ambas direcciones, lo que puede hacerse de forma simultánea o en una dirección cada vez. Hay tres modos básicos de comunicación de audio: símplex, semidúplex y dúplex completo.

Símplex

En el modo símplex, el audio sólo se envía en una dirección. En este caso, el audio se envía de la cámara al operador. Las aplicaciones incluyen supervisión a distancia y videovigilancia.

En este ejemplo de modo símplex, el audio lo envía el operador a la cámara. Se puede utilizar, por ejemplo, para dar instrucciones de voz a una persona que se ve a través de la cámara o para alejar a un posible ladrón de coches de un aparcamiento.

Semidúplex

En el modo semidúplex, el audio se envía en ambas direcciones, pero sólo puede enviar una de las partes cada vez. Este modo es similar a un walkie-talkie.

Dúplex completo

En el modo dúplex completo, el audio se envía a y desde el operador simultáneamente. Este modo de comunicación es similar a una conversación telefónica. El dúplex completo requiere que el PC cliente disponga de una tarjeta de sonido con soporte para audio dúplex completo.

Alarma por detección de audio

La alarma por detección de audio se puede usar como complemento a la detección de movimiento de vídeo, ya que puede reaccionar a eventos que se produzcan en áreas demasiado oscuras en las que la función de detección de movimiento pueda no funcionar correctamente. También se puede utilizar para detectar actividad en las áreas que quedan fuera de la visión de la cámara.

Cuando se detectan sonidos como el de una ventana al romperse o de voces en una habitación, éstos pueden provocar que la cámara de red envíe y grabe vídeo y audio, envíe correos electrónicos u otras alertas, y active dispositivos externos como, por ejemplo, alarmas. De un modo similar, las entradas de alarma como la detección de movimiento o contactos con la puerta se pueden utilizar para activar las grabaciones de vídeo y audio. En una cámara PTZ o cámara domo PTZ, la detección de la alarma de audio puede activar la cámara para que gire automáticamente hacia una ubicación predeterminada como, por ejemplo, una ventana concreta.

Compresión de audio

Las señales de audio analógicas se deben convertir a audio digital mediante un proceso de muestreo, y después deben comprimirse para reducir el tamaño y posibilitar una transmisión y almacenamiento efectivos. La conversión y compresión se realiza con un códec de audio, un algoritmo que codifica y descodifica datos de audio.

Frecuencia de muestreo

Existen diferentes códecs de audio compatibles con las distintas frecuencias y niveles de compresión. El concepto de frecuencia de muestreo se refiere al número de muestras por segundo tomadas de una señal de audio analógica y se mide en hercios (Hz). En general, cuánto más alta sea la frecuencia de muestreo, mejor será la calidad de audio y mayores serán los requerimientos de banda ancha y almacenamiento.

Frecuencia de bits

La frecuencia de bits es un parámetro importante del audio, ya que determina el nivel de compresión y, por lo tanto, la calidad del audio. Generalmente, cuánto más alto sea el nivel de compresión (cuánto más baja sea la frecuencia de bits), más baja será la calidad de audio. Las diferencias en la calidad de audio de los códecs pueden percibirse especialmente a altos niveles de compresión (frecuencia de bits baja), pero no en niveles de compresión bajos (frecuencia de bits alta). Es posible que los niveles altos de compresión impliquen una mayor latencia o retraso, pero permiten un gran ahorro de banda ancha y almacenamiento.

Las frecuencias de bits que se utilizan con más frecuencia en los códecs de audio se sitúan entre 32 kbit/s y 64 kbit/s. La frecuencia de bits de audio, así como de vídeo, es una consideración relevante a tener en cuenta a la hora de calcular los requisitos totales de ancho de banda y almacenamiento.

Códecs de audio

Los productos de vídeo en red Axis son compatibles con tres códecs de audio. El primero es el AAC-LC (Advanced Audio Coding - Low Complexity, Codificación de audio avanzada - Baja complejidad), también conocido como MPEG-4 AAC, el cual requiere una licencia. El AAC-LC, especialmente a una frecuencia de muestreo de 16 kHz o mayor y una frecuencia de bits de 64 kbit/s, es el códec que se recomienda utilizar cuando se necesita la mejor calidad de audio. Los otros dos códecs son G.711 y G.726, y no requieren licencia alguna.

Sincronización de audio y vídeo

La sincronización de datos de audio y vídeo se realiza con un reproductor multimedia (un programa de ordenador que se usa para reproducir archivos multimedia) o con un entorno multimedia como Microsoft DirectX, una colección de interfaces de programación de aplicaciones que maneja archivos multimedia.

El audio y el vídeo se envían a través de una red como dos flujos de paquetes individuales. Para que el cliente o reproductor pueda sincronizar perfectamente las transmisiones de audio y vídeo, dichos paquetes deben llevar un sello de fecha y hora. Es posible que la cámara de red no sea siempre compatible con el código de tiempo de los paquetes de vídeo que utilizan la compresión Motion JPEG. En ese caso, y si es importante que el vídeo y el audio estén sincronizados, el formato de vídeo que deberá elegirse es MPEG-4 o H.264, puesto que dichas transmisiones de vídeo, junto con las de audio, se envían con el RTP (Real-time Transport Protocol – Protocolo de transporte en tiempo real), que introduce un código de tiempo en los paquetes de audio y vídeo. No obstante, existen muchas situaciones en las cuales el audio sincronizado no es tan importante o incluso no es adecuado (por ejemplo, si el audio debe supervisarse pero no grabarse).