Bien que l’utilisation de l’audio dans les systèmes de vidéosurveillance ne soit pas encore très courante, cela peut améliorer la capacité d’un système à détecter et à interpréter les événements, et permettre la communication audio sur un réseau IP. Cependant, l’utilisation de l’audio pouvant être restreinte dans certains pays, il est préférable de s’informer auprès des autorités locales avant de l’implémenter.
Ce chapitre traite des scénarios d’application, de l’équipement audio, des modes audio, de l’alarme de détection audio, de la compression audio et de la synchronisation audio/ vidéo.
Le fait de disposer de fonctionnalités audio dans un système de vidéosurveillance peut constituer un atout précieux pour la détection et l’interprétation des événements, ainsi que dans les situations d’urgence. La capacité de l’audio à couvrir une zone sur 360 degrés permet à un système de vidéosurveillance d’étendre sa zone de couverture au-delà du champ de vision de la caméra. Il est possible de faire en sorte qu’une caméra PTZ ou caméra dôme PTZ (ou un opérateur de caméra) vérifie visuellement un endroit ou une alarme audio s’est déclenchée.
La fonctionnalité audio peut également permettre aux utilisateurs non seulement de voir, mais aussi d’écouter ce qui se passe dans un secteur et d’adresser des requêtes ou des injonctions aux visiteurs ou aux éventuels intrus. Par exemple, si une personne placée dans le champ de vision d’une caméra présente un comportement suspect (par exemple, elle tourne autour d’un distributeur automatique de billets) ou pénètre dans une zone restreinte, un agent de sécurité distant peut lui envoyer un avertissement verbal. En cas d’accident et de blessure physique d’une personne, le fait de pouvoir communiquer à distance et d’informer la victime qu’une assistance est en chemin peut également constituer un atout. Le contrôle d’accès (« portier » distant) représente un autre champ d’application, de même que les situations d’assistance à distance (par exemple, un parking souterrain sans personnel) et de vidéoconférence. Un système d’audiosurveillance accroît l’efficacité d’une solution de sécurité ou de contrôle à distance en augmentant la capacité d’un utilisateur distant à recevoir et à communiquer des informations.
Le support audio est plus facile à implémenter dans un système de vidéo sur IP que dans un système CCTV analogique. Dans un système analogique, des câbles audio et vidéo séparés doivent être installés de point de terminaison à point de terminaison ; autrement dit, des emplacements de la caméra et du microphone vers l’emplacement de visualisation/enregistrement. Si la distance entre le microphone et le poste de surveillance est trop élevée, un équipement d’amplification audio est nécessaire, ce qui augmente la complexité et les frais d’installation. Dans un système de vidéo sur IP, une caméra réseau avec support audio traite le son et envoie l’audio et la vidéo sur le même câble réseau, à des fins de contrôle et/ou d’enregistrement. Cela élimine la nécessité du câblage supplémentaire et facilite grandement la synchronisation audio/vidéo.
|
|
Une caméra réseau ou un encodeur vidéo avec fonctionnalité audio intégrée possède un microphone intégré et/ou une prise jack d’entrée ligne/micro. Avec le support entrée ligne/micro, les utilisateurs ont la possibilité d’utiliser un autre type ou une autre qualité de microphone que celui intégré à la caméra ou à l’encodeur vidéo. Cela permet également de raccorder le produit de vidéo sur IP à plusieurs microphones et de placer les microphones à une certaine distance de la caméra. Le micro¬phone doit toujours être placé le plus près possible de la source sonore, afin de réduire le bruit. En mode duplex intégral bidirectionnel, un microphone doit être placé à une certaine distance et de dos par rapport au haut-parleur, afin de réduire tout effet Larsen.
Peu de produits de vidéo sur IP Axis possèdent un haut-parleur intégré. Un haut-parleur actif (doté d’un amplificateur intégré) peut être raccordé directement à un produit de vidéo sur IP avec support audio. Un haut-parleur ne possédant pas d’amplificateur doit d’abord être raccordé à un amplificateur, qui lui-même est relié à une caméra réseau ou un encodeur vidéo.
Pour limiter les perturbations et le bruit, veillez à toujours utiliser un câble audio blindé et évitez de faire courir le câble à proximité de câbles d’alimentation et de câbles transportant des signaux de commutation à haute fréquence. Les câbles audio doivent être le plus court possible. Si cela n’est pas possible, un équipement audio (câble, amplificateur et microphone) doit être utilisé afin de réduire le bruit.
Selon l’application, il peut être nécessaire d’envoyer les signaux audio dans une seule direction ou dans les deux directions, ce qui peut être fait simultanément ou dans une direction à la fois. Il existe trois principaux modes de communication audio : unidirectionnel, semi-duplex et duplex intégral.
|
|
|
|
L’alarme de détection audio peut être utilisée comme complément de la détection de mouvement, car elle peut réagir à des événements se produisant dans des zones trop sombres pour que la fonction de détection de mouvement fonctionne correctement. Elle peut en outre servir à détecter toute activité dans des zones situées en dehors du champ de vision de la caméra.
La détection de sons (tels que des bris de vitres ou des voix dans une pièce) peut déclencher l’envoi et l’enregistrement audio/vidéo par une caméra réseau, l’envoi de messages électroniques ou toute autre alerte, et activer des périphériques externes tels que des alarmes. De même, des entrées d’alarme tels que des capteurs de mouvement et des contacts de portes peuvent être utilisés pour déclencher l’enregistrement audio/vidéo. Dans une caméra PTZ ou dôme PTZ, la détection d’alarme audio peut faire en sorte que la caméra se dirige automatiquement vers un emplacement prédéfini, tel qu’une fenêtre spécifique.
Les signaux audio analogiques doivent être convertis en signaux audio numériques grâce à un processus d’échantillonnage, puis compressés afin de réduire la taille et d’optimiser les performances de transmission et de stockage. La conversion et la com¬pression s’effectuent à l’aide d’un codec audio, un algorithme qui code et décode les données audio.
Il existe de nombreux codecs audio prenant en charge différentes fréquences d’échantillonnage et différents niveaux de compression. La fréquence d’échantillonnage fait référence au nombre de fois par seconde qu’un échantillon d’un signal audio analogique est pris ; elle est définie en hertz (Hz). En général, plus la fréquence d’échantillonnage est élevée, meilleure est la qualité audio et plus il faut d’espace de stockage et de bande passante.
Le débit est un facteur audio important car il détermine le niveau de compression et, par conséquent, la qualité audio. En général, plus le niveau de compression est élevé (plus le débit est faible), plus la qualité audio est faible. La différence de qualité audio des codecs se remarque plus à des niveaux de compression élevés (faible débit) qu’à des niveaux de compression faibles (débit élevé). Les niveaux de compression élevés peuvent également présenter davantage de latence ou délai, mais ils permettent d’économiser en bande passante et en espace de stockage.
Les débits les plus souvent sélectionnés avec les codecs audio sont compris entre 32 kbit/s et 64 kbit/s. Les débits audio, de même que les débits vidéo, sont un facteur important à prendre en considération lors du calcul des exigences totales en bande passante et en espace de stockage.
Les produits de vidéo sur IP Axis prennent en charge trois codecs audio. Le premier est AAC-LC (Advanced Audio Coding - Low Complexity), également appelé MPEG-4 AAC, qui requiert une licence. AAC-LC, en particulier à un taux d’échantillonnage de 16 kHz ou plus et à un débit de 64 kbits/s, est le codec recommandé afin d’obtenir la meilleure qualité audio possible. Les deux autres codecs sont G.711 et G.726, qui sont des technologies sans licence.
La synchronisation des données audio et vidéo est gérée par un lecteur multimédia (logiciel informatique utilisé pour la lecture des fichiers multimédias) ou par un cadre multimédia tel que Micro¬soft DirectX, qui est une collection d’interfaces de programmation qui gère les fichiers multimédias.
Les signaux audio et vidéo sont envoyés sur un réseau sous la forme de deux flux de paquets distincts. Pour que le client ou le lecteur puisse synchroniser parfaitement les flux audio et vidéo, les paquets audio et vidéo doivent être horodatés. L’horodatage des paquets vidéo utilisant la compression Motion JPEG n’est pas toujours pris en charge dans une caméra réseau. Si l’horodatage est pris en charge et qu’il est important de synchroniser les signaux audio et vidéo, le format vidéo à choisir est MPEG-4 ou H.264 car ces flux vidéo, avec le flux audio, sont envoyés à l’aide du protocole RTP (Real-time Transport Protocol), qui fournit un horodatage des paquets audio et vidéo. Néanmoins, il faut savoir que dans de nombreuses situations la synchronisation des séquences audio est moins importante (voire même parfois indésirable), notamment si les séquences audio ne sont pas destinées à être enregistrées mais juste surveillées.
Rubrique suivante: Technologies réseau