Audio

Bien que l’utilisation de l’audio dans les systèmes de vidéosurveillance ne soit pas encore très courante, cela peut améliorer la capacité d’un système à détecter et à interpréter les événements, et permettre la communication audio sur un réseau IP. Cependant, l’utilisation de l’audio pouvant être restreinte dans certains pays, il est préférable de s’informer auprès des autorités locales avant de l’implémenter.

Ce chapitre traite des scénarios d’application, de l’équipement audio, des modes audio, de l’alarme de détection audio, de la compression audio et de la synchronisation audio/vidéo.

Applications audio

Le fait de disposer de fonctionnalités audio dans un système de vidéosurveillance peut constituer un atout précieux pour la détection et l’interprétation des événements, ainsi que dans les situations d’urgence. La capacité de l’audio à couvrir une zone sur 360 degrés permet à un système de vidéosurveillance d’étendre sa zone de couverture au-delà du champ de vision de la caméra. Il est possible de faire en sorte qu’une caméra PTZ ou caméra dôme PTZ (ou un opérateur de caméra) vérifie visuellement un endroit ou une alarme audio s’est déclenchée.

La fonctionnalité audio peut également permettre aux utilisateurs non seulement de voir, mais aussi d’écouter ce qui se passe dans un secteur et d’adresser des requêtes ou des injonctions aux visiteurs ou aux éventuels intrus. Par exemple, si une personne placée dans le champ de vision d’une caméra présente un comportement suspect (par exemple, elle tourne autour d’un distributeur automatique de billets) ou pénètre dans une zone restreinte, un agent de sécurité distant peut lui envoyer un avertissement verbal. En cas d’accident et de blessure physique d’une personne, le fait de pouvoir communiquer à distance et d’informer la victime qu’une assistance est en chemin peut également constituer un atout. Le contrôle d’accès (« portier » distant) représente un autre champ d’application, de même que les situations d’assistance à distance (par exemple, un parking souterrain sans personnel) et de vidéoconférence. Un système d’audiosurveillance accroît l’efficacité d’une solution de sécurité ou de contrôle à distance en augmentant la capacité d’un utilisateur distant à recevoir et à communiquer des informations.

Équipement et support audio

Le support audio est plus facile à implémenter dans un système de vidéo sur IP que dans un système CCTV analogique. Dans un système analogique, des câbles audio et vidéo séparés doivent être installés de point de terminaison à point de terminaison ; autrement dit, des emplacements de la caméra et du microphone vers l’emplacement de visualisation/enregistrement. Si la distance entre le microphone et le poste de surveillance est trop élevée, un équipement d’amplification audio est nécessaire, ce qui augmente la complexité et les frais d’installation. Dans un système de vidéo sur IP, une caméra réseau avec support audio traite le son et envoie l’audio et la vidéo sur le même câble réseau, à des fins de contrôle et/ou d’enregistrement. Cela élimine la nécessité du câblage supplémentaire et facilite grandement la synchronisation audio/vidéo.

Système de vidéo sur IP avec support audio intégré. Les flux audio et vidéo sont envoyés sur le même câble réseau.

Certains encodeurs vidéo offrent un support audio intégré, ce qui permet d’ajouter le son même lorsque des caméras analogiques sont utilisées dans une installation.

Une caméra réseau ou un encodeur vidéo avec fonctionnalité audio intégrée possède un microphone intégré et/ou une prise jack d’entrée ligne/micro. Avec le support entrée ligne/micro, les utilisateurs ont la possibilité d’utiliser un autre type ou une autre qualité de microphone que celui intégré à la caméra ou à l’encodeur vidéo. Cela permet également de raccorder le produit de vidéo sur IP à plusieurs microphones et de placer les microphones à une certaine distance de la caméra. Le micro¬phone doit toujours être placé le plus près possible de la source sonore, afin de réduire le bruit. En mode duplex intégral bidirectionnel, un microphone doit être placé à une certaine distance et de dos par rapport au haut-parleur, afin de réduire tout effet Larsen.

Peu de produits de vidéo sur IP Axis possèdent un haut-parleur intégré. Un haut-parleur actif (doté d’un amplificateur intégré) peut être raccordé directement à un produit de vidéo sur IP avec support audio. Un haut-parleur ne possédant pas d’amplificateur doit d’abord être raccordé à un amplificateur, qui lui-même est relié à une caméra réseau ou un encodeur vidéo.

Pour limiter les perturbations et le bruit, veillez à toujours utiliser un câble audio blindé et évitez de faire courir le câble à proximité de câbles d’alimentation et de câbles transportant des signaux de commutation à haute fréquence. Les câbles audio doivent être le plus court possible. Si cela n’est pas possible, un équipement audio (câble, amplificateur et microphone) doit être utilisé afin de réduire le bruit.

Modes audio

Selon l’application, il peut être nécessaire d’envoyer les signaux audio dans une seule direction ou dans les deux directions, ce qui peut être fait simultanément ou dans une direction à la fois. Il existe trois principaux modes de communication audio : unidirectionnel, semi-duplex et duplex intégral.

Unidirectionnel

En mode unidirectionnel, le signal audio est envoyé dans une seule direction. Dans ce cas, le signal audio est envoyé par la caméra à l’opérateur. Ce mode peut être utilisé dans des applications de vidéosurveillance et de contrôle à distance.

Dans cet exemple de mode unidirectionnel, le signal audio est envoyé par l’opérateur à la caméra. Cela permet par exemple de fournir des instructions à voix haute à une personne figurant dans le champ de vision de la caméra ou de dissuader un éventuel voleur de voiture dans un parking.

Semi-duplex

En mode semi-duplex, le signal audio est envoyé dans les deux directions, mais une seule partie à la fois peut transmettre. Ce principe s’apparente à celui d’un talkie-walkie.

Duplex intégral

En mode duplex intégral, le signal audio est envoyé vers et depuis l’opérateur simultanément. Ce mode de communica¬tion s’apparente à une conversation téléphonique. Le mode duplex intégral requiert que le PC client soit équipé d’une carte audio avec prise en charge du duplex intégral.

Alarme de détection audio

L’alarme de détection audio peut être utilisée comme complément de la détection de mouvement, car elle peut réagir à des événements se produisant dans des zones trop sombres pour que la fonction de détection de mouvement fonctionne correctement. Elle peut en outre servir à détecter toute activité dans des zones situées en dehors du champ de vision de la caméra.

La détection de sons (tels que des bris de vitres ou des voix dans une pièce) peut déclencher l’envoi et l’enregistrement audio/vidéo par une caméra réseau, l’envoi de messages électroniques ou toute autre alerte, et activer des périphériques externes tels que des alarmes. De même, des entrées d’alarme tels que des capteurs de mouvement et des contacts de portes peuvent être utilisés pour déclencher l’enregistrement audio/vidéo. Dans une caméra PTZ ou dôme PTZ, la détection d’alarme audio peut faire en sorte que la caméra se dirige automatiquement vers un emplacement prédéfini, tel qu’une fenêtre spécifique.

Compression audio

Les signaux audio analogiques doivent être convertis en signaux audio numériques grâce à un processus d’échantillonnage, puis compressés afin de réduire la taille et d’optimiser les performances de transmission et de stockage. La conversion et la com¬pression s’effectuent à l’aide d’un codec audio, un algorithme qui code et décode les données audio.

Fréquence d’échantillonnage

Il existe de nombreux codecs audio prenant en charge différentes fréquences d’échantillonnage et différents niveaux de compression. La fréquence d’échantillonnage fait référence au nombre de fois par seconde qu’un échantillon d’un signal audio analogique est pris ; elle est définie en hertz (Hz). En général, plus la fréquence d’échantillonnage est élevée, meilleure est la qualité audio et plus il faut d’espace de stockage et de bande passante.

Débit

Le débit est un facteur audio important car il détermine le niveau de compression et, par conséquent, la qualité audio. En général, plus le niveau de compression est élevé (plus le débit est faible), plus la qualité audio est faible. La différence de qualité audio des codecs se remarque plus à des niveaux de compression élevés (faible débit) qu’à des niveaux de compression faibles (débit élevé). Les niveaux de compression élevés peuvent également présenter davantage de latence ou délai, mais ils permettent d’économiser en bande passante et en espace de stockage.

Les débits les plus souvent sélectionnés avec les codecs audio sont compris entre 32 kbit/s et 64 kbit/s. Les débits audio, de même que les débits vidéo, sont un facteur important à prendre en considération lors du calcul des exigences totales en bande passante et en espace de stockage.

Codecs audio

Les produits de vidéo sur IP Axis prennent en charge trois codecs audio. Le premier est AAC-LC (Advanced Audio Coding - Low Complexity), également appelé MPEG-4 AAC, qui requiert une licence. AAC-LC, en particulier à un taux d’échantillonnage de 16 kHz ou plus et à un débit de 64 kbits/s, est le codec recommandé afin d’obtenir la meilleure qualité audio possible. Les deux autres codecs sont G.711 et G.726, qui sont des technologies sans licence.

Synchronisation audio et vidéo

La synchronisation des données audio et vidéo est gérée par un lecteur multimédia (logiciel informatique utilisé pour la lecture des fichiers multimédias) ou par un cadre multimédia tel que Micro¬soft DirectX, qui est une collection d’interfaces de programmation qui gère les fichiers multimédias.

Les signaux audio et vidéo sont envoyés sur un réseau sous la forme de deux flux de paquets distincts. Pour que le client ou le lecteur puisse synchroniser parfaitement les flux audio et vidéo, les paquets audio et vidéo doivent être horodatés. L’horodatage des paquets vidéo utilisant la compression Motion JPEG n’est pas toujours pris en charge dans une caméra réseau. Si l’horodatage est pris en charge et qu’il est important de synchroniser les signaux audio et vidéo, le format vidéo à choisir est MPEG-4 ou H.264 car ces flux vidéo, avec le flux audio, sont envoyés à l’aide du protocole RTP (Real-time Transport Protocol), qui fournit un horodatage des paquets audio et vidéo. Néanmoins, il faut savoir que dans de nombreuses situations la synchronisation des séquences audio est moins importante (voire même parfois indésirable), notamment si les séquences audio ne sont pas destinées à être enregistrées mais juste surveillées.

Rubrique suivante : Technologies réseau et Ethernet