L’audio peut facilement être intégré à la vidéo sur IP, puisque
le réseau est capable de transporter n’importe quel type de
données. Ceci permet de réduire les câblages supplémentaires,
contrairement aux systèmes analogiques où un câble audio doit
être installé d’un bout à l’autre. Une caméra réseau capture le
flux audio au niveau de la caméra, en l’intégrant au flux vidéo,
puis en le renvoyant pour la surveillance et/ou l’enregistrement sur
le réseau.
Il devient dès lors possible d’utiliser l’audio en provenance de lieux distants. Le personnel de surveillance au siège d’une société peut ainsi interagir avec des scènes provenant de bureaux distants. Le personnel habilité peut alors signaler aux malfaiteurs éventuels qu’ils sont observés, et y ajouter l’écoute en utilisant l’audio comme moyen supplémentaire de corroborer les observations. L’audio peut également être utilisé avec les caméras réseau ou les serveurs vidéo comme moyen de détection indépendant destiné à déclencher l’enregistrement vidéo et les alarmes dès que les niveaux sonores dépassent un certain seuil.

Composants dans une solution de vidéo sur IP avec audio

La fonction audio est généralement fournie comme partie
intégrante de la caméra réseau/du serveur vidéo,
mais
peut aussi être obtenue à l’aide d’un module audio.
La fonction audio peut également être utilisée comme moyen de détection indépendant sur les caméras réseau et les serveurs vidéo : l’enregistrement vidéo et les alarmes se déclenchent automatiquement à partir de niveaux sonores prédéfinis.
Transmission audio
Les séquences audio peuvent être compressées et transmises comme partie intégrante du flux vidéo, grâce aux normes MPEG-1/MPEG-2/MPEG-4 ou à toute autre norme de vidéoconférence H.x. Elles peuvent également être transmises en parallèle par application d’une norme propre aux images fixes, telle que la norme JPEG. Si l’on opte pour la synchronisation de l’audio et de la vidéo, on choisira cependant plutôt la norme MPEG. Il faut également savoir que, dans de nombreuses situations, la synchronisation des séquences audio est moins importante, voire même parfois indésirable, notamment si les séquences audio ne sont pas destinées à être enregistrées mais juste surveillées.
Compression audio
La compression audio numérique permet la transmission et le
stockage efficaces des données audio. Tout comme dans le cas de la
vidéo, les techniques de compression audio sont nombreuses et la
qualité des séquences compressées est variable. D’une manière
générale, plus le degré de compression est élevé,
plus le temps de latence est important. L’audio au format numérique
offre de nombreux avantages
et, notamment, celui d’une très bonne immunité aux bruits, d’une
bonne stabilité et d’une bonne
reproductibilité. Il permet également la prise en charge de
nombreuses fonctions de post-traitement
des séquences audio, comme par exemple le filtrage des bruits et la
correction de l’enregistrement.
Les formats de compression les plus courants sont :
Les caméras réseau Axis permettent de choisir parmi un ensemble de modes audio :