Audio

Sebbene non sia ancora molto diffuso, l’uso dell’audio nei sistemi di videosorveglianza può migliorare la capacità del sistema di rilevare e interpretare gli eventi, nonché consentire la comunicazione audio su una rete IP. L’uso dell’audio, tuttavia, può essere soggetto a limitazioni in alcuni Paesi, pertanto si consiglia di verificare questa condizione presso le autorità locali. Gli argomenti descritti in questo capitolo includono gli scenari di applicazione, l’apparecchiatura audio, le modalità audio, l’allarme di rilevamento di suoni, la compressione audio e la sincronizzazione di audio e video.

Applicazioni audio

L’uso dell’audio come parte integrante di un sistema di videosorveglianza può rappresentare una preziosa aggiunta alla capacità di un sistema di rilevare e interpretare eventi e situazioni di emergenza. La capacità dell’audio di coprire un’area a 360° consente a un sistema di videosorveglianza di estendere la propria copertura oltre il campo visivo di una telecamera. Il sistema può indicare a una telecamera PTZ o dome PTZ (o segnalare all’operatore di una telecamera) di verificare visivamente un allarme audio. L’audio può essere utilizzato anche per consentire agli utenti non solo di ascoltare ciò che accade in un’area, ma anche di impartire ordini o richieste a visitatori e malintenzionati. Ad esempio, se una persona nel campo visivo di una telecamera mostra un comportamento sospetto, aggirandosi nei paraggi di un bancomat o entrando in un’area riservata, un sorvegliante remoto può inviare un avviso verbale a tale persona. In una situazione in cui una persona è stata ferita, anche la possibilità di comunicare in remoto con la vittima e di indicarle che sta per ricevere soccorso può risultare utile. Il controllo dell’accesso, ovvero un “portiere” remoto posizionato all’ingresso, può rappresentare un’altra area di applicazione. Altre applicazioni includono una situazione di centro di assistenza remoto (ad esempio, nel caso di un parcheggio pubblico privo di personale) e video conferenze. Un sistema di sorveglianza audiovisivo aumenta l’efficacia di una soluzione di sicurezza o di monitoraggio in remoto, migliorando la capacità di un utente remoto di ricevere e comunicare informazioni.

Supporto e apparecchiatura audio

Il supporto per audio può essere implementato più facilmente in un sistema con tecnologia video di rete che in un sistema TVCC analogico. In un sistema analogico, i cavi audio e video dedicati devono essere installati da terminale a terminale, ossia dall’ubicazione della telecamera e del microfono all’ubicazione di visualizzazione/registrazione. Se la distanza tra il microfono e la stazione è eccessiva, è necessario utilizzare l’apparecchiatura audio bilanciata, che aumenta la difficoltà e i costi di installazione. In un sistema video di rete, una telecamera di rete con supporto per audio elabora l’audio e invia sia l’audio che il video tramite lo stesso cavo di rete per il monitoraggio e/o la registrazione. Ciò elimina la necessità di cavi aggiuntivi e facilita notevolmente la sincronizzazione di audio e video.

Sistema video di rete con supporto per audio integrato. I flussi audio e video vengono inviati mediante lo stesso cavo di rete.

In alcuni codificatori video è disponibile l’audio integrato che consente di aggiungere audio anche se in un’installazione vengono utilizzate le telecamere analogiche.

In una telecamera di rete o in un codificatore video con funzionalità audio integrata è spesso disponibile un microfono incorporato e/o una presa microfono/linea in ingresso. Con il supporto per microfono/linea in ingresso, gli utenti possono utilizzare un altro tipo o qualità di microfono rispetto a quello integrato nella telecamera o nel codificatore video. Inoltre, tale supporto consente al prodotto con tecnologia video di rete di collegarsi a più microfoni e di utilizzare microfoni distanti dalla telecamera. Il microfono deve essere sempre posizionato il più vicino possibile alla sorgente del suono al fine di ridurre i disturbi. In modalità Full-duplex bidirezionale, è necessario che un microfono sia girato nella direzione opposta e che sia posizionato a una certa distanza da un altoparlante per ridurre il ritorno dell’altoparlante.

Molti prodotti con tecnologia video di rete Axis non vengono forniti con altoparlante integrato. È possibile collegare direttamente un altoparlante attivo, ossia un altoparlante con amplificatore integrato, a un prodotto con tecnologia video di rete dotato di supporto per audio. Se un altoparlante non dispone di amplificatore integrato, è necessario collegarlo a un amplificatore, a sua volta collegato a una telecamera di rete o a un codificatore video.

Per ridurre al minimo disturbi e rumori, utilizzare sempre un cavo audio schermato ed evitare di farlo passare accanto ai cavi di alimentazione che trasportano segnali di commutazione ad alta frequenza. I cavi audio, inoltre, devono essere tenuti il più corti possibile. Se è necessario un cavo audio lungo, si consiglia di utilizzare l’apparecchiatura audio bilanciata (composta da cavo, amplificatore e microfono, tutti bilanciati) per ridurre i disturbi.

Modalità audio

In base all’applicazione, potrebbe essere necessario inviare l’audio in una sola direzione o in entrambe (contemporaneamente o una direzione alla volta). Esistono tre modalità di base per la comunicazione audio: Simplex, Half-duplex e Full-duplex.

Simplex

In modalità Simplex, l’audio viene inviato in una sola direzione. In questo caso, l’audio viene inviato dalla telecamera all’operatore. Le applicazioni includono il monitoraggio remoto e la videosorveglianza.

In questo esempio di modalità Simplex, l’audio viene inviato dall’operatore alla telecamera. È possibile utilizzare questa modalità, ad esempio, per fornire istruzioni orali a una persona mostrata dalla telecamera o per spaventare un potenziale ladro di macchine e allontanarlo da un parcheggio.

Half-duplex

In modalità Half-duplex, l’audio viene inviato in entrambe le direzioni, ma l’invio è consentito solo per una parte alla volta. Questa modalità è simile al funzionamento di un walkie-talkie.

Full-duplex

In modalità Full-duplex, l’audio viene inviato contemporaneamente all’operatore e dall’operatore. Questa modalità di comunicazione è simile a una conversazione telefonica. La modalità Full-duplex richiede che sul PC client sia installata una scheda audio con supporto per l’audio Full-duplex.

Allarme di rilevamento dei suoni

È possibile utilizzare l’allarme di rilevamento dei suoni come complemento alla funzionalità di rilevamento di oggetti in movimento nel video, in quanto tale allarme è in grado di reagire agli eventi che si verificano in aree eccessivamente scure per garantire un corretto funzionamento di tale funzionalità. È anche possibile utilizzarlo per rilevare attività in aree esterne al campo visivo della telecamera.

Il rilevamento di suoni quali la rottura di una finestra o voci in una stanza può attivare una telecamera di rete e causare l’invio e la registrazione di video e audio, l’invio di un messaggio e-mail o di altri avvisi e l’attivazione di dispositivi esterni quali gli allarmi. Allo stesso modo, è possibile utilizzare fattori di allarme quali il rilevamento di oggetti in movimento nel video e i contatti della porta per attivare registrazioni video e audio. In una telecamera PTZ o dome PTZ, il rilevamento dell’allarme audio può fare in modo che la telecamera si giri automaticamente per inquadrare un’ubicazione preimpostata, come ad esempio una determinata finestra.

Compressione dell’audio

I segnali audio analogici devono essere convertiti in audio digitale mediante un processo di campionamento e successivamente compressi per ridurne la dimensione e garantire una trasmissione e una memorizzazione efficaci. La conversione e la compressione vengono eseguite utilizzando un codec audio, un algoritmo in grado di codificare e decodificare i dati audio.

Frequenza di campionamento

Sono disponibili molti codec audio diversi che supportano frequenze di campionamento e livelli di compressione diversi. La frequenza di campionamento si riferisce al numero di volte al secondo in cui il campione di un segnale audio analogico viene selezionato e definito in hertz (Hz). In generale, una frequenza di campionamento elevata determina una qualità audio maggiore e richiede una notevole quantità di larghezza di banda e unità di memorizzazione.

Velocità di trasmissione in bit

La velocità di trasmissione in bit è un’impostazione importante nell’audio in quanto determina il livello di compressione e, di conseguenza, la qualità dell’audio. In generale, un livello di compressione elevato (velocità di trasmissione in bit ridotta) determina una qualità audio ridotta. Le differenze nella qualità audio dei codec possono essere particolarmente evidenti a livelli di compressione elevati (velocità di trasmissione in bit ridotta), ma non a livelli di compressione ridotti (velocità di trasmissione in bit elevata). I livelli di compressione elevati possono anche introdurre maggiore latenza o ritardo, ma consentono un notevole risparmio per quanto riguarda la larghezza di banda e l’unità di memorizzazione.

La velocità di trasmissione in bit selezionata più frequentemente con i codec audio è compresa tra 32 kbit/s e 64 kbit/s. Allo stesso modo della velocità di trasmissione video in bit, la velocità di trasmissione audio in bit rappresenta un’importante impostazione da tenere in considerazione durante il calcolo dei requisiti totali di larghezza di banda e unità di memorizzazione.

Codec audio

I prodotti con tecnologia video di rete Axis supportano tre codec audio. Il primo è AAC-LC (Advanced Audio Coding - bassa complessità), anche noto come MPEG-4 AAC, che richiede una licenza. AAC-LC, in particolare a una velocità di campionamento di 16 kHz o maggiore e a una velocità di trasmissione in bit di 64 kbit/s, è il codec che si consiglia di utilizzare quando è necessaria la migliore qualità audio possibile. Gli altri due codec sono G.711 e G.726, che sono tecnologie che non richiedono licenza.

Sincronizzazione audio e video

La sincronizzazione di dati audio e video è gestita da un lettore multimediale (un programma informatico utilizzato per riprodurre file multimediali) o da un’infrastruttura multimediale quale Microsoft DirectX, costituita da una raccolta di interfacce di programmazione di applicazioni in grado di gestire file multimediali.

I flussi audio e video vengono inviati mediante una rete come due flussi di pacchetti separati. Affinché il client o il lettore possano sincronizzare perfettamente i flussi audio e video, è necessario che nei pacchetti video sia riportata l’indicazione della data e dell’ora. È talvolta possibile che l’indicazione della data e dell’ora nei pacchetti video mediante la compressione Motion JPEG non sia supportata in una telecamera di rete. In questo caso, e se è importante sincronizzare video e audio, è consigliabile scegliere il formato video MPEG-4 o H.264 in quanto tali flussi video, insieme al flusso audio, vengono inviati mediante il protocollo RTP (Real-time Transport Protocol), che inserisce l’indicazione della data e dell’ora nei pacchetti video e audio. Esistono tuttavia molti casi in cui la sincronizzazione dell’audio non è rilevante o è addirittura non richiesta, ad esempio nel caso in cui l’audio debba essere monitorato ma non registrato.

Argomento successivo: Rete LAN ed Ethernet