Descrivere i dettagli che contano: l’importanza dei metadati video

By Joe Danielson | 2024-02-09 2021-11-19 | Analitiche Video 0 comments

La peculiarità di soluzioni di sorveglianza efficienti è la capacità di rendere scene complicate facili da comprendere e gestire da parte degli operatori.

Nella pratica, questa capacità implica la raccolta e l’elaborazione di una enorme quantità di dati in flussi audio/video da un numero di fonti potenzialmente molto ampio. Più dispositivi sono connessi a un sistema, più numerosi sono i potenziali dettagli di interesse che devono essere rilevati.

In ultima analisi, significa che una sorveglianza efficiente deve essere in grado di elaborare i dettagli presenti in una scena rilevante per gli amministratori e gli operatori. Ma cosa succede quando questi amministratori e questi operatori non sanno su quale informazione necessitano di dettagli? E se non conoscono nemmeno cosa ci sia fuori dall’ordinario nella scena che stanno osservando? I dettagli importanti possono essere legati a una specifica persona, a un oggetto o a un movimento sulla scena, o ancora possono dipendere da un evento che non era mai avvenuto in precedenza.

I moderni sistemi di sorveglianza generano un’enorme (e spesso inutilizzata) quantità di dati. Ciò si verifica in particolare quando vengono effettuate riprese di operazioni che si svolgono 24h su 24, in cui la sorveglianza è fondamentale per registrare prove, incidenti o particolari eventi. In questi casi, riconoscere cos’è realmente importante in una scena non è solo complesso, ma richiede anche molto tempo. Rendere i dati più facilmente identificabili e gestibili è un problema centrale da risolvere.

Applicare dei metadati descrittori per specificare i dettagli cruciali presenti su una scena è la modalità più efficace per ottenere questo risultato.

È questa la ragione per cui i metadati sono la base per la raccolta di informazioni utili dai flussi audio o video di sorveglianza. I metadati offrono un modo rapido per identificare, valutare e agire su un singolo dettaglio particolarmente significativo proveniente da uno specifico dispositivo tra cento o mille altri.

Cosa sono i metadati?

Una definizione è necessaria. Google definisce i metadati come “dati riguardanti altri dati”. Nel contesto della videosorveglianza, questa frase può significare “dati riguardo informazioni video”, ma resta una definizione a maglie molto larghe. Per essere più specifici, potremmo vederla in questo modo: i metadati descrivono “il dove, il cosa e il come” riguardo a cosa è cambiato in una scena ripresa.

I metadati video descrivono dunque accuratamente i dettagli importanti di una scena spiegando dove sono collocati, di cosa si tratta e come si muovono nel campo di ripresa.

In questo modo, gli attributi dei metadati possono descrivere qualunque elemento di interesse. Per fare qualche esempio potremmo citare luogo, tempo, colori, dimensioni, forme, coordinate, percorsi, decibel di volume, velocità, voce, durata sulla scena, direzione di spostamento.

Inoltre, possono essere aggiunti dettagli altrettanto fondamentali come il codec del flusso video, l’orario di registrazione, l’identità del dispositivo e così via.

Basate sull’Intelligenza Artificiale e il deep learning, le meta descrizioni possono essere più o meno granulari, descrivendo gli attributi sopra riportati a diversi livelli di dettaglio. Questo permette di classificare un insieme di pixel come una persona, un animale, un veicolo o un’altra classe di oggetti predefiniti, come per esempio:

Sottogenere
- Veicolo
  - - Automobile, autobus, bicicletta, …
    - Numero di Targa
    - Modello e versione

Colore
- Rosso, giallo, blu, verde…
Caratteristiche del movimento
- Tipo di movimento
- Velocità
- Coordinate

Il valore dei metadati

I metadati non offrono solo dettagli a proposito di persone, oggetti ed eventi in una scena. Essi permettono anche di raggruppare, suddividere, analizzare, recuperare e utilizzare in breve tempo il materiale registrato, video o audio. Considerando anche questo aspetto, i tre casi d’uso principali per i metadati sono i seguenti:

Attivazione di allarmi e notifiche in tempo reale
Indagini forensi successive all’evento
Analisi statistica e reportistica

Aggiungere informazioni alla scena con i metadati

In sintesi, i metadati assegnano un significato a ciascun frame video, descrivendo gli oggetti e gli eventi al suo interno. In altre parole, offrono un’interpretazione della scena anziché un semplice video che deve essere poi processato manualmente da un operatore.

Una volta che un software è in grado di interpretare le scene in questo modo, può comprendere i dettagli e permettere un intervento diretto sulla scena in tempo reale attraverso eventi, procedure post-evento, ricerca manuale. Oppure, può semplicemente consentire di analizzare la scena per analisi statistiche. Questo permette l’uso dei metadati per porre le basi di ciò che deve essere definito come “normale” nel campo di ripresa di una telecamera. In questo modo, il software può riconoscere ogni grado di deviazione rispetto a questa norma, identificando anomalie o comportamenti specifici e può essere in grado di prevedere cosa accadrà in quella scena con buona probabilità.

Ma sono molti i casi d’uso resi possibili dai metadati. Un elenco parziale dovrebbe comunque includere:

Una ricerca post evento, come ad esempio cercare una persona vestita di rosso in una scena;
Una regola automatizzata, come ad esempio far aprire un cancello quando viene ripresa un’automobile blu con targa PK341RW;
Un’analisi statistica, contando quante automobili si sono mosse in una specifica direzione lungo una strada.

I metadati video offrono un grandissimo valore aggiunto a un sistema di gestione video. In effetti, permettono di realizzare il suo vero potenziale unendo dati e informazioni provenienti da fonti molto diverse: visive, acustiche, relative a ciò che avviene nella scena o ai processi che vengono eseguiti, associando tracking RFID, coordinate GPS, allarmi anti-intrusione, letture metriche come temperatura o livelli chimici, rilevamento dei suoni e dati transazionali provenienti dai punti vendita. Nella gestione di qualunque struttura, si tratta di fonti di grandissimo valore, che possono essere allineate sincronizzando gli orari di cattura delle informazioni. Unendo i metadati provenienti da diverse fonti è possibile ottenere dati molto più interessanti e approfonditi rispetto a quelli ricavati da ciascun singolo dispositivo che lavori isolatamente.

Il concetto fondamentale è l’interoperabilità. Il mondo IP può in questo senso offrire un altro grande beneficio.

Adottare protocolli aperti e standard condivisi è essenziale per permettere l’integrazione efficace di tutti i metadati: una sempre maggiore quantità di informazioni proveniente da ogni tipologia di sistema ci aiuterà a ottenere una comprensione più rapida, più profonda e più ampia di tutto ciò che ci circonda.

Scopri di più sui metadati e su AXIS Optimizer per utenti Milestone XProtect:

Axis Optimizer

Questo articolo è stato pubblicato originariamente in lingua inglese sul blog globale Secure Insights.

Tags: analitiche video, data, deep learning, intelligenza artificiale, video analytics