Identificazione e riconoscimento

Risoluzione necessaria

Tradizionalmente, per definire la risoluzione necessaria in un sistema TVCC analogico si specificava la percentuale dello schermo occupata dal soggetto osservato.Obiettivi di sorveglianza diversi richiedono percentuali diverse.

Ad esempio, per rilevare la presenza di una persona in una scena poteva essere necessario che occupasse il 10% della vista.Il riconoscimento di una persona già nota poteva invece richiedere che la persona ne occupasse il 50%, mentre l'identificazione poteva richiedere almeno il 120%.

Figura 1: altezza della stessa persona che occupa 20%, 40% e 140% dell'immagine.

Oggi, le telecamere di rete offrono un'ampia gamma di risoluzioni. L'uso dei requisiti in percentuale non è più pratico; al giorno d'oggi vengono utilizzati i pixel per specificare le esigenze di risoluzione.Per maggiori dettagli sulla risoluzione necessaria per le attività di identificazione, riconoscimento e rilevamento, vedere il tutorial Conteggio pixel perfetto.

Altri criteri sono validi per gli oggetti come le targhe dei veicoli. In questo caso, si richiede normalmente che l'altezza delle lettere sia rappresentata da 15 pixel (corrispondenti a circa 200 pixel/m) per assicurare la leggibilità.

Inoltre, quando si determina la risoluzione necessaria per poter utilizzare i filmati come prova giuridica, è importante considerare i requisiti legali e le norme.

Requisito operativo Pixel orizzontali/volto Px/cm Px/pollici
Identificazione (condizioni difficili) 80 px/volto 5 px/cm 12,5 px/pollice
Identificazione (condizioni ottimali) 40 px/volto 2,5 px/cm 6,3 px/pollice
Riconoscimento 20 px/volto 1,25 px/cm 3,2 px/pollice
Rilevamento 4 px/volto 0,25 px/cm 0,6 px/pollice

 

Tabella 1: La definizione Axis dei requisiti per il rilevamento, il riconoscimento e l'identificazione.

La risoluzione di una scena acquisita è determinata dalla risoluzione della telecamera e dalle dimensioni della scena.Ad esempio, se si usa una telecamera con risoluzione 4CIF (704 x 576 pixel) e la risoluzione lineare è di almeno 500 pixel/m, è possibile coprire una scena larga al massimo 1,4 m.È necessario selezionare una telecamera e un obiettivo che garantiscano il campo visivo corrispondente alle dimensioni della scena alla distanza desiderata fra la telecamera e la scena.

Risoluzione della telecamera orizzontale Lunghezza focale Distanza
massima
Larghezza della scena
massima
2.592 pixel 2,8 – 8 mm 9 m 5,2 m
1.280 pixel 3,3 – 12 mm 6 m 2,6 m
1.920 pixel 5,1 – 51 mm  41 m 3,8 m
736 pixel 3,3 - 119 mm 50 m 1,5 m
1.280 pixel 4,4 – 132 mm 67 m 2,6 m

 

Tabella 2: Esempi di distanze massime per l'identificazione (500 px/m o 80 pixel/volto).

Axis Lens Calculator e il Selettore prodotti Axis sono strumenti utili che aiutano a trovare la telecamera adatta e la corrispondente lunghezza focale.Per utenti avanzati, è anche disponibile un foglio elettronico per calcolare i pixel e la distanza.

Figura 2: confronto di varie risoluzioni.
1: 4 CIF (704x576)
2: SVGA (800x600)
3: HDTV 720p (1280x720)
4: HDTV 1080p (1920x1080)
5: 3 MP (2048x1536)
6: 5 MP (2592x1944)
7: 4K (3840x2160) 

Maggiore è la profondità di campo, maggiore è l'area in cui le persone o gli oggetti sono messi a fuoco. Le possibilità di identificazione aumentano con una maggiore profondità di campo che è determinata dall'apertura del diaframma, la lunghezza focale e la distanza dalla telecamera.

La profondità di campo aumenta se l'apertura del diaframma diminuisce, ciò significa che una buona illuminazione consente di aumentare la profondità di campo. La funzionalità P-Iris in alcune telecamere Axis regolerà il diaframma per ottimizzare la profondità di campo per diverse condizioni di luce.

Maggiori informazioni sulla funzionalità P-Iris sono disponibili in questo white paper:

P-Iris. Il nuovo controllo del diaframma migliora la Qualità d'immagine in megapixel e delle telecamere di rete HDTV.

L'utilizzo di una lunghezza focale aumenterà inoltre la profondità di campo. Le telecamere con maggiore risoluzione possono acquisire scene utilizzando lunghezze focali più corte mantenendo al tempo stesso i requisiti di risoluzione.

La maggior parte delle lenti hanno un grado di distorsione, spesso sotto forma di effetto barile. Questo è dovuto all'ingrandimento della lente che è minore ai bordi del campo visivo rispetto al centro dell'immagine. L'effetto è che gli oggetti vicini al bordo appaiono più vicini al centro rispetto a un'immagine non distorta. Gli oggetti della stessa dimensione coprono meno pixel se vicini al bordo, rispetto a ciò che potrebbero coprire se fossero più vicini al centro. Ciò significa che gli oggetti vicini al bordo del campo visivo devono essere più vicini alla telecamera per soddisfare i requisiti per una risoluzione minima.

L'effetto barile è spesso molto più pronunciato a lunghezze focali più brevi, ciò rende le lenti a grand'angolo meno adatte per gli scopi di identificazione.

Illuminazione