Identificación y reconocimiento

Resolución necesaria

Tradicionalmente, en un sistema analógico CCTV la resolución se definía a partir del porcentaje de toda la pantalla que ocupa el objeto observado.Por lo tanto, en función del objetivo de la vigilancia, hace falta un porcentaje u otro.

Por ejemplo, para detectar la presencia de una persona en una escena basta con que esa persona ocupe un 10% de la imagen.En cambio, para reconocer a una persona conocida seguramente el sujeto tendrá que ocupar un 50% de la imagen, mientras que una identificación completa requerirá un porcentaje superior incluso al 120%.

Figura 1: Altura de la misma persona ocupando un 20 %, un 40 % y un 140 % de la imagen.

En la actualidad, las cámaras de vídeo en red ofrecen un gran abanico de resoluciones. Utilizar los valores en porcentaje ya no resulta práctico; actualmente se emplean los píxeles a la hora de especificar las resoluciones necesarias.Si desea información más detallada sobre las resoluciones necesarias para la identificación, el reconocimiento y la detección, no se pierda el tutorial El número de píxeles perfecto.

Si hablamos de objetos como por ejemplo matrículas, se aplican otros criterios y es necesario, por ejemplo, que la altura de las letras ocupe por lo menos 15 píxeles (lo que correspondería a 200 píxeles/m) para que sean legibles.

También es importante tener en cuenta las exigencias legales y normativas a la hora de determinar la resolución necesaria para poder utilizar el vídeo como prueba ante un tribunal.

Requisito operativo Píxeles horizontales/rostro Px/cm Px/pulg.
Identificación (condiciones difíciles) 80 px/rostro 5 px/cm 12,5 px/pulg.
Identificación (buenas condiciones) 40 px/rostro 2,5 px/cm 6,3 px/pulg.
Reconocimiento 20 px/rostro 1,25 px/cm 3,2 px/pulg.
Detección 4 px/rostro 0,25 px/cm 0,6 px/pulg.

 

Tabla 1: Definición de Axis de los requisitos para detección, reconocimiento e identificación.

La resolución de una escena capturada viene determinada por la resolución de la cámara y el tamaño de la escena.Por ejemplo, si utiliza una cámara con una resolución 4CIF (704 x 576 píxeles), podrá cubrir una escena de como máximo 1,4 m de ancho, si la resolución lineal es de 500 píxeles o más.Por lo tanto, tendrá que elegir una cámara y un objetivo que permitan adaptar el campo de visión al tamaño de la escena a una distancia definida entre la cámara y la escena.

Resolución horizontal de la cámara Longitud focal Distancia
máxima
Anchura de
la escena máxima
2592 píxeles 2,8-8 mm 9 m 5,2 m
1280 píxeles 3,3-12 mm 6 m 2,6 m
1920 píxeles 5,1-51 mm  41 m 3,8 m
736 píxeles 3,3-119 mm 50 m 1,5 m
1280 píxeles 4,4-132 mm 67 m 2,6 m

 

Tabla 2: Ejemplos de distancias máximas para la identificación (500 px/m u 80 píxeles/rostro).

El

Calculador de lentes de Axis y el Selector de productos de Axis son dos herramientas de gran utilidad para encontrar la cámara y la longitud focal más adecuadas.Los usuarios más avanzados tienen también a su disposición una hoja de cálculo para calcular los píxeles y la distancia.

Figura 2: Una comparación de varios resultados.
1: 4 CIF (704x576)
2: SVGA (800x600)
3: HDTV 720p (1280x720)
4: HDTV 1080p (1920x1080)
5: 3 MP (2048x1536)
6: 5 MP (2592x1944)
7: 4K (3840x2160) 

Cuanto mayor es la profundidad de campo, mayor es el área en que se enfoca a las personas o los objetos. Las probabilidades de identificación aumentan cuanto mayor es la profundidad de campo, que está determinada por la apertura del iris, la longitud focal y la distancia hasta la cámara.

La profundidad de campo aumenta a medida que disminuye la apertura del iris, por lo que una buena iluminación puede ayudar a aumentar la profundidad de campo. La función P-Iris de algunas cámaras Axis permite ajustar el iris para optimizar la profundidad de campo para distintas condiciones de iluminación.

En el siguiente informe técnico puede obtener más información acerca de la función P-Iris:

P-Iris: el nuevo control de iris mejora la calidad de la imagen en megapíxeles y cámaras de red HDTV.

El uso de una longitud focal menor también aumenta la profundidad de campo. Las cámaras con resoluciones más altas pueden capturar escenas utilizando longitudes focales mayores y mantener al mismo tiempo los requisitos de resolución.

La mayoría de objetivos producen cierto grado de distorsión, generalmente, en forma de distorsión de barril. Esto se debe a que la ampliación del objetivo es menor en los bordes del campo de visión que en el centro de la imagen. El efecto consiste en que los objetos que se encuentran próximos al borde aparecen más cerca del centro, en comparación con una imagen distorsionada. Los objetos del mismo tamaño cubren menos píxeles si están cerca del borde, si se compara con los que cubrirían si estuviesen más próximos al centro. Esto significa que los objetos cercanos al borde del campo de visión deben estar más cerca de la cámara para que se cumplan los requisitos necesarios para obtener la resolución mínima.

El efecto de la distorsión de barril suele ser mucho más pronunciada con longitudes focales cortas, lo que convierte los objetivos de gran angular en una opción menos idónea para la identificación.

Iluminación