Identification et reconnaissance

Résolution requise

La méthode traditionnelle pour définir les besoins de résolution d'un système CCTV analogique consiste à spécifier le pourcentage de l'écran occupé par l'objet observé.Des pourcentages différents selon les objectifs de la surveillance.

Par exemple, détecter la présence d'une personne dans une scène pourrait nécessiter que la personne occupe 10 % de la vue.Reconnaître une personne connue pourrait nécessiter que la personne occupe 50 % de la vue et pour une identification plus poussée, peut-être 120 % ou plus.

Figure 1 : Un même individu occupant en hauteur 20 %, 40 % et 140 % de l'image.

Aujourd'hui, les caméras réseau proposent une large gamme de résolutions.L'utilisation des spécifications en pourcentage n'est plus appropriée. Les pixels sont maintenant utilisés pour spécifier la résolution.Pour obtenir des explications détaillées et commentaires sur les exigences de résolution pour l'identification, la reconnaissance et la détection, consultez le tutoriel Nombre de pixels parfait.

D'autres critères existent pour les objets tels que les plaques d'immatriculation pour lesquelles les recommandations courantes sont de 15 pixels pour la hauteur des lettres (ce qui correspond à environ 200 pixels/m) pour une bonne lisibilité.

Pour déterminer la résolution nécessaire, il est également important de prendre en compte les exigences légales et réglementaires, pour que la séquence de la caméra soit utilisable comme preuve devant une cour de justice.

Besoins opérationnels Pixels horizontaux/visage px/cm px/po.
Identification (en conditions difficiles) 80 px/visage 5 px/cm 12,5 px/po.
Identification (en bonnes conditions) 40 px/visage 2,5 px/cm 6,3 px/po.
Reconnaissance 20 px/visage 1,25 px/cm 3,2 px/po.
Détection 4 px/visage 0,25 px/cm 0,6 px/po.

 

Tableau 1 : Définition Axis des besoins en termes de détection, reconnaissance et identification.

La résolution d'une scène capturée est déterminée par la résolution de la caméra et par la taille de la scène.Par exemple, si vous utilisez une caméra d'une résolution de 4CIF (704 x 576 pixels), vous pouvez couvrir une scène de 1,4 m de large au maximum si la résolution linéaire est de 500 pixels/m ou plus.Vous devez sélectionner une caméra et un objectif avec lesquels le champ de vision correspondra à la taille de la scène, à la distance souhaitée entre la caméra et la scène.

Résolution horizontale de la caméra Distance focale Distance
maximale
Largeur de scène
maximale
2 592 pixels 2,8 – 8 mm 9 m 5,2 m
1 280 pixels 3,3 – 12 mm 6 m 2,6 m
1 920 pixels 5,1 – 51 mm  41 m 3,8 m
736 pixels 3,3 - 119 mm 50 m 1,5 m
1 280 pixels 4,4 – 132 mm 67 m 2,6 m

 

Tableau 2 : Exemples de distances maximales d'identification (500 px/m ou 80 pixels/visage).

Les outils Calculateur d'objectif Axis et Sélecteur de produits Axis sont utiles pour trouver une caméra et une distance focale adaptées.Pour les utilisateurs avancés, une feuille de calcul pour calculateur de pixels et de distance est également disponible.

Figure 2 : Comparaison de diverses résolutions.
1 : 4 CIF (704 x 576)
2 : SVGA (800 x 600)
3 : HDTV 720p (1280 x 720)
4 : HDTV 1080p (1920 x 1080)
5 : 3 MP (2048 x 1536)
6 : 5 MP (2592 x 1944)
7 : 4K (3840 x 2160) 

Plus la profondeur de champ est élevée, plus la zone de mise au point est étendue. Les chances d'identification augmentent avec la profondeur de champ, laquelle est déterminée par l'ouverture du diaphragme, la distance focale et la distance par rapport à la caméra.

La profondeur de champ augmente avec des ouvertures de diaphragme plus petites, ce qui signifie qu'un bon éclairage peut contribuer à augmenter la profondeur de champ. La fonction P-Iris de certaines caméras Axis cameras permet de régler l'ouverture du diaphragme afin d'optimiser la profondeur de champ par rapport aux conditions d'éclairage.

Pour en savoir plus sur la fonction P-Iris, reportez-vous au livre blanc :

P-Iris. New iris control improves image quality in megapixel and HDTV network cameras.

La réduction de la distance focale permet également d'augmenter la profondeur de champ. Les caméras dotées de résolutions élevées permettent de capturer des scènes avec des distances focales plus courtes tout en respectant les exigences de résolution.

La plupart des objectifs présentent un certain degré de déformation, souvent sous la forme d'une distorsion en barillet. Ceci est dû au grossissement de l'objectif qui est plus réduit sur les bords du champ de vision par rapport au centre de l'image. Par rapport à une image non déformée, les objets à proximité du bord paraissent donc plus proches du centre. Par ailleurs, des objets de même taille couvrent moins de pixels lorsqu'ils sont près du bord par comparaison à ce qu'ils couvriraient s'ils étaient plus proches du centre. Afin de respecter les exigences de résolution minimum, les objets qui sont près du bord du champ de vision doivent donc être plus proches de la caméra.

L'effet de la distorsion en barillet est souvent beaucoup plus prononcé à des distances focales plus courtes, ce qui rend les objectifs grand angle moins adaptés à l'identification.

Éclairage