Inteligencia artificial en el sector de la vigilancia

Si está un poco cansado de escuchar sobre el potencial de la inteligencia artificial (IA) en nuestras vidas y trabajos, ¡no está solo! La IA ha sido una de las palabras de moda de los últimos años y, como todas las palabras de moda, su uso excesivo y malentendido puede llevar a las personas a ser escépticas sobre su potencial. Si bien eso es comprensible, no debemos permitir que esto nos impida reconocer parte del potencial real de la IA en aplicaciones específicas dentro del análisis de video basado en el aprendizaje automático (ML) y el aprendizaje profundo (DL).

 

Definición de IA, ML y DL en la vigilancia

La inteligencia artificial (IA) es una rama de la informática que estudia y desarrolla métodos que permiten que las computadoras simulen comportamientos inteligentes. En términos generales, la IA es un concepto muy amplio, pero en el contexto específico de la analítica de video, el enfoque principal es aumentar la eficiencia operativa y agregar valor procesando y analizando automáticamente las transmisiones de video.

En este contexto, una subcategoría de IA, el aprendizaje automático (ML), es más específicamente relevante. Como sugiere su nombre, el aprendizaje automático permite que las computadoras mejoren los algoritmos a través del «aprendizaje» basado en ejemplos del mundo real. Los algoritmos mejorados se utilizan luego para analizar imágenes o secuencias de video para generar alarmas, metadatos u otra información.

Más recientemente, la atención se ha centrado en una subcategoría de ML, aprendizaje profundo (DL), que describe algoritmos basados ​​en redes neuronales simuladas. La idea de este tipo de algoritmo se inspiró en el sistema de visión humana, de ahí su nombre: redes neuronales. En las redes DL, las capas de operaciones se organizan en una jerarquía de capas complejas y abstractas, cada capa utiliza información de la anterior para llegar a su conclusión final.

Los modelos DL permiten algoritmos analíticos más complejos y, en general, logran una mayor precisión que los tradicionales. En los sistemas de videovigilancia se utilizan principalmente en la detección, clasificación y reconocimiento de diferentes tipos de objetos. Sin embargo, un inconveniente de los algoritmos DL es que requieren más potencia computacional y más operaciones matemáticas en comparación con los algoritmos tradicionales.

La demanda del aprendizaje profundo de una gran cantidad de datos

ML y DL requieren grandes cantidades de datos de entrada relevantes para la capacitación a fin de lograr resultados de buena calidad. Si se dispone de suficientes datos relevantes (y potencia de cálculo) para el entrenamiento, los métodos basados ​​en ML y DL pueden procesarlos de manera eficiente para lograr algoritmos con mayor precisión. La computadora puede analizar miles de imágenes para encontrar detalles que caractericen objetos específicos en diferentes escenarios. Si los datos y sus descripciones son de alta calidad, una aplicación basada en DL puede lograr una precisión aún mayor. Pero la disponibilidad de datos de alta calidad puede ser un desafío.

Quizás contrarrestando la percepción general de la IA, las tecnologías actuales aún carecen de conciencia o lo que podría denominarse inteligencia general. En aplicaciones donde se usa la tecnología, se enfoca en problemas muy específicos en áreas limitadas. Por ejemplo, para que una aplicación de voz como Siri o Alexa responda con precisión a nuestras preguntas, debemos hacer preguntas muy específicas y explícitas. De lo contrario, obtendremos una respuesta completamente incomprensible. Del mismo modo, en los sistemas de vigilancia: una mala descripción de las imágenes utilizadas para la formación dará lugar a aplicaciones con baja precisión.

Dadas las limitaciones actuales en la precisión de estas tecnologías, y que la comprensión adecuada y contextual de una escena en detalle real a partir de un video aún está muy lejos, debemos tener cuidado sobre cómo y dónde usar estas tecnologías. La tecnología actual mejora la eficiencia, pero la toma de decisiones real en un escenario de vigilancia aún debe recaer en el guardia de seguridad o el operador. Debemos mantener a un «humano informado».

 

Teniendo en cuenta el caso de uso de la vigilancia

A medida que cualquier nueva tecnología madura más allá del «bombo» inicial, las debilidades y limitaciones de la tecnología se harán evidentes y solo en las áreas donde la tecnología proporciona valor real veremos un crecimiento. En la vigilancia, es importante comenzar con el caso de uso: ¿qué problema está tratando de resolver o qué efecto está buscando lograr? Sobre la base de una buena comprensión del caso de uso específico, es mucho más factible aplicar ML y DL para lograr un buen resultado.

Si bien todavía estamos en el comienzo del viaje de la inteligencia artificial en la vigilancia, hay aplicaciones y casos de uso en los que el análisis de DL ya está proporcionando un valor real para las organizaciones, por ejemplo, al examinar grandes cantidades de material grabado en busca de objetos o eventos específicos, lo que a menudo llamamos búsqueda forense.

Es crucial comprender verdaderamente los casos de uso, las limitaciones de la tecnología y las pruebas y evaluaciones exhaustivas para asegurarse de que se logre el resultado deseado.

 

Imágenes de vigilancia de alta calidad como base

Fundamental para la capacidad de analizar video es la calidad de la cámara y la imagen, o lo que se conoce como «usabilidad de la imagen»: la calidad de la imagen se refleja directamente en la calidad de la precisión del análisis de video. Las cámaras de video en los sistemas de vigilancia deben funcionar las 24 horas del día, los 365 días del año, lidiar con las fluctuaciones de temperatura y las diferentes condiciones de iluminación, sin dejar de analizar la imagen correctamente en tiempo real.

Una tendencia de la industria es que los análisis de video más avanzados se están trasladando a dispositivos periféricos, con aplicaciones que se ejecutan en las propias cámaras. Hay una serie de beneficios en esto: por ejemplo, ahorro de ancho de banda, ya que solo los datos extraídos deben transferirse desde la cámara, abordando problemas de privacidad, ahorrando en hardware costoso del lado del servidor y análisis más precisos, ya que el video se analiza antes. el video se comprime con el riesgo de degradación de la calidad. El análisis inteligente en el borde abrirá numerosas oportunidades para aplicaciones que mejorarán aún más la seguridad y brindarán beneficios adicionales en eficiencia operativa.

Inteligencia artificial

La paciencia es una virtud

Aquellos que estén familiarizados con el Hype Cycle Tecnológico de Gartner sabrán que después del entusiasmo inicial por las innovaciones en tecnología, hay un período casi inevitable de frustración cuando parece que no está cumpliendo con las expectativas. Pero tenga la seguridad de que muchas personas están trabajando detrás de escena para garantizar que la inteligencia artificial, y más específicamente el aprendizaje automático y el aprendizaje profundo, con el tiempo alcancen su potencial.

 

Esta publicación de blog se basó en una conversación reciente entre la revista A&S y yo en Polonia.

Más información en la revista