Describiendo los detalles que importan: la importancia de los metadatos de video

Avatar

Las soluciones de vigilancia eficaces deben hacer que las escenas complicadas sean fáciles de entender y actuar. En la práctica, eso requiere recopilar una gran cantidad de detalles en transmisiones de video y/o audio de lo que potencialmente puede incluir muchas fuentes. Cuantos más dispositivos haya en el sistema, mayor será la cantidad de detalles potenciales de interés que podría haber.

En última instancia, la vigilancia eficaz consiste en actuar sobre los detalles de una escena que es importante para los administradores y operadores de sistemas. Pero, ¿qué pasa si los administradores u operadores no saben sobre qué información necesitan detalles, o incluso qué están buscando en una escena, por ejemplo, qué es fuera de lo común? Los detalles que importan pueden informar a una persona, objeto o movimiento específico en una escena o tipo de evento que nunca ha ocurrido anteriormente.

Los sistemas de vigilancia modernos generan una cantidad abrumadora (y en su mayoría no utilizada) de datos. Esto es especialmente cierto cuando se graba video en operaciones 24/7, que es esencial para capturar evidencia, incidentes y eventos. No solo es difícil distinguir lo que realmente importa en una escena, sino que también consume mucho tiempo. Hacer que los datos sean más identificables y procesables es un problema clave a resolver. La aplicación de descriptores de metadatos para describir detalles clave en una escena permite que los datos sean más identificables y procesables.

Esta es la razón por la que los metadatos son la base para recopilar inteligencia a partir de transmisiones de video y / o audio de vigilancia. Los metadatos proporcionan una manera rápida de encontrar, evaluar y actuar sobre los detalles singulares que más importan a través de una, cientos o miles de secuencias de secuencias de video y audio. Los metadatos son ahora una parte esencial de las operaciones comerciales y de seguridad efectivas.

Pero, ¿qué son los metadatos?

Se necesita una definición. Como revelarán las búsquedas de Google, los metadatos generalmente se denominan «datos sobre otros datosEn el contexto de la videovigilancia, eso se traduciría en» datos sobre datos de video «. Pero eso puede ser muy amplio. Para ser más específico, debe considerar los detalles de la escena que importan. Estos describen los detalles de «dónde, qué y cómo» sobre los cambios en una escena en un video de una transmisión.

Los metadatos de video describen con precisión los detalles que importan en una escena en términos de dónde se encuentran esos detalles, qué son y cómo se mueven en una escena.

Eso significa que los atributos de los metadatos pueden describir todo tipo de detalles sobre objetos de interés en movimiento, por ejemplo:

  • Ubicación, hora, colores, tamaños, formas, coordenadas, pistas, decibelios de volumen, velocidad, voz, duración en la escena, dirección de viaje

Además, se pueden agregar más detalles fundamentales como la descripción de la transmisión de video, el códec, las marcas de tiempo, la identidad del dispositivo, etc.

Además de detalles más fundamentales como:

  • Descripciones de transmisión de video, códec, marcas de tiempo, identidad del dispositivo, etc.

Todo lo anterior son «metadescripciones» de detalles en una escena o relacionados con ella.

Basadas en la máquina de inteligencia artificial y el aprendizaje profundo, las meta descripciones pueden ser más (o menos) granulares. Lo que eso significa es que las meta descripciones pueden describir atributos en un nivel alto o en niveles más profundos. Esto permite clasificar un grupo de píxeles como persona, animal, vehículo u otras clases de objetos predefinidos. O ser más preciso con descripciones más refinadas de personas u objetos, por ejemplo:

  1. Subtipo:
    • Vehículo
      • Coche, autobús, bicicleta, etc.
      • Matrícula
      • Modelar y hacer
  1. Color
      • Rojo, Amarillo, azul, verde, etc.

3. Características del movimiento

      • Tipo de movimiento
      • Velocidad
      • Coordenadas de ubicación

El valor de los metadatos

Los metadatos no solo proporcionan detalles sobre personas, objetos y eventos en una escena. También permite agrupar, clasificar, buscar, recuperar y utilizar rápidamente grandes cantidades de video y metraje grabado. Como resultado, los casos de uso generales de metadatos encajan en tres áreas:

    1. Activación y notificación de alarmas en tiempo real
    2. Búsqueda forense posterior al evento
    3. Análisis e informes estadísticos

Añadiendo inteligencia a escenas con metadatos

Los metadatos esencialmente asignan un significado digital a cada fotograma de video sobre los objetos y eventos que contiene. En otras palabras, agrega interpretación o inteligencia sobre la escena en lugar de solo el metraje de video sin procesar que debe ser procesado manualmente por un operador.

Una vez que el software puede interpretar escenas de esta manera, puede comprender los detalles de la escena y permitir que se actúe sobre la escena en tiempo real a través de eventos, después de eventos (post-evento), mediante búsqueda manual o simplemente analizada para análisis estático. Esto permite el uso de metadatos para diseñar líneas de base que definan lo que es «normal» para cualquier alimentación de escena de cualquier cámara individual. A su vez, esto permite al software reconocer cualquier grado de desviación, anomalía o comportamiento o actividades específicas, etc., así como predecir lo que sucederá en esa escena con una probabilidad específica.

Los metadatos permiten muchos más casos de uso nuevos, por ejemplo:

    • Realizar una búsqueda posterior al evento: p. Ej. encontrar personas con ropa roja en una escena
    • Realización de una regla de automatización: p. Ej. abra la barrera para un automóvil azul con el número de placa de Texas XYZ123
    • Realizar análisis estadístico: p. Ej. contar cuántos autos se movieron en una dirección específica en una carretera

Los metadatos de video agregan un valor inmenso a un sistema de administración de video. De hecho, su verdadero potencial se realiza cuando se aplica a múltiples entradas, que abarcan entradas visuales, de audio, de actividad y relacionadas con el proceso. Cosas como seguimiento RFID, coordenadas GPS, alertas de manipulación, lecturas de medidores (por ejemplo, temperatura o niveles químicos), detección de ruido y datos transaccionales del punto de venta. En la gestión de cualquier sitio, todas estas son fuentes de datos de gran valor. Todos se pueden alinear en función de sus marcas de tiempo. Unificar metadatos de diferentes fuentes significa obtener mucha más información de la que se puede obtener de cada sistema (aislado) solo.

La atención se centra en la interoperabilidad. El mundo de la PI puede generar otro gran beneficio. Los protocolos abiertos y los estándares de la industria son nuevamente esenciales, lo que permite una integración perfecta de metadatos. Cantidades masivas de datos de todo tipo de sistemas nos ayudarán a obtener una comprensión más rápida, profunda y amplia de todo lo que nos rodea.

Lea sobre metadatos y AXIS Optimizer para Milestone XProtect

AXIS Optimizer