Details, auf die es ankommt: die Bedeutung von Video-Metadaten

Wirksame Überwachungslösungen müssen komplizierte Szenen verständlich und greifbar machen. In der Praxis bedeutet dies, dass große Mengen an Details in Video- und/oder Audioströmen aus potenziell vielen Quellen erfasst werden müssen. Je mehr Geräte im Sicherheitssystem installiert sind, desto größer ist die Menge an potenziell interessanten Details, die es geben könnte.

Letztendlich geht es bei einer effektiven Überwachung darum, auf die Details in einer Szene zu reagieren, die für Systemadministratoren und -betreiber von Bedeutung sind. Was aber, wenn Administratoren oder Bediener nicht wissen, zu welchen Informationen sie Details benötigen – oder sogar, wonach sie in einer Szene suchen, z. B. nach etwas Ungewöhnlichem? Die Details, auf die es ankommt, könnten sich auf eine bestimmte Person, ein Objekt oder eine Bewegung in einer Szene oder eine Art von Ereignis beziehen, die noch nie zuvor aufgetreten ist.

Überwachungssysteme erzeugen eine überwältigende (und meist ungenutzte) Menge an Daten, insbesondere im 24/7-Betrieb, die für die Erfassung von Beweisen, Vorfällen und Ereignissen unerlässlich ist. Es ist nicht nur schwierig, das Wesentliche einer Szene herauszufiltern, sondern auch extrem zeitaufwändig. Ein zentrales Problem, das es zu lösen gilt, ist die bessere Identifizierbarkeit und Verwertbarkeit der Daten. Die Anwendung von Metadaten-Deskriptoren zur Beschreibung von Schlüsseldetails in einem Tatort ermöglicht eine bessere Identifizierbarkeit und Verwertbarkeit der Daten.

Aus diesem Grund sind Metadaten die Grundlage für die Gewinnung von Erkenntnissen aus Überwachungsvideos und/oder Audioströmen. Metadaten bieten eine schnelle Möglichkeit, die wichtigsten Details in einem, Hunderten oder Tausenden von Video- und Audiodatenströmen zu finden, zu bewerten und entsprechend zu handeln. Sie sind heute ein wesentlicher Bestandteil effektiver Sicherheits- und Geschäftsabläufe.

Um was genau geht es dabei eigentlich?

Wie eine Google-Suche zeigt, werden Metadaten üblicherweise als „Daten über andere Daten“ bezeichnet. Im Kontext der Videosicherheit hieße das: „Daten über Videodaten“. Aber das kann sehr weit gefasst sein. Um genauer zu sein, müssen Sie die Details der Szene betrachten, auf die es ankommt. Diese beschreiben das „Wo, Was und Wie“ von Änderungen an einer Szene im Videostrom.

Video-Metadaten beschreiben genau die Details, die in einer Szene wichtig sind, wo sich diese Details befinden, was sie sind und welche Bedeutung sie in einer Szene haben. Das bedeutet, dass Attribute für Metadaten alle Arten von Details über bewegte Objekte von Interesse beschreiben können, z. B. Ort, Zeit, Farben, Größen, Formen, Koordinaten, Spuren, Lautstärke in Dezibel, Geschwindigkeit, Stimme, Dauer in der Szene, Bewegungsrichtung. Darüber hinaus können weitere grundlegende Details wie Beschreibung des Videostroms, Codec, Zeitstempel, Geräteidentität usw. hinzugefügt werden.

Alle oben genannten Begriffe sind „Meta“-Beschreibungen von Details in oder im Zusammenhang mit einer Szene. Auf der Grundlage von Machine- und Deep Learning-Analysen können Meta-Beschreibungen mehr (oder weniger) granular sein. Das bedeutet, dass die Metabeschreibungen Attribute auf einer hohen oder tiefen Ebene beschreiben können. Dies ermöglicht die Klassifizierung einer Pixelgruppe als Person, Tier, Fahrzeug oder andere vordefinierte Objektklassen. Sie können aber auch präzisere Beschreibungen von Personen oder Objekten verwenden, sofern genügend Details im Videobild enthalten sind:

1. Untertyp

  • Auto, Bus, Fahrrad etc.
  • Nummernschild
  • Modell und Marke

2. Farbe

  • Rot, gelb, blau, grün etc.

3. Merkmale der Bewegung

  • Art der Bewegung
  • Geschwindigkeit
  • Koordinaten des Standorts

Whitepaper zum Thema KI in der Videoanalyse herunterladen

Der Wert von Metadaten

Sie liefern nicht nur Details über Personen, Objekte und Ereignisse in einer Szene. Sie ermöglichen auch das schnelle Gruppieren, Sortieren, Durchsuchen, Wiederherstellen und Verwenden großer Mengen an Videomaterial. Daher lassen sich die Anwendungsfälle für Metadaten insgesamt in drei Bereiche einteilen:

Praktische Anwendungen von Metadaten

Metadaten weisen jedem Videobild eine digitale Bedeutung über die darin enthaltenen Objekte und Ereignisse zu. Mit anderen Worten, sie ergänzen eine Interpretation oder Intelligenz über die Szene und nicht nur das blanke Videomaterial, das manuell von einem Bediener verarbeitet werden muss. Sobald eine Software Szenen anhand der vorhandenen Metadaten interpretieren kann, kann sie beginnen Szenen zu „verstehen“. Sich wiederholende Ereignisse definieren über kurz oder lang was „normal“ ist und Abweichungen dazu können dann von einer Anwendungslogik alarmiert werden.

Von einer automatisierten Anwendung und einer echten Erkennung kriminellen Verhaltens ist die Technologie allerdings noch sehr weit entfernt. Es handelt sich vielmehr um einfache statistische Vergleichsmethoden, die Entscheidungsprozesse vereinfachen können. Metadaten ermöglichen noch weitere Anwendungsfälle, zum Beispiel:

  • Durchführen einer Suche im Video Management System: z. B. Personen mit roter Kleidung in einer Szene finden
  • Ausführen einer Automatisierungsregel: z. B. Öffnen der Schranke für ein Auto mit Kennzeichen XY-Z 123, nur dann wenn die Farbe des Fahrzeuges blau ist
  • Durchführen einer statistischen Analyse: z. B. Zählen, wie viele Autos sich auf einer Straße in eine bestimmte Richtung bewegt haben

Video-Metadaten sind ein immenser Mehrwert für ein Video Management System. Ihr wahres Potenzial entfalten sie, wenn sie auf mehrere Eingaben angewendet werden – auf visuelle, akustische, aktivitäts- und prozessbezogene Eingaben. Dinge wie RFID-Verfolgung, GPS-Koordinaten, Manipulationswarnungen, Zählerstände (z. B. Temperatur oder chemische Werte), Geräuscherkennung und Transaktionsdaten von Verkaufsstellen. Bei der Verwaltung eines Standorts sind dies alles hochwertige Datenquellen. Sie alle können auf der Grundlage ihrer Zeitstempel abgeglichen werden. Die Vereinheitlichung von Metadaten aus verschiedenen Quellen bedeutet, dass man viel mehr Einblicke erhält, als man jemals von jedem (isolierten) System allein bekommen kann.

Der Schwerpunkt liegt auf der Interoperabilität. Die IP-Welt kann noch einen weiteren großen Vorteil bringen. Offene Protokolle und Industriestandards sind auch hier unverzichtbar und ermöglichen eine nahtlose Integration von Metadaten. Massive Datenmengen aus allen möglichen Systemen werden uns helfen, ein schnelleres, tieferes und umfassenderes Verständnis für alles, was uns umgibt, zu gewinnen.

⇒ Lesen Sie mehr über die neue Ära der Videoanalyse und AXIS Optimizer für Milestone XProtect.