Audioanalyse: Optimierung von IP-Kameras mit intelligenten Ohren

Nehmen wir eine Bedrohung wahr, verlässt sich unser Gehirn auf alle unsere Fähigkeiten, um die Gefahr richtig einzuschätzen. War es ein Autounfall oder ein Schuss? Ist ein Fenster zerbrochen oder hat jemand ein Glas fallen lassen? War das ein Schrei vor Wut oder vor Freude? Ein Ereignis in einen visuellen Kontext zu setzen kann eine Einschätzung vereinfachen. Aber oft haben wir nur einen Moment Zeit, um ein Ereignis richtig einzuordnen und dann entsprechend zu reagieren.

In der Welt der physischen Sicherheit ergänzen Überwachungskameras diese Wahrnehmung. Sie ahmen den menschlichen Prozess der intelligenten Abwägung sensorischer Daten nach und stellen fest, ob eine Bedrohung unmittelbar bevorsteht.

Viele von uns kennen Videoanalyseanwendungen. Sie erfassen, analysieren und präsentieren eine situative Wahrnehmung der gesehenen Dinge. Sie ermöglichen es den Kameras, eine Menschenmenge zu berechnen, herumlungernde Personen anzuzeigen oder Eindringlinge zu erkennen, die unerlaubte Bereiche betreten.

Im Vergleich dazu arbeitet die Audioanalyse im akustischen Bereich – sie erkennt und identifiziert verschiedene Geräusche, auch wenn die Kamera gerade in der entgegengesetzten Richtung aufzeichnet. Diese Anwendungen können das Sicherheitspersonal auf bestimmte Geräusche wie verbale Aggressionen, das Einschlagen einer Fensterscheibe oder sogar das Abfeuern einer Waffe aufmerksam machen.

Verständnis der Grundlagen der Audioanalyse

Die Sound Detection Software sucht nach einer komplexen Kombination von Eigenschaften – vom Dezibel-Pegel bis hin zur Energiedichte verschiedener Frequenzen über einen bestimmten Zeitraum. Diese Anwendungen sind so programmiert, dass sie Hintergrundgeräusche wie Verkehr, Gespräche, Musik usw. ignorieren, und lösen einen Alarm aus, wenn sie ein sehr spezifisches akustisches Muster hören. Dies hilft, das Risiko von Fehlalarmen auch in Umgebungen wie auf Bahnsteigen oder Gefängniszellen zu minimieren.

Im Gegensatz zur separaten Audio-Streaming-Funktion einer Videokamera zeichnet die Audioanalyse den Ton nicht kontinuierlich auf. Das Programm arbeitet im Puffermodus und zeichnet einige Sekunden vor und nach der Erkennung auf, damit der Sicherheitsdienst das Tonereignis prüfen und für forensische Beweiszwecke aufbewahren kann.

Die Integration der Audioanalyse in Edge-Geräte wie IP-basierte Kameras, Türstationen, Lautsprecher und Audio bridges bietet diverse Vorteile:

  • Die Audioverarbeitung findet im Inneren des Geräts statt, so dass kein zentraler Server erforderlich ist.
  • Video-Feeds übertragen nur, wenn sie durch ein Audioereignis ausgelöst werden, was den Bandbreitenverbrauch und den Speicherbedarf reduziert.
  • Audioanalyse verbessert die Echtzeitüberwachung, da ein Alarm die Aufmerksamkeit der Sicherheitskräfte sofort auf den potenziellen Vorfall lenkt.

Die Ausstattung von Videoüberwachungssystemen mit Audioanalyseanwendungen bietet nicht nur einen zusätzlichen Schutz von Räumlichkeiten, sondern ermöglicht durch die Unmittelbarkeit der Warnmeldungen eine proaktivere Identifizierung und zeitnahe Reaktion auf Bedrohungen.

Eine auf Klang basierte Entscheidung treffen

Durch moderne, maschinelle Lerntechniken ist die Anzahl der katalogisierten Sounds in einer Analysebibliothek nahezu unendlich, begrenzt nur durch die Verarbeitungskapazität einer Kamera. Im Bereich der Videoüberwachung gehören Aggression, Autoalarm, Schüsse oder Glasbruch zu den häufigsten Tonmustern, auf die Analytiker achten.

  • Die Aggressionserkennung identifiziert verbale Aggressionen, bevor die Situation eskaliert. Die Analysesoftware reagiert auf Klangmuster, die Zwang, Wut oder Angst darstellen. Die American Psychological Association stellte fest, dass 90 Prozent aller aggressiven Vorfälle von Wut begleitet werden. Wenn die Aggressionserkennungstechnologie eine der entsprechenden Soundsignaturen erkennt, löst das System automatisch einen Alarm aus und/oder überträgt Echtzeit-Videomaterial an einen Kontrollraum oder eine mobile Vorrichtung. Mit einer Frühwarnung kann das Personal schnell eingreifen und den Vorfall klären, bevor die Feindseligkeiten physisch werden. Durch die Integration der Anwendung in die Kameras kann das Sicherheitspersonal die Entwicklung der Ereignisse beobachten und den Einsatzkräften auf dem Weg zum Einsatzort zusätzliche Informationen zur Situation vor Ort geben.
  • Die Autoalarmerkennung hört auf das spezifische Klangbild, das von den gängigsten Autoalarmsystemen auf dem Markt erzeugt wird. Die Analytik kann das Schallmuster in einem großen Radius um die Kamera herum erkennen. Dies macht die Anwendung besonders nützlich in Parkhäusern und auf weitläufigen Parkplätzen. Durch das Senden von Echtzeit-Alarmen mit Standortinformationen hilft die Analyse dem Sicherheitspersonal, schneller auf Vorfälle zu reagieren und Diebstahl oder Vandalismus zu verhindern.
  • Die Schussdetektion erkennt das Geräusch von Schüssen aus einer Vielzahl von Schusswaffen: Pistolen, Schrotflinten, Gewehre und automatische Waffen. Sobald die Software feststellt, dass eine Waffe entladen wird, erfolgt sofort eine Warnung des Sicherheitspersonals. Das Geräusch kann sofort zur Überprüfung wiedergeben und die Bedrohung mit Unterstützung der Videokameras visuell eingeschätzt werden. So kann schnell und zuverlässig auf ein Ereignis reagiert werden.
  • Die Glasbrucherkennung erkennt das Geräusch von Glasbruch, egal ob die Scheibe laminiert, einfach oder doppelt, gehärtet oder verdrahtet ist. Erfolgt ein Glasbruch, setzt die Software eine Warnung an das Sicherheitspersonal ab, um den Vorfall zu untersuchen. Die in die Kamera integrierte Analytik spart die Kosten für die Installation von Bewegungssensoren an jedem Fenster.

Die Erweiterung von Videoüberwachungslösungen mit den beschriebenen und anderen kundenspezifischen Audioanalysen ermöglicht es, Situationen vollständig differenziert wahrzunehmen. Überwachungssysteme, ausgestattet mit intelligenten Analysetools zur Auswertung von Audio- und Videomaterial helfen dem Sicherheitspersonal, die Art einer Bedrohung schnell zu erkennen und angemessen zu handeln.

Grundsätzlich – wenn es ums „Hören“ geht, erkennt und identifiziert die Audioanalyse nur bestimmte akustische Klangmuster, nicht aber die eigentliche Sprache. Dies ist wichtig, denn in den meisten Ländern gibt es strenge Vorschriften für Aufzeichnungsgeräte.

Kameras mit intelligenten „Augen“ und „Ohren“

Überwachungskameras waren anfangs nur „dumme Aufzeichnungsgeräte“. Da die Rechenleistung der Kameras im Laufe der Jahre zunahm, sind sie heute um ein vielfaches intelligenter. Videoanalyseanwendungen in den Kameras bieten intelligente Möglichkeiten, um Aufzeichnungen richtig zu interpretieren – die Audioanalyse komplettiert die Überwachungsanwendung.

Weitere Informationen über die Integration von Audioanalytik in Videoüberwachungslösungen finden Sie unter „Listen Up“, James Marcella, Security Industry Association Magazine, April 2018.

 

Derek van der Vorst

Unser Gastautor: Derek van der Vorst

Nach einer internationalen Karriere in der Audio- und Spracherkennung bei Philips Electronics, hat Derek van der Vorst im Jahr 2000 Sound Intelligence gegründet. Mit seinem Unternehmen hat er Pionierarbeit in der fortschrittlichen Audioanalyse geleistet. Er kombiniert ein tiefes Verständnis der Kerntechnologie der Audioanalytik mit einem natürlichen Gespür dafür, was Kunden mit dieser Technologie erreichen wollen. Derek hat Sound Intelligence zum Marktführer in der Audioanalytik mit Zehntausenden von Systemen entwickelt, die weltweit eingesetzt werden.