重要なディテールの表現: ビデオメタデータの重要性

Joe Danielson

効果的な監視ソリューションを実現するには、撮影した複雑なシーンを理解しやすくし、それに基づいて行動できるようにする必要があります。そのためには、潜在的に大量の情報を含むビデオストリームや音声ストリームから、膨大な量のディテールを収集する必要があります。システムで使用するデバイスの数が多いほど、関心の対象になるディテールの量が増加します。

効果的な監視とは、システム管理者とオペレーターにとって重要な撮影シーン内のディテールに基づいて、判断を下すことです。しかし、どの情報のディテールが必要なのかが不明な場合や、シーン内の何に注目すべきなのか、たとえば、どこが正常な状態と違うのかが不明だと、どうなるでしょうか? 問題となるディテールは、シーン内の特定の人物、物体、動きに関係する場合もあれば、これまで一度も発生したことのない事象に関係する場合もあります。

最新の監視システムは、圧倒されるほど大量のデータを生成する一方で、そのほとんどが使用されません。特に,証拠、事象、事件や事故を撮影するのに欠かせない24時間年中無休の体制でビデオを録画する場合にあてはまります。撮影したシーンから本当に重要な情報を取り出すことは難しいだけでなく、極めて長い時間が必要になります。データを識別しやすくし、データに基づいて行動しやすくすることが、問題を解決する鍵になります。シーン内の重要なディテールを表現するメタデータ記述子を適用することによって、データを識別しやすくし、データに基づいて行動しやすくすることができます。

メタデータが、監視ビデオストリームや音声ストリームからインテリジェンスを収集するための基盤であるのは、これが理由です。メタデータは、1つ、数百、あるいは数千のビデオ、音声ストリームから最も重要なディテールを見つけ出し、評価し、データに基づいて行動するための手段となるため、現在では、効果的なセキュリティ業務と事業運営に不可欠な存在になっています。

 

メタデータとは?

ここでメタデータの定義を考えます。Googleで検索すると分かるように、メタデータは一般に、「データに関するデータ」であり、ビデオ監視の世界では、「ビデオデータに関するデータ」と言い換えることができます。しかし、これでは、非常に漠然としています。より具体的に定義するには、シーンに含まれる重要なディテールについて考察する必要があります。これらのディテールは、ビデオストリーム内の特定のシーンで生じた変化について、「どこで、何が、どのように」変化したかを詳細に示します。

ビデオメタデータは、ディテールが存在する場所、ディテールの種別、シーン内での動きの観点から、シーン内の重要なディテールを正確に記述したものです。

つまり、メタデータはその特性上、関心の対象となる移動物体について、次のように、あらゆるディテールを記述することができます。

  • 位置、時間、色、サイズ、形、座標、軌道、音量 (dB)、速度、音声、シーンでの存続時間、動きの方向

また、次のような、より基本的なディテールを追加することができます。

  • ビデオストリームの説明、コーデック、タイムスタンプ、デバイスIDなど

上記はいずれも、シーンに含まれるか、シーンに関係するディテールの「メタ」記述です。

機械学習と深層学習に基づいて、メタ記述の粒度を高低させることができます。つまり、メタ記述では、大まかなレベルでも、深いレベルでも属性を記述することができるため、ピクセルの集合を人物、動物、車両など、事前に定義済みのオブジェクトクラスに分類することができます。また、たとえば次のように、人物や物体に関するより具体的な記述を使用して、詳細化することができます。

1.  サブタイプ:

    • 車両
      • 自動車、バス、自転車など
      • ナンバープレート
      • 車種、型番

2.  色

    • 赤、黄、青、緑など

3.  運動特性

    • 動きのタイプ
    • 速度
    • 座標位置

 

メタデータの価値

メタデータは、シーン内の人物、物体、事象に関するディテールを示すだけではありません。大量のビデオや録画映像をすばやく分類し、並べ替え、検索し、回収し、使用することも、メタデータによって可能になります。そのため、メタデータの用途は大まかに、以下の3つの分野のいずれかに当てはまります。

  1. リアルタイムでの警告や通知
  2. 事象発生後のフォレンジック検索
  3. 統計分析とレポート

 

メタデータを使用してシーンにインテリジェンスを追加

メタデータは基本的に、シーン内の物体や事象のデジタルな意味を各ビデオフレームに割り当てます。つまり、オペレーターが手動で処理する必要のある生のビデオ映像だけでなく、シーンについての解釈やインテリジェンスがメタデータによって追加されます。

この方法でシーンを解釈できるようになったソフトウェアは、シーンのディテールを理解するので、シーンに基づいて、事象の発生中にリアルタイムで行動したり、事象の発生後に行動したり、手動検索を通じて行動したり、単純に統計分析を行ったりすることが可能になります。これにより、メタデータを使用して、個々のカメラから送られるシーンについて、何が「正常」であるかを定義するベースラインを設計することできます。その結果、ソフトウェアでは、逸脱の程度、変則性、特定の挙動などを認識し、そのシーンで今後何が起こるかを一定の確率で予測することができます。

メタデータの新たな用途として、以下が挙げられます。

  • 事象発生後の検索: たとえば、シーン内で赤い服を着た人物を見つける
  • 自動化ルールの適用: たとえば、テキサス州XYZ123のナンバープレートを付けた青い自動車については封鎖を解除
  • 統計分析: たとえば、道路上で特定の方向に移動した自動車の台数を計測

ビデオメタデータは、ビデオ管理システムに計り知れないほど大きな付加価値をもたらします。実際、メタデータの真の潜在能力が発揮されるのは、無線ICタグを使用した追跡、GPS座標、改ざんの警告、温度や化学物質のレベルの検針、ノイズ検出、POS端末の取引データなど、外観、音声、動き、プロセスに関連する複数の入力にメタデータを適用した場合です。どの施設を管理する場合にも、これらはすべて高価値のデータソースであり、タイムスタンプに基づいて、連携させることができます。さまざまなソースから得たメタデータを統合することにより、孤立した個々のシステムのみから入手するよりも、はるかに多くの知見を得ることができます。

重視すべきは、相互運用性です。IPの世界では、他にも大きなメリットを生み出すことができます。オープンプロトコルと業界標準は不可欠であり、それによって、メタデータのシームレスな統合が可能になります。あらゆる種類のシステムから得られる大量のデータが、私たちを取り巻くすべてのものを、より速く、詳しく、幅広く理解する上で役に立つでしょう。

メタデータとAXIS Optimizer for Milestone XProtectの詳細については、こちらをご覧ください。

AXIS Optimizer