音声

監視システムにおける音声の利用はまだ一般的ではないものの、音声を利用した検知やイベントの通知、さらにIPネットワーク上で音声通信を行うな ど、音声を利用することでシステムの機能を拡張することができます。ただし、音声を利用した監視は国によって制限されている場合があります。実際に監視シ ステムを導入する前に現地の自治体など関連する機関で確認するようにしてください。

この章では、音声アプリケーション、音声機器、音声モード、音声検知アラーム、音声圧縮、音声とビデオの同期について説明します。

音声アプリケーション

ビデオ監視システムの一部として音声を活用すると、音を検出してイベント発生時や緊急時に通知を行ったりするなど、監視システムに高い付加価値を与 えることができます。全方向に対して利用できる音声機能は、ビデオ監視システムでカメラが監視できる範囲を拡張するひとつの手段となります。音声機能を利 用してPTZカメラやPTZドームカメラに指示を出したり、また担当のオペレータに音声アラームが発生していることを知らせて音声アラームの原因を視覚的 に確認することができます。

音声機能を利用して、マイクを設置した場所の音を拾ったり、訪問者や侵入者に対してスピーカーから指示を出すことができます。例えば、ATMの周辺 をうろついていたり、立ち入り禁止区域に進入しようとしている人がいた場合、遠隔地にいる警備員が音声を利用して警告を促すことができます。また、負傷者 や助けを待っている人に救援があとどの位で到着するかなど知らせることもできます。その他の利用方法として、アクセスコントロール(入退室管理を離れた場 所で行う)、リモートヘルプデスク(無人駐車場など)やビデオ会議があります。AVシステムを活用した監視システムは、セキュリティとリモート監視の効率 を高めると同時に、遠隔地にいるユーザとの情報の受け渡しを容易にします。

音声サポートと機器

ネットワークビデオシステムでは、アナログCCTVシステムより簡単に音声を導入することができます。アナログシステムでは、音声とビデオは始点から終点 まで個別にケーブルを引かなければなりません。つまり、カメラおよびマイクロフォンの設置地点からモニターや録画の保存場所までケーブルでつながなければ なりません。その距離が長い場合、平衡増幅器が必要となり設置にかかるコストや複雑さが増していきます。ネットワークビデオシステムでは、音声もビデオも 同じネットワークケーブルを経由して送信できます。ケーブルを追加する必要がなく、音声とビデオの同期も比較的容易です。

統合された音声対応ネットワークビデオシステム。音声とビデオは同じネットワークケーブルを利用して送信されます。

音声対応のビデオエンコーダの場合、アナログカメラ映像に音声機能を追加することができます。

音声機能対応のネットワークカメラまたはビデオエンコーダは、内蔵マイクロフォンやより高性能の外部マイクロフォンを接続するための音声入力 (Mic in/Line in)コネクタを備えています。外部マイクロフォンを利用することで、カメラから離れた場所にマイクロフォンを設置することができます。ノイズを軽減する ため、マイクロフォンはできるだけ音源に近い位置に設置するようにしてください。双方向、全二重モードでは、ハウリングを防止するためにマイクロフォンと スピーカーの距離を離すようにしてください。

ほとんどのAxisネットワーク製品はスピーカーを内蔵していませんが、音声対応のネットワークビデオ製品にはアンプを内蔵したアクティブスピー カーを接続することができます。スピーカーがアンプを内蔵していない場合は、まずスピーカーをアンプと接続し、続いてアンプとネットワークカメラ/ビデオ エンコーダを接続します。

音の減衰やノイズを最小限に抑えるには、シールド付きの音声ケーブルを使用し、音声ケーブルを電源ケーブルや高周波信号を伝送しているケーブルの近 くに敷設しないようにしてください。また、音声ケーブルの長さはできるだけ短くしてください。長い音声ケーブルを利用する場合は、平衡増幅器を利用して ケーブル、増幅器、マイクロフォンを通過する信号を増幅させてノイズを軽減します。

音声モード

利用するアプリケーションに応じて、使用する音声モードを選択します。単方向または双方向、また交互に通信したり、同時に通信したりすることができます。音声モードには、3種類のモード(単方向、半二重、全二重)があります。

単方向

単方向モードでは音声は片方向にしか送信できません。上記の例の場合、音声はカメラに接続したマイクからコンピュータのスピーカーに送信されます。遠隔地のモニタリングとビデオ監視で使用されます。

上記の単方向モードの例では、音声はコンピュータに接続されたマイクからカメラに接続されたスピーカに送信されます。例えば、カメラに映っている人に音声で指示を与えたり、犯罪が発生していると思われる現場で犯人に対して警告を促すことができます。

半二重

半二重モードでは音声の送受信を交互に行うことができます。トランシーバと同じ仕組みになります。

全二重

全二重モードでは、電話で会話するのと同じように音声の送受信を同時に行うことができます。全二重モードを使用するには、コンピュータに全二重対応のサウンドカードをインストールする必要があります。

音声検知アラーム

音声検知アラームは、暗い場所でビデオモーション検知が使用できない場合などに補助的に使用することができます。また、カメラの撮影可能範囲外で発生したイベントを検出する場合などにも使用できます。

音声検知アラームを利用すると、窓が割れる音や人の叫び声などを検知した時に、ネットワークカメラが作動して画像を録画し、電子メールや他の方法で 通知を行ったり、アラームなどの外部デバイスを駆動させることができます。また、動き検出センサーやドアスイッチなどのデバイスと連動してビデオや音声の 録画を実行することもできます。PTZカメラやPTZドームカメラの場合は、プリセットポジションを設定することで音声検知が行われた時にカメラを特定の 方向(例:オフィスの窓)に自動的に向けることができます。

音声圧縮

アナログ音声信号はサンプリングの工程でデジタル音声への変換が行われ、伝送と保存に適したサイズに圧縮されます。変換と圧縮は、音声データの符号化と複合化のアルゴリズムである音声コーデックを使用して行われます。

サンプリング周波数

音声コーデックには様々なサンプリング周波数と圧縮レベルがあります。サンプリング周波数はアナログ音声信号を1秒間に採取する回数を示し、単位にはヘルツ(Hz)を使用します。サンプリング周波数が高いほど音質が向上し、帯域幅とストレージの容量が必要になります。

ビットレート

ビットレートは音声における重要な設定項目です。ビットレートによって圧縮レベルが決定する、つまり音声の品質が決定することになります。一般的 に、圧縮レベルが高くなる(ビットレートが低くなる)ほど、音質は下がります。高圧縮レベル(低ビットレート)ではコーデックによる音質の違いが顕著に分 かる場合がありますが、低圧縮レベル(高ビットレート)ではその差は分かりません。高圧縮レベルではレイテンシー(遅延)が発生しますが、帯域幅とスト レージの使用量を抑えることができます。

音声コーデックでよく使用されるビットレートは、32~64kビット/秒です。音声のビットレートは、ビデオのビットレートと同様に帯域幅とストレージ容量全体を計算する際に考慮しなければならない重要事項です。

音声コーデック

Axisネットワークビデオ製品は、3種類の音声コーデックをサポートしています。まずAAC-LC(Advanced Audio Coding - Low Complexity)は、MPEG-4 AACとして知られるライセンスされた規格です。AAC-LCは、特に16kHz以上のサンプリングレートと64kHzのビットレートを使用した場合、最 高の音質を得ることができるお勧めのコーデックです。その他のコーデックには、使用の際にライセンスを必要としないG.711およびG.726がありま す。

音声とビデオの同期

音声とビデオの同期は、動画プレイヤー(マルチメディアデータを再生できるコンピュータソフトウェア)や、Microsoft DirectXのようなプログラミングインターフェイスを持つマルチメディアフレームワークを使用します。

音声とビデオは2つの独立したパケットストリームとしてネットワーク上に送信されます。音声とビデオを同期させるには、音声とビデオパケットにタイ ムスタンプを付加する必要があります。ただし、ネットワークカメラの機種によっては、Motion JPEG圧縮を利用したビデオパケットへのタイムスタンプの付加をサポートしていないものがあります。このような場合は、ビデオストリームと音声ストリー ムへのタイムスタンプの付加が可能なRTP(Real-Time Transport Protocol)を利用してパケットを送信できる、MPEG-4またはH.264ビデオフォーマットのいずれかを選択してください。音声の同期に関して は、音声は聞いているが録音はしていないなど、音声の同期が重要でない場合も多々あります。