Шумиха вокруг искусственного интеллекта, видеоаналитики, периферийных вычислений: что за этим стоит?

Аватар

Как видно уже из самого названия, громкие модные словечки – это слова или выражения из определенной предметной области, которые быстро входят в моду вследствие постоянного употребления в речи.

Хотя подобные словечки могут вызывать немало критики из-за постоянного (и нередко неправильного) употребления по поводу и без повода, со временем они, как правило, прочно входят в наш лексикон, так как обозначают некие новые и удивительные явления с огромным потенциалом.

Все модные понятия и стоящие за ними технологии, такие как искусственный интеллект (ИИ), машинное обучение, глубинное обучение, видеоаналитика, интернет вещей и периферийные вычисления – обладают невероятным потенциалом в сфере безопасности (и не только). И в самом деле, без этих вещей не обойтись, если мы хотим в полной мере воспользоваться теми преимуществами, которые предлагает нам постоянно развивающаяся область видеоаппаратуры и соответствующего программного обеспечения.

 

Потребность в видеоаналитике

Общее определение видеоаналитики выглядит довольно просто: это технология в основе программного обеспечения, которое автоматически анализирует видеоматериалы, поступающие в режиме реального времени или записанные ранее, и на этом основании дает сигналы тревоги, автоматические ответы или предлагает полезную информацию.

Хотя сама по себе видеоаналитика возникла уже довольно давно – о ней начали говорить еще в начале 2000-х и даже раньше – ее истинную ценность (как и в случае со многими другими явлениями, которые обозначаются модными словечками) люди по-настоящему осознали только спустя много лет, когда развитие других технологий позволило реализовать ее основную идею.

Растущая потребность в видеоаналитике совершенно очевидна. Всё больше камер всё более высокого качества размещается во всё более разнообразных местах – и выполняют они всё больше разных функций. По большому счету, всё это сводится к увеличению потока информации. Огромному увеличению.

Люди уже просто не в состоянии просмотреть все записи, снятые камерами видеонаблюдения по всему миру. Наши собственные интеллектуальные навыки – прекрасные, но неспособные охватить материал с сотен или тысяч камер – необходимо поддерживать и дополнять при помощи технологий. И это хорошо. Компьютеры могут обрабатывать огромные объемы данных в режиме реального времени, круглосуточно и не требуя отдыха.

Но обработка данных – это одно, а вот для того, чтобы эффективно анализировать их и делать полезные выводы, необходимы определенные интеллектуальные способности. И это подводит нас к одному из самых модных сегодня слов, а именно – к искусственному интеллекту (ИИ).

 

Могут ли компьютеры воспроизвести интеллект человека?

Если говорить коротко – нет. Если говорить более развернуто – возможно, но это будет еще нескоро.

На самом деле «искусственный интеллект» – это неправильный или как минимум неправильно понимаемый термин, так как он предполагает искусственное наделение компьютера интеллектом человеческого уровня. Но если посмотреть определение в словаре, то интеллект – это просто «способность получать и использовать определенные знания, умения и навыки».

Отталкиваясь от этого определения, нам будет гораздо проще представить, каким образом компьютеры могут обрести искусственный интеллект. Кроме того, с этой точки зрения гораздо проще оценить, какие «знания, умения и навыки» потребуются ИИ для его эффективного использования в области видеоаналитики (например, на самом базовом уровне, способность узнавать, что представляет собой тот или иной объект – человек, животное или неодушевленный предмет).

Но хотя в прессе нередко говорят именно об искусственном интеллекте, приведенное выше определение указывает на более конкретное условие, необходимое для того, чтобы ИИ стал реальностью: это способность компьютеров учиться.

 

Как научить машины учиться

Когда мы учим компьютеры учиться, это называется (что вполне логично!) машинным обучением.

С этим процессом регулярно сталкиваемся все мы. Например, именно на машинном обучении основаны рекомендации, которые получают те из нас, кто покупает или смотрит видео в интернете – и которые, надеемся, со временем становятся всё более точными и полезными. Получать информацию о наших предпочтениях на основании того, что мы купили или посмотрели – это, конечно, хорошо, но реально мощным машинное обучение становится только тогда, когда эти предпочтения анализируются вместе с предпочтениями миллионов других людей, делающих аналогичный выбор, и когда к этому анализу добавляется дополнительная демографическая информация (полученная, например, из соцсетей).

В мире видеонаблюдения машинное обучение обладает поистине огромным потенциалом, примером чего является твит Эндрю Ына, одного из ведущих экспертов по ИИ: «Сейчас при помощи ИИ мы можем автоматически делать практически всё, что обычный человек может сделать быстрее, чем за одну секунду». Сюда, конечно, относится распознавание и классификация людей (по полу, расе, возрасту), а также животных, транспортных средств и предметов.

Чем больше компьютеры знают о характерных признаках каждого объекта, тем более эффективной становится видеоаналитика. Но понять, что представляет собой какой-либо объект – это одно, а вот проанализировать, что он делает и почему – совсем другое.

Видеоаналитика всегда зависела от воображения, опыта и навыков людей, разрабатывавших соответствующее программное обеспечение. Но человек просто не может написать код, который будет учитывать каждый возможный объект в каждой возможной ситуации.

И это подводит нас к самому сложному на сегодня уровню ИИ, а именно – к глубинному обучению.

 

Нейронные сети и свойства объектов

Суть глубинного обучения – в использовании искусственных нейронных сетей, структур для компьютерной обработки данных, которые относительно точно воспроизводят работу человеческого разума. При этом очень важно понимать, что речь идет уже не столько об алгоритмах, сколько о данных для обучения, описывающих ситуации, которые компьютер должен распознавать. Теоретически это устраняет ограничения человеческого фактора.

Так, например, машинное обучение поможет компьютеру отличать автомобили от людей, а глубинное – определять цвета и марки автомобилей, а также распознавать светофоры, велосипедистов и даже людей с сумками в руках.

Однако мы можем учиться только в том случае, если у нас есть обучающий материал. Компьютеры в этом от нас совершенно не отличаются. И хотя нейронные сети позволяют им учиться для того, чтобы «познавать мир», им нужны поистине огромные объемы данных.

 

Почему термин «большие данные» оказался преуменьшением

Для глубинного обучения в видеоаналитике само получение подобных данных – весьма сложная задача. Материалы с камер видеонаблюдения нередко конфиденциальны и совершенно справедливо подпадают под действие международных нормативно-правовых актов о защите данных – например, Общего регламента по защите данных, принятого Евросоюзом. Кроме того, даже при наличии огромных массивов данных очень большую роль играет и вычислительная мощность, необходимая для их обработки, анализа и обучения.

Но если история хоть чему-нибудь научит нас, эти проблемы удастся преодолеть. Вклад в развитие ИИ вносит еще пара модных направлений – интернет вещей и периферийные вычисления.

Интернет вещей очень важен для распространения данных. Охватывая всю совокупность существующих на нашей планете устройств с выходом в интернет – от мобильных телефонов до холодильников, от промышленных датчиков до фонарных столбов, от голосовых помощников до сетевых видеокамер – интернет вещей каждую секунду создает огромные объемы данных. Большинство этих данных имеет потенциальную ценность, но при этом требует надлежащей передачи, обработки, хранения и анализа.

Самая распространенная сегодня модель предполагает передачу всех данных от устройства в центр обработки данных для хранения и анализа. При этом, конечно, не все данные могут быть полезными или ценными, и поэтому их передача и хранение приводят к напрасному расходованию существенных ресурсов пропускной способности и памяти – а значит, к росту энергопотребления.

И тут в игру вступают периферийные вычисления. Как показывает название, периферийные вычисления предполагают частичный перенос обработки данных на «периферию» сети или, проще говоря, на само подключенное к сети устройство. При этом данные в определенной мере анализируются самим устройством (в нашем случае – сетевой видеокамерой), а в центр передаются только значимые, полезные данные или те данные, которые требуют дополнительного анализа (например, предупреждение органов власти о нестандартных ситуациях при прохождении пограничного контроля, требующих проверки паспорта). Преимущества подобного подхода с точки зрения требований к пропускной способности и хранению вполне очевидны, не говоря уж о повышении эффективности работы.

Перспективы развития видеоаналитики

Мы поговорили о весьма широком круге понятий, и теперь стоит подвести определенные итоги. Основная цель видеоаналитики – совмещение возможностей компьютеров и их постоянно увеличивающейся способности к обучению и пониманию с уникальными способностями в области принятия решений, которыми обладают только люди. Во многих отношениях более удачным термином для этого нам представляется не «искусственный», а «дополненный интеллект». Наилучшим вариантом здесь будет работа людей, подкрепленная вычислительной мощью компьютеров. Появятся более умные камеры, обладающие более широкими способностями к эффективному анализу ситуаций благодаря использованию ИИ и обеспечивающие операторов самой важной информацией, на основании которой те смогут принимать точные, быстрые и эффективные решения.