探究流行语:人工智能、视频分析、边缘计算等

Guest authors

本文由Albert Unterberger撰写,他是Unterberger Consult的老板,具有丰富的安防行业 经验。本页面底部有关于他的更多信息。

按照词典的定义,流行语是:“源于特定领域的一个词汇或表达,因获大量使用而变得流行。”

虽然流行语可能因过度使用(经常是滥用)而让人厌烦,但它们通常会成为我们的常用词汇,因为它们涉及到拥有巨大潜力的、令人振奋的技术创新。

在本文中,我将深入研究一些流行语,包括:人工智能(AI)、机器学习、深度学习、视频分析、物联网(IoT)和边缘计算,它们在安全、安防及其他领域有着巨大的潜力。实际上,如果我们要充分利用视频硬件和软件的持续创新,那么它们的应用就必不可少。

 

视频分析的需求
视频分析的高级定义非常简单:可以自动分析现场和录制的视频脚本,从而提供警报、自动响应和可行见解的软件。
虽然视频分析并不是一件新事物,早在21世纪初甚至之前我们就已经开始谈论它,但就像许多流行语一样,它的价值只有在其他技术追赶上它的原始愿景之后,才能够真正得以实现。

视频分析的需求日益增长。越来越多更高质量的摄像机因为越来越多的原因,而被安装到越来越多的环境中。从根本上讲,它指向了一件事情:更多的信息需要审查。比以往多得多的信息!

仅靠人类根本无法审查全球监控摄像机创建的海量视频脚本。人类的认知能力尽管很优秀,但却无法扩展到能够应对数百甚或数千台摄像机,因此必须得到技术的支持和强化。还不错,计算机能够全天24小时实时处理大量的数据,而不会感到疲劳。

但是,处理数据是一回事,能够有效分析并提供有用的见解尚需更高水平的认知能力。因此,我们来继续了解一下当前最流行的流行语之一:人工智能。

计算机能复制人类智能吗?

最简洁的答案是:“不能”。稍微长一点的答案是:“可能,但很长一段时间内还不能”。

实际上,“人工智能”有点用词不当,或者至少被普遍误解,因为它是指在计算机中人为地创造人类水平的智能。同样按照词典的定义,智能只是“获取和应用知识和技能的能力”。

这样来说的话,就比较容易理解计算机如何实现人工智能化,也比较容易理解人工智能有效应用于视频分析需要哪些“知识和技能”(例如,在非常基础的层面上,判断物体是人类还是动物还是无生命物体的能力)。
虽然人工智能通常是头条的主题,但其定义却指向了实现人工智能的具体要求:计算机的学习能力。

 

教机器学习,深入地学习

训练计算机学习(从逻辑上说)就是所谓的机器学习。

我们都经常接触机器学习。我们有些人在网上购物或看电影电视时,经常会碰到各种推荐(有望随着时间的推移而变得更加准确和有用),这些推荐便是基于机器学习。根据我们购买的东西或观看的内容了解我们的喜好只是其中的一个方面,让机器学习变得更为强大的是:在分析我们喜好的同时,它还能够分析做出类似选择的数百万其他人的喜好,并结合我们更多已知的人口统计学信息(例如,源于社交媒体网站的信息)加以利用。

在视频监控领域,机器学习拥有巨大的潜力,领先的人工智能专家Andrew Ng在自己撰写的推文中断言:“一个普通人能够在1秒钟时间内完成的几乎所有任务,我们现在都可以通过人工智能予以自动化。”其中当然包括识别人员(男性、女性、种族、年龄)、动物、车辆和物体,并进行分类。

在训练计算机学习每个对象的属性方面,视频分析正在变得日趋强大。但了解事物是什么是一回事,分析它正在做什么以及为什么要做则完全是另一个挑战。

视频分析始终有赖于人类软件开发人员的想象力、经验和技能。人类编写的视频分析软件代码,根本不可能涵盖每一种可能情况下的每一个可能对象。

这就需要我们进一步了解目前最先进的人工智能:深度学习。

 

神经网络和对象属性

深度学习的核心是人工神经网络:一种更接近于人类思维方式的计算机处理结构。我们必须了解的是,它不再关乎算法,而是关乎描述计算机需要识别的情况的训练数据。因此,理论上不再存在限制性的人为因素。

在一个非常简单的场景中,机器学习可以告诉你有车和人,而深度学习不仅可以告诉你汽车的颜色和品牌,而且还可以识别交通标志、骑自行车的人、甚至携带手提包的人。

但是,如果没有学习材料,我们就无法开展学习。计算机也是如此。虽然神经网络使得计算机能够接受训练,但如果我们真正希望它们“学习整个世界”,那么为此所需的数据量将极其庞大。

 

为什么“大数据”算是轻描淡写……

对于视频分析领域的深度学习,获取数据的能力是一项重大挑战。来自视频监控摄像机的视频内容通常高度敏感,并且受到GDPR等国际数据保护法规的严格保护。此外,即便能够找到大量的数据集,那么处理、分析和学习的计算能力要求也极高。

但历史的经验告诉我们,这些挑战将会被克服,并且还会有其他一些流行语指向人工智能的潜在贡献者:物联网和边缘计算。

物联网(IoT)是数据增殖的核心。物联网涵盖全球范围内所有的联网设备,从手机到冰箱,从工业传感器到灯柱,从语音助理到网络摄像机,无所不包,每时每刻都会产生大量的数据。这些数据大部分具有潜在价值,但是需要传输、加工、处理、存储和分析。

当前最常见的模式,是将所有数据从联网设备传输至数据中心进行存储和分析。当然,并非所有来自于设备的数据都有用或者有价值,所以其传输和存储会造成带宽和内存资源的大量浪费,并对能耗和成本产生影响。

所以我们需要边缘计算。顾名思义,边缘计算将更多的处理能力置于网络的“边缘”,或者更加确切地说,置于联网设备本身。这样设备本身(对于我们来说是网络摄像机)便拥有了一定的数据分析能力,因此只需传输有意义的、有用的数据,或者需要进一步分析的数据(例如,通知边境管制官员需要验证护照的例外情况)。边缘计算在带宽和存储需求方面的优势是显而易见的,更不用说还可以提高运营效率。

 

视频分析的愿景

我们已经开发了很多基础的东西,那么现在应该把这些东西整合起来。至于视频分析的未来,其目标是将计算机的计算能力及其不断增长的学习和理解能力与人类独特的决策能力相结合。从许多方面来说,“增强智能”是一个比“人工智能”更好的术语。人类与计算能力将会成功地组合,我们将会看到更加智能的摄像机,它能够通过人工智能有效地分析各种情况,向操作人员提供最重要的信息,以便做出准确、快速和有效的决策,最终进行适当的响应。

阅读关于2019年重要行业发展趋势的这篇文章,了解安讯士对于近期发展的看法,并通过下面的链接进一步了解视频分析的愿景。

 

视频分析的愿景

Albert Unterberger是Unterberger Consult的老板。作为视频监控专家,他在安防行业积累了丰富的经验,目前正在推动高科技视频产品和解决方案的开发战略,并在垂直细分市场上对产品和解决方案进行定位。欲了解详情,请登录http://www.unterberger-consult.com/aboutme/。