유행어에 대한 이해: AI, 비디오 분석, 에지 컴퓨팅…

Guest authors

이 게시물은 보안 업계에서 폭넓은 경험을 가진 Unterberger Consulture의 오너, Albert Unterberger가 작성했습니다. 이 페이지 하단에서 Albert에 대해 더 자세히 읽어보세요.

유행어의 사전적 정의는 다음과 같습니다. “많이 사용됨으로써 유행하게 된 특정 주제 영역의 단어나 표현”

유행어는 과용(그리고 종종 잘못 사용)된다는 이유로 나쁜 평판을 얻을 수 있지만, 대부분 우리가 사용하는 단어의 일부가 됩니다. 왜냐하면 그 단어들은 엄청난 잠재력을 지닌 새롭고 흥미로운 혁신들과 관련되기 때문입니다.

이 포스팅을 통해 살펴볼 유행어인 인공지능(AI), 머신러닝, 딥러닝, 비디오 분석, 사물인터넷(IoT), 에지 컴퓨팅은 모두 안전과 보안에 있어 (그리고 더 많은 분야에서) 엄청난 잠재력을 가지고 있습니다. 실제로, 비디오 하드웨어 및 소프트웨어에서 지속적인 혁신을 최대한 활용하려면, 이들의 애플리케이션이 필수가 될 것입니다.

비디오 분석에 대한 요구

비디오 분석에 대한 개괄적인 정의는 매우 간단합니다: 실시간 및 녹화 비디오 영상을 자동으로 분석해서 경고, 자동화된 대응 및 실행 가능한 통찰력을 제공하는 소프트웨어.

비디오 분석은 새로운 것은 아닙니다. 2000년 대 초반, 심지어 그 이전부터 이야기해 오고 있습니다. 많은 유행어처럼, 비디오 분석의 가치는 원래의 비전을 따라잡은 다른 기술들의 결과로서 만들어진 후에야 진정으로 실현되고 있습니다.

비디오 분석의 필요성이 증가하고 있는 것은 분명합니다. 더 뛰어난 품질의 더 많은 카메라가 점점 더 다양한 환경에 배치되면서, 필요한 이유 또한 그만큼 증가합니다. 근본적인 수준에서, 이는 한 지점을 가리킵니다: 더 많은 정보를 검토해야 한다. 정말 많은 정보를.

인간만으로는 전세계 감시 카메라가 만들어 내는 비디오의 양을 검토할 수 없습니다. 인간이 가진 고유의 인지 능력은 뛰어나지만, 수백 수천 대의 카메라로 확장할 수는 없습니다. 따라서 기술에 의해 지원되고 강화되어야 합니다. 좋은 일이지요. 컴퓨터는 엄청난 양의 데이터를 실시간으로, 24시간 내내, 피로를 느끼지 않고 처리할 수 있습니다.

하지만, 데이터를 효과적으로 분석하고 유용한 통찰력을 제공할 수 있으려면, 일정 수준의 인지 능력이 필요합니다. 여기에서 가장 크게 유행하는 인공 지능(AI)으로 이어집니다.

컴퓨터가 인간의 지능을 복제할 수 있을까요?

간단한 대답은 “아니오”입니다. 조금 길게 대답하면 “아마도, 하지만 아직 얼마 동안은 아니오”입니다.

현실에서, “인공 지능”은 얼마간 잘못된, 적어도 일반적으로 오해의 소지가 있는 표현입니다. 컴퓨터에 인간 수준의 지능을 인공적으로 창조하고 있다는 의미를 담고 있기 때문입니다. 그러나 사전적 정의를 다시 한 번 생각해 보면, 단순히 “지식과 기술을 습득하고 적용하는 능력”입니다.

이러한 용어를 사용하면, 컴퓨터가 어떻게 인위적으로 지능화되는지 좀 더 쉽게 알 수 있습니다. AI가 비디오 분석에 효과적으로 적용되기 위해 어떤 “지식과 기술”(예를 들어, 아주 기초적인 수준에서, 객체가 사람인지 동물인지 무생물인지 파악하는 능력)이 필요한지를 좀 더 쉽게 평가하기 시작할 수 있습니다.

AI가 헤드라인 주제로 자주 언급되지만, AI의 정의는 AI가 현실화되기 위한 보다 구체적인 요건 즉 컴퓨터의 학습 능력을 지칭합니다.

기계가 학습하도록, 깊이 있게 학습하도록 가르치기

컴퓨터가 학습하도록 훈련시키는 것이 (논리적으로!) 머신 러닝으로 알려져 있습니다.

우리 모두는 머신 러닝에 정기적으로 노출되어 있습니다. 온라인으로 영화와 TV를 구입 또는 시청하는 사람들에게 추천 상품이 제시되는 것은 (시간이 지남에 따라 더 정확하고 유용해질 것으로 기대되는) 머신 러닝을 기반으로 합니다. 우기라 구입했거나 시청했던 것을 기반으로 우리의 선호도에 대해 학습하는 것은 머신 러닝의 한 가지입니다. 그러나 유사한 선택을 하는 수백만의 다른 사람들의 선택과 함께 분석될 때, 그리고 여기에 (소셜미디어 사이트 등을 통해) 인구통계학적 정보가 추가될 때, 머신 러닝은 실로 강력해집니다.

비디오 감시 분야에서, 머신 러닝은 엄청난 잠재력을 가지고 있습니다. 대표적인 AI 전문가 Andrew Ng의 “일반인이 할 수 있는 거의 모든 것을 1초 안에 할 수 있으며, 이제 AI로 자동화할 수 있다”라는 트윗이 이를 보여주고 있습니다. 여기에는 물론 인간(성별, 인종, 나이), 동물, 자동차, 물체를 인식하고 분류하는 것이 포함됩니다.

모든 객체의 특성을 학습하기 위해 컴퓨터를 훈련시키는 과정에서, 비디오 분석은 더욱 강력해집니다. 하지만 어떤 객체가 무엇인지를 이해하는 것과, 이것이 무엇을 그리고 왜 하고 있는지분석하는 것은 전적으로 다른 도전 과제입니다.

비디오 분석은 항상 인간 소프트웨어 개발자의 상상력과 경험 및 기술에 의존해 왔습니다. 또한 모든 가능한 상황에서 가능한 모든 객체를 다루는 코드를 작성하는 것은 불가능합니다..

여기에서 오늘날 AI의 가장 진보된 수준인 딥 러닝으로 이어집니다.

신경 네트워크와 객체 속성

딥 러닝의 중심은 인공 신경 네트워크의 사용입니다. 컴퓨터 프로세싱을 위한 구조로서, 인간의 마음이 작용하는 방식을 좀 더 가깝게 복제합니다. 더 이상 알고리즘에 관한 것이 아니라 컴퓨터가 인식해야 할 상황을 설명하는 훈련 데이터에 관한 것이라는 것을 이해하는 것이 중요합니다. 따라서, 이론적으로 더 이상 제한된 인간적 요소가 없습니다.

아주 간단한 시나리오에서, 머신 러닝이 자동차와 사람이 있다는 것을 알려주는 반면, 딥 러닝은 자동차의 색상과 브랜드를 알려줄 것입니다. 뿐만 아니라, 교통 표지판, 자전거를 타는 사람, 그리고 심지어 핸드백을 들고 있는 사람까지도 인식할 것입니다.

하지만, 배울 자료가 있을 때만 배울 수 있습니다. 컴퓨터도 다르지 않습니다. 신경 네트워크는 컴퓨터가 훈련을 받을 수 있도록 해 주지만, 우리가 진정 컴퓨터가 “세상을 배우도록” 하려면, 필요한 데이터의 양은 정말 어마어마할 것입니다.

 “빅 데이터”가 절제된 표현이었던 이유…

비디오 분석에서 딥 러닝을 하는 데 있어, 해당 데이터를 소싱하는 능력이 매우 어려운 과제입니다. 대개의 경우 비디오 감시 카메라의 영상은 매우 민감하며, 당연하게도 GDPR 같은 국제 데이터 보호 규정 하에 놓여 있습니다. 또한 대용량 데이터 세트를 찾을 수 있더라도, 이를 처리하고 분석하고 학습하는 데 필요한 컴퓨팅 파워는 실로 엄청난 규모여야 할 것입니다.

그러나 만약 역사가 우리에게 무언가 말해준다면, 이러한 도전 과제는 극복될 것입니다. 그리고 AI의 잠재적인 기여자들을 가리키는 다른 일련의 유행어들이 있습니다. 사물인터넷(IoT) 그리고 에지 컴퓨팅입니다.

사물인터넷(IoT)은 데이터 확산의 핵심입니다. 휴대폰에서 냉장고, 산업용 센서에서 가로등, 음성 비서에서 네트워크 비디오 카메라까지, 전세계 연결된 장치의 전체성을 생각한다면, IoT는 매일 매초 엄청난 양의 데이터를 생산합니다. 이러한 데이터의 대부분은 잠재적인 가치를 가지고 있지만, 전송되고 가공되고 처리되고 저장되고 분석되어야 합니다.

가장 일반적인 현재 모델에서는 모든 데이터가 연결된 장치로부터 저장 및 분석을 위해 데이터 센터로 전송되는 것을 볼 수 있습니다. 물론 장치의 모든 데이터가 유용하거나 가치있는 것은 아닙니다. 이러한 데이터의 전송과 저장은 대역폭과 메모리 측면에서 리소스의 심각한 낭비를 유발하며, 에너지 소비 및 비용에 미치는 영향도 함께 발생합니다.

여기에서 에지 컴퓨팅이 나옵니다. 이름에서 알 수 있듯이, 에지 컴퓨팅은 네트워크의 “에지” -좀 더 구체적으로 말한다면 연결된 장치 자체에 더 큰 프로세싱 파워를 부여합니다. 이를 통해 장치 자체(우리의 용어로는 네트워크 비디오 카메라)에서 일정 수준의 데이터 분석이 이루어지고, 그 결과 오로지 의미있고 유용한 데이터 또는 좀 더 분석이 필요한 데이터(예를 들면, 국경 통제 구역에서 여권 확인이 필요한 예외 사항을 알리는 경우)만 전송됩니다. 대역폭 및 저장 공간 요구에 이점이 있는 것은 명백합니다. 운영 효율성 증가는 말할 것도 없습니다.

비디오 분석에 관한 비전

지금까지 여러 유행어에 대한 가닥을 잡기 위해 광범위하게 다루었습니다. 비디오 분석의 미래를 위해서는, 컴퓨터의 파워와 인간 고유의 의사 결정 능력을 학습하고 이해하는 컴퓨터의 향상된 학습 능력을 결합하는 것이 필요합니다. 여러 면에서, “증강 지능”이 “인공 지능”보다 더 적절한 용어입니다. 인간과 컴퓨팅 파워의 지원을 결합하면 큰 성과를 낼 것입니다. AI를 통해 효과적으로 상황을 분석하는 보다 스마트한 카메라가, 적절한 대응과 관련하여 정확하고 신속하며 효과적인 의사 결정을 할 수 있는, 가장 관련 있는 정보를 운영자에게 제공하게 될 것입니다.

가까운 미래에 우리 업계에 영향을 미칠 것으로 Axis가 생각하는 2019 주요 기술 트렌드와, 아래 비디오 분석에 관한 비전에 대해 읽어 보시는 것도 좋겠습니다.

비디오 분석에 관한 비전

 

Albert Unterberger는 Unterberger Consult의 오너입니다. 보안 업계에서 비디오 감시 관련 스페셜리스트로 활동하면서 풍부한 경험을 갖춘 그는, 현재 첨단 비디오 제품 및 솔루션 개발과 버티컬 시장 부분의 제품 포지셔닝 관련 전략 업무를 추진하고 있습니다. 보다 자세한 정보는 다음 웹사이트를 참조하시기 바랍니다. http://www.unterberger-consult.com/aboutme/