Современное состояние видеоаналитики: 2013 год

Что такое видеоаналитика?

Для начала определимся, что будем понимать под видеоаналитикой. Во-первых, это инструмент, выделяющий из кадра или потока кадров специализированную информацию с применением дополнительных математических алгоритмов. А во-вторых, это инструмент, помогающий качественнее и быстрее управлять видеоданными как в режиме онлайн, так и при операциях с архивами.

Безусловная и несомненная задача видеоаналитики – распознавание номеров транспортных средств. Данная технология известна уже два десятка лет и используется повсеместно, однако при этом не становится более доступной. Однозначно она подпадает под оба определения: имеет математический аппарат поиска номера ТС (транспортное средство), OCR (распознавание символов) для его распознавания, а также, несомненно, помогает быстрее и качественнее оперировать данными. Для примера попробуйте сами распознать и записать номера в потоке проезжающих мимо машин со скоростью хотя бы 60 км/ч. Точно так же выглядит и эффективность распознавания при работе в архиве: всем понятно, что попытка просто найти в записи вчера проезжавший автомобиль с определенным номером будет стоить вам более 12 часов рабочего времени, тогда как поиск по базе распознанных номеров – секунды. Каково же современное состояние распознавания номеров и какие у него перспективы?

Несколько десятков разработчиков в мире предлагают эффективные инструменты (написать распознаватель номеров с вероятностью 50% может студент за 6 месяцев, однако по мере приближения к 99% стоимость и время разработки, а значит инвестиции, резко возрастают). В России есть несколько собственных разработчиков, вполне успешных и на международном рынке. Несмотря на постоянные инвестиции и множество компаний, вероятность распознавания даже "мытых по ГОСТу" номеров в потоке ТС никогда не равна 100% и колеблется в пределах 96–99%. Это в полной мере ощущают сейчас десятки сотрудников центров обработки данных ГИБДД, занимающихся верификацией и корректировкой данных распознавателей.

Безусловная и несомненная задача видеоаналитики – распознавание номеров транспортных средств. Данная технология известна уже два десятка лет и используется повсеместно, однако при этом не становится более доступной. Однозначно она подпадает под оба определения: имеет математический аппарат поиска номера ТС (транспортное средство), OCR (распознавание символов) для его распознавания, а также, несомненно, помогает быстрее и качественнее оперировать данными

При этом особенностью LPR (License Plate Recognition – распознавание лицензионных номерных пластин, также встречается термин ANPR – Automatic Number Plate Recognition) является необходимость распознавания довольно большого ассортимента шаблонов номерных пластин (только российские имеют около двух десятков разновидностей). Распознавание шаблонов одновременно нескольких стран, включая разные типы шаблонов и разные шрифты, гарантированно приводит к снижению вероятности распознавания – иногда до 80% и ниже.

Что еще служит критерием качества систем распознавания номеров ТС? Немаловажное значение имеет то, как программное обеспечение умеет управляться с данными, получаемыми от распознавателя. Как в режиме онлайн, так и при обработке записанных данных система (а собственно тогда она и будет называться системой) должна иметь массу опций, помогающих ими оперировать и выуживать необходимую информацию. К таким опциям относятся как уже встроенные интерфейсы и возможности, так и скрипты – несложная среда для программирования системы на выполнение нужных частных задач. Ведь часто экономически не оправдано привлечение разработчиков вендора, да и делиться ноу-хау многие боятся, поэтому такое программирование на месте позволяет недорого оптимизировать свои бизнес-процессы. Примеры: ручная или автоматическая генерация отчетов на базе данных как одной, так и нескольких видеокамер; интеграция различного весового и счетно-учетного оборудования; выполнение специфических условий и многое другое.

Трекинг

В качестве противовеса легко монетизируемому и прозрачному распознаванию номеров приведем пример видеоаналитики в виде трекинга (Tracking – отслеживание, в данном случае движения в поле зрения камеры). Почему это можно отнести к видеоаналитике? Прежде всего потому, что это не просто анализ активности в определенной области поля зрения (кадра). Трекинг обязан раскрыть простую вещь – от кадра к кадру. В идеале от момента появления объекта в кадре и до его реального выхода трекинг четко дает понять нам, что это один и тот же объект. Это значит, что при смещении активности такой аналитический детектор по разным критериям с высокой вероятностью говорит, что это "тот" или "не тот" объект.

В норме в поле зрения находится много объектов, отрабатываются их пересечения, и мы можем задавать определенные параметры для фильтрации в реальном времени нужных нам типов движения. Например, нас может интересовать движение слева направо, пересечение зон и линий определенными типами объектов (размеры, скорость и т.п.). Трекинг может использоваться как просто – для выбора нужного типа движения и задания по нему реакций, так и более сложно, например для автоматического управления скоростными поворотными камерами. Системы на основании данных трекинга, получаемых от обзорных камер, передают на камеры Speed Dome координаты и размеры объектов, а те с помощью оптического увеличения дают нам их детальные "портреты".

Скорость и качество PTZ-камер за последние годы значительно выросли, и они способны "эмулировать" межкадровое сжатие, записывая фактически только нужное движение – реальные объекты с важными параметрами. Стоимость подобных систем высока, однако она не превышает стоимости покрытия аналогичных территорий мегапиксельными камерами с аналогичным разрешением "пикселей на метр".

В онлайн-аналитике все понятно: объекты есть, параметры доступны – можем реагировать. Однако что делать с архивом? Напрашивается прямой ответ: записывать все параметры всех движений в архив вместе с видео. И здесь трекинг тоже имеет преимущество перед обычной картой активности, так как, во-первых, имеет больше параметров для фильтрации, а во-вторых, более эффективен с точки зрения хранения (записывается векторная информация – занимает меньше места).

Так, собственно, зачем это нужно? Тут на первое место выступает характеристика "быстрее и качественнее управлять данными". Визуальный поиск в архиве, когда вы выделяете нужный участок изображения, задаете параметры поиска (направление, скорость, размеры объектов) и за секунды вместо часов просмотра архива находите нужные данные, – это прямая монетизация, выражаемая в экономии времени оператора, администратора, службы безопасности и спокойно высчитываемая в "человеко-часах".

Вы можете сделать замечание, что для анализа видео со все более распространяющихся IP-видеокамер необходимо декодировать сигнал, что сильно снижает количество обрабатываемых каналов. Однако здесь есть два момента. Первый – можно декодировать "второй" поток более низкого разрешения (обычно 640х480 или 320х240) – этого в большинстве случаев достаточно даже для трекинга. Второй – на рынке все больше камер со встроенной аналитикой, использование которой вовсе убирает нагрузку на видеорегистраторы.

Распознавание лиц

Существует еще один вид хорошо знакомой вам аналитики. Это распознавание лиц. В принципе для работы в составе системы видеонаблюдения этот вид аналитики можно разделить на детектирование лиц и собственно системы распознавания.


Оба способа, как и распознавание номеров ТС, будут работать только в специальных, практически тепличных условиях. Мало того, если номера ТС подвержены стандартам как по шаблону, так и по месту расположения и даже "ограждены" законами и штрафами от загрязнения и попыток саботажа (отражающие краски, сетки и т.д.), то наши лица мало того что ГОСТами не описаны, так еще и никто не имеет права нам запретить различные модификации своей внешности (в пределах разумного, конечно). Если не описано регламентом или не обеспечено специальными техническими средствами типа рампы с несколькими камерами и грозного окрика смотреть в камеру, то любые шаги в сторону, а точнее отвороты от камеры, снижают вероятность распознавания катастрофически. В таком случае есть только два способа реального применения распознавания лиц. Первый – чисто профилактический: заявите и продемонстрируйте эффективность системы, пиарьте и постоянно напоминайте гражданам о неусыпном контроле. Создание эффекта бдительного ока действительно, хоть и немного, снижает уровень преступности, а населению добавляет доверия к властям и увеличивает уверенность в безопасности. Конечно, речь идет о малых процентах или даже долях процентов (как в снижении преступности, так и в уверенности граждан), но и тратится на это в принципе не так уж много.

Второй способ – жесткие организационные меры: подходят для предприятий с пропускным режимом, вполне могут быть использованы и в системах общественной безопасности в отдельных случаях. Фактически вас так или иначе должны заставить смотреть в камеру как нужно и так долго, как того требует качество распознавания. Интеграция со СКУД добавит синергетический эффект.

Главная же проблема всего этого – катастрофически высокая цена. Разработчиков, дающих приемлемое качество, в мире единицы, с другими эффективность настолько низка, что не стоит применения. В общем, здесь можно быть настроенным весьма скептически.

Детектирование лиц без распознавания зачастую является вовсе бесплатным. Как и трекинг, детектор лиц поможет вам быстрее найти информацию в архиве. Но требования к установке камер должны соблюдаться в неменьшей степени, чем с распознаванием. А значит, даже если не брать в расчет нагрузку на процессоры для поиска лиц, ограничения по применению фактически такие же: специально установленные камеры и организационные меры по "принуждению" людей к соблюдению условий распознавания.

В данной статье мы поверхностно рассмотрели три наиболее распространенных вида аналитики. Однако это не все. В следующий раз уделим внимание детекторам саботажа, огня и дыма и некоторым другим специфичным способам извлечения информации из видео.

Источник: Secuteck