Просто о сложном: технология распознавания лиц

Просто о распознавании лиц

Боевики и научно-фантастические фильмы наполнены сценами с использованием распознавания лиц, например, для охраны секретных объектов. Но технология применяется и в повседневной жизни в различных отраслях — обеспечении комфорта и безопасности путешественников или организации пограничного контроля, а некоторые из нас сталкиваются с ней ежедневно (функция Face ID в IPhone).

​​​​​​​В этом материале мы рассмотрим и объясним простыми словами десять самых популярных терминов, связанных с технологией распознавания лиц.

#1 Электронный паспорт

На 2019 год зарегистрировано более одного миллиарда биометрических паспортов. В отличие от обычных документов, в этих паспортах вся информация о владельце — имя, фотография, дата рождения, номер паспорта и другие данные — хранится на специальном бесконтактном чипе в электронном виде. Именно благодаря наличию микропроцессора такой паспорт называется электронным или ePassport.

Технология не только повышает уровень безопасности в пограничных зонах, но и упрощает прохождение контроля: в автоматических воротах установлен считыватель, который передает сотрудникам ваши данные, фото и информацию о документе. Сотрудники службы безопасности в считанные секунды проверяют подлинность паспорта и то, являетесь ли вы его законным владельцем.

Все данные биометрического паспорта представляются в стандартизированном формате, определенном Международной организацией гражданской авиации (International Civil Aviation Organization, ICAO). Общепринятая спецификация ICAO 9303 не определяет точный размер для фотографии лица, но описывает объем файла — от 15 до 20 Кбайт.

# 2 Автоматизированный пограничный контроль (АПК) с распознаванием лиц

Мы уже писали, что биометрический паспорт удобен в том числе и для прохождения пограничного контроля. Но как работает сам АПК с распознаванием лиц?

Считыватель в воротах автоматизированного пограничного контроля захватывает изображение вашего лица, сканирует, а затем сравнивает с фотографией в паспорте, хранящейся на чипе. Так любые физические дефекты на странице паспорта, например, царапины или выцветание бумаги, не помешают системе правильно распознать вашу личность. Кроме того, после автоматического анализа сотрудники службы безопасности могут удостовериться в том, что документ не был изменен или оформлен мошенниками на пустом бланке.

#3 Системы распознавания лиц

Системы распознавания лиц используются для электронной идентификации людей. Камеры системы безопасности сканируют и распознают лица с большего расстояния, чем другие решения. Например, камерам в воротах пограничного контроля или специализированных терминалах требуется расстояние не более 1 или 2 метров, иначе они не смогут захватить лицо человека.

Чем больше расстояние от объекта до сканера, тем более продвинутое решение нужно для качественной электронной идентификации. Если камера находится далеко, то системе придется искать лица людей, отделять их от толпы, наклонять, растягивать и искажать изображения, чтобы выделить черты лица и выровнять их для точного измерения.

Современные системы с технологией распознавания лиц работают с большого расстояния и даже в толпе могут быстро вычислить нужного человека.

#4 Отпечаток лица вместо фотографии

Из захваченной фотографии система распознавания лиц генерирует уникальный отпечаток лица в виде оцифрованного набора данных: расстояние между глазами, длина линии подбородка, ширина носа и т. д. Система проверяет от 75 до 85 точек на лице, чтобы построить отпечаток или «паттерн», который используется для поиска совпадений в базе биометрических данных.

Отпечаток лица, в отличие от простой фотографии, обеспечивает большую безопасность и конфиденциальность, поскольку отображает черты лица человека в виде математической модели. Подделать цифровой образ практически невозможно.

Биометрическая система распознавания работает в двух режимах: верификация и идентификация.

Верификация — определение соответствия документа и человека. Например, на пограничном контроле. Вы предъявляете свой паспорт, а система сравнивает изображение в документе с вашим лицом и выясняет, ваш ли этот документ. Система проверяет только один биометрический профиль, поэтому проверка называется «один к одному» или соответствие 1:1.
Идентификация — определение личности человека. Система сравнивает ваше лицо со всеми изображениями в базе данных и находит совпадения, чтобы выявить вашу личность, поэтому проверка называется "один ко многим" или соответствие 1:N.

#5 Скорость распознавания лиц

Могут ли системы с технологией распознавания лиц быть неточными?

Система распознавания лиц, как и любая технология, имеет погрешности. Сложность заключается в преобразовании биологических характеристик (отпечатков пальцев, черт лица) в цифровые данные (математическую модель), на этом этапе любое движение человека, даже самое минимальное, может привести к неверной идентификации информации.

Точность работы системы измеряется скоростью распознавания (RR, Recognition Rate) — это общее количество правильно идентифицированных изображений лиц людей, поделенное на общее количество тестовых изображений. Например, 9 лиц из 10 распознаются вашей системой — ваш RR равен 90%.

​​​​​​​Точность системы связана с алгоритмом. Он обнаруживает лицо и сравнивает его с определённым набором данных, который содержит множество изображений одного и того же человека или большое количество изображений разных людей. Производительность алгоритма связаны с тем, какое количество данных задействуется при его обучении, для получения точных результатов вы должны обучать алгоритм на тысячах разных изображений.

Часть 2

Продолжаем знакомиться с технологией распознавания лиц. Во второй части материала мы просто и понятно объясним еще пять понятий, связанных с использованием этого решения.

Технология распознавания лиц

 

True Positive, True Negative, False Positive и False Negative

В предыдущем материале мы говорили о режимах работы биометрических платформ распознавания лиц: верификации и идентификации. Для точного результата систему предварительно обучают, а для оценки качества работы алгоритмов используют специальные метрики:

  • True Positive. Положительный результат, который мы ожидали получить: лицо находилось в базе данных, и система распознала его.
  • True Negative. Отрицательный результат, который мы ожидали получить: лицо не было занесено в базу данных, система не распознала его и сообщила о неизвестном посетителе.
  • False Positive. Положительный результат, который оказался ошибочным: система распознала лицо чужого человека, ошибочно приняв его за другое лицо, находящееся в базе данных, и открыла доступ.
  • False Negative. Отрицательный результат, который оказался ошибочным: система не распознала лицо, хотя должна была это сделать, и определила действия человека как попытку несанкционированного проникновения на объект.

 

Показатели False Rejection Rate и False Acceptance Rate

Для оценки эффективности работы алгоритма используют еще одни значения — процентное соотношение количества ошибок, то есть количество неверно распознанных лиц при прохождении посетителями процедуры допуска.

Учитывают два вида ошибок:

  1. False Rejection Rate (FRR) — ошибка первого рода, процент вероятности определения системой «своего» за «чужого» или количество отказов в допуске авторизованным лицам, имеющим право доступа. Можно сказать, это процент возникновения результата False Negative, о котором мы говорили в предыдущем абзаце. Например, показатель 1:1000 означает, что только одному человеку из 1000 авторизованных пользователей будет ошибочно отказано в доступе.
  2. False Acceptance Rate (FAR) — ошибка второго рода, процент вероятности принятия «чужого» за «своего» или количество ошибочных допусков системой неавторизованных лиц, то есть результата False Positive из абзаца выше. Например, показатель 1:100 000 указывает на то, что из 100 000 неавторизованных посетителей система ошибочно пропустит только одного человека.

 

Оба показателя важны для оценки работы алгоритма, высокий процент ошибок говорит о неэффективности системы: на контрольно-пропускном пункте для пассажиров слишком частое возникновение False Rejection приведет к образованию заторов, система помешает пройти путешественникам с законным правом доступа и создаст лишние проблемы, а при регулярном возникновении False Accept в самолет или на территорию другой страны может проникнуть злоумышленник.

Технология распознавания лиц

 

Референсное изображение лица

Референсные изображения — это примеры лиц, на которых система будет обучаться, или изображения в базе данных, с которыми будет сравнивать захваченное лицо.

В обоих случаях от референсного изображения лица зависит точность распознавания. При выборе примера важны факторы:

  • качество изображения лица — четкость картинки, достаточное разрешение и отсутствие дефектов,
  • ракурс фотографии,
  • освещение — равномерное и естественное, без резких перепадов света и тени,
  • хорошо различимое лицо — без очков, головных уборов, крупных украшений и других деталей, которые могут помешать системе распознать лицо.

 

Важно и количество референсных изображений. Чем больше качественных примеров получит система во время обучения, тем точнее будет ее алгоритм. При использовании технологии распознавания лиц «в поле» несколько изображений одного человека, снятых с разных точек, помогут быстрее и точнее идентифицировать посетителя, кроме того, играет роль и расположение камеры — ее нужно установить под таким углом, чтобы захваченное лицо было хорошо видно.

Искусственный интеллект

Понятие «искусственный интеллект» объединяет несколько определений:

  • направление науки, занимающееся разработкой компьютерных программ и систем, способных выполнять интеллектуальные функции, присущие человеку,
  • искусственно созданный человеком набор алгоритмов, способных работать по аналогии с мозгом человека — принимать интеллектуальные решения, отвечать на вопросы, выполнять творческие задачи.

 

Искусственный интеллект создан для воспроизведения действий человеческого мозга с помощью компьютерных расчетов, он помогает машинам обрабатывать информацию и принимать решения, аналогичные человеческим. Распознавание лиц тоже относится к области искусственного интеллекта.

Искусственный интеллект используется во многих отраслях, с его помощью автоматизируют рутинные операции и процессы — сбор данных для исследований, обслуживание клиентов, сортировка товаров, круглосуточная охрана территорий и объектов.

Глубокое обучение (Deep Learning)

Для правильной работы искусственного интеллекта, в том числе технологии распознавания лиц, нужен алгоритм. Глубокое обучение — один из методов машинного обучения, основанный на принципе многослойности.

Вместо запоминания конкретного алгоритма для определенной задачи система получает комплекс данных для анализа, результаты которого учитываются при следующем анализе. Результаты каждого анализа наслаиваются, в итоге система получает набор данных, достаточных для построения собственного алгоритма для решения любой задачи.

Системы, обученные по этому принципу, не только быстро и точно выполняют свои задачи, но и могут самостоятельно принять решение в нестандартной ситуации.

По прогнозам экспертов, в ближайшие пять лет область применения технологии распознавания лиц расширится. Для посадки на самолет, снятия денег со счета, покупки машины и других действий не понадобятся документы — достаточно будет просто показать лицо.

Информация и фото с DSSL.ru