Технология распознавания лиц всегда была концепцией, которая жила в вымышленных мирах, будь то инструмент для раскрытия преступления или открытия дверей. Сегодня наши технологии в этой области значительно развиваются, поскольку мы видим, что они становятся все более распространенными в нашей повседневной жизни. В рамках миссии по созданию действительно цифровой системы доверия мы в Signzy используем технологию распознавания лиц для идентификации и аутентификации людей. Технология способна выполнить эту задачу в три этапа: обнаружение лица, извлечение признаков из цели и, наконец, сопоставление и проверка. Подобно инструменту визуального поиска, эта технология способна определять ключевые факторы на данном изображении лица.

Чтобы стать пионером нашей технологии распознавания лиц, мы хотели получить преимущество над текущими моделями распознавания лиц, основанными на глубоком обучении. Наша идея заключалась в том, чтобы встроить знания, созданные людьми, в современные архитектуры CNN, чтобы повысить их точность. Для этого нам нужно было провести обширный обзор лучших дескрипторов черт лица. В этом блоге мы поделились частью нашего исследования, в котором описаны некоторые функции.

Локальные бинарные шаблоны

LBP смотрит на точки, окружающие центральную точку, и проверяет, являются ли окружающие точки больше или меньше центральной точки (т. Е. Дает двоичный результат). Это один из основных и простых дескрипторов функции.

Вейвлеты Габора

Это линейные фильтры, используемые для текстурного анализа, что означает, что он в основном анализирует, есть ли какое-либо конкретное частотное содержимое в изображении в определенных направлениях в локализованной области вокруг точки или области анализа.

Сходства самолетов Gabor

Это набор (комплексных) ответов всех вейвлетов Габора семейства в определенной точке изображения. Джет Габора - это локальный дескриптор текстуры, который можно использовать для различных приложений. Одно из этих приложений - найти текстуру на заданном изображении. Например, можно определить положение глаза путем сканирования всего изображения. В каждой позиции на изображении сходство между эталонной струей Габора и струей Габора в этом месте вычисляется с использованием bob.ip.gabor.Similarity.

Квантование локальной фазы

Метод локального фазового квантования (LPQ) основан на свойстве инвариантности размытия фазового спектра Фурье. Он использует информацию о локальной фазе, извлеченную с помощью двумерного ДПФ или, точнее, краткосрочного преобразования Фурье (STFT), вычисленного по прямоугольной окрестности M-by-M в каждой позиции x пикселя изображения f (x), определенного к:

где Wu - базисный вектор двумерного дискретного преобразования Фурье (ДПФ) на частоте u, а fx - другой вектор, содержащий все M2 выборки изображения из Nx.

Разница гауссиан

Это особый алгоритм улучшения, который включает вычитание одной размытой версии исходного изображения из другой, менее размытой версии оригинала. В простом случае изображений в градациях серого размытые изображения получаются путем свертки исходных изображений в градациях серого с ядрами Гаусса, имеющими различные стандартные отклонения. Размытие изображения с использованием гауссовского ядра подавляет только высокочастотную пространственную информацию. Вычитание одного изображения из другого сохраняет пространственную информацию, которая находится между диапазоном частот, которые сохраняются в двух размытых изображениях. Таким образом, разница в гауссианах - это полосовой фильтр, который отбрасывает все пространственные частоты, кроме нескольких, которые присутствуют в исходном изображении в градациях серого. Ниже приведены несколько примеров с изменяющейся сигмой (стандартным отклонением) ядра Гаусса с обнаруженными каплями.

Гистограмма градиентов

Методика подсчитывает появление градиентной ориентации в локализованных частях изображения. Идея, лежащая в основе HOG, заключается в том, что внешний вид и форма локального объекта на изображении могут быть описаны распределением градиентов интенсивности или направлениями краев. Изображение делится на небольшие соединенные области, называемые ячейками, и для пикселей в каждой ячейке составляется гистограмма направлений градиента. Дескриптор - это объединение этих гистограмм.

БПФ

Преобразование Фурье используется для анализа частотных характеристик различных фильтров. Для изображений используется двумерное дискретное преобразование Фурье (ДПФ) для нахождения частотной области. Для синусоидального сигнала

мы можем сказать, что f - это частота сигнала, и если взять его частотную область, мы можем увидеть пик на f. Если сигнал дискретизируется для формирования дискретного сигнала, мы получаем ту же частотную область, но периодичен в диапазоне

or

(or

для N-точечного ДПФ).

Вы можете рассматривать изображение как сигнал, который дискретизируется в двух направлениях. Таким образом, преобразование Фурье в направлениях X и Y дает вам частотное представление изображения.

Возможности BLOB-объектов

Эти методы нацелены на обнаружение областей в цифровом изображении, которые отличаются по свойствам, таким как яркость или цвет, по сравнению с окружающими областями. Неформально, капля - это область изображения, в которой некоторые свойства постоянны или приблизительно постоянны; все точки в большом двоичном объекте можно в некотором смысле считать похожими друг на друга.

Возможности CenSurE

Этот функциональный детектор представляет собой масштабно-инвариантный детектор центрального окружения (CENSURE), который утверждает, что превосходит другие детекторы и дает результат в реальном времени.

Возможности ORB

Это очень быстрый двоичный дескриптор, основанный на BRIEF, который инвариантен к вращению и устойчив к шуму.

Длиб - 68 ключевых точек лица

Это один из наиболее широко используемых дескрипторов черт лица. Детектор лицевых ориентиров, включенный в библиотеку dlib, является реализацией статьи Выравнивание лица за одну миллисекунду с ансамблем деревьев регрессии Каземи и Салливана (2014). Этот метод начинается с использования:

  1. Обучающий набор помеченных лицевых ориентиров на изображении. Эти изображения помечаются вручную с указанием конкретных (x, y) -координат областей, окружающих каждую структуру лица.
  2. Приоры, а точнее вероятность расстояния между парами входных пикселей.

Учитывая эти обучающие данные, ансамбль деревьев регрессии обучается оценивать положения лицевых ориентиров непосредственно из самих яркостей пикселей (т. Е. «Извлечения признаков» не происходит). Конечным результатом является детектор лицевых ориентиров, который можно использовать для определения лицевых ориентиров в режиме реального времени с высококачественными прогнозами.

Код: https://www.pyimagesearch.com/2017/04/17/real-time-facial-landmark-detection-opencv-python-dlib/

Заключение

Таким образом, в этом блоге мы компилируем различные черты лица вместе с фрагментом кода. Разные алгоритмы объясняют разные черты лица. Выбор дескриптора, который дает высокую производительность, действительно основан на имеющемся наборе данных. Размер набора данных, разнообразие, разреженность и сложность играют решающую роль при выборе алгоритма. Эти элементы, созданные человеком, при подаче в сверточные сети повышают их точность.

Спасибо,

А.Б. Сараванан

Руководитель AI, Signzy

Станьте частью нашего удивительного путешествия

Вы верите, что современным миром движут биты и байты? И думаете, что сможете с этим справиться? Мы ищем вас. Напишите нам на [email protected].

О Сигнзи

Signzy помогает финансовым учреждениям преобразовывать текущие полуавтоматические процессы в цифровые системы реального времени с использованием искусственного интеллекта. Это включает в себя Video KYC для бортовых пользователей полностью в цифровом виде. Это гарантирует, что новые процессы будут удобными для пользователя, но при этом безопасными и совместимыми.

Посетите www.signzy.com для получения дополнительной информации.

Вы можете связаться с нашей командой по адресу [email protected].

Связаться с нами

Арпит Ратан, BFSI Sales

Электронная почта: [email protected]

Ашишкумар, Цифровые продажи

Электронная почта: [email protected]