Поиск по сетчатке глаза
Первые сканеры сетчатки появились ещё в 80-х годах прошлого столетия. Они получили широкое распространение в системах контроля доступа на особо секретные объекты, так как у них один из самых низких процентов отказа в доступе зарегистрированных пользователей и практически не бывает ошибочного разрешения доступа, но, несмотря на это, сканеры сетчатки не получили широкого распространения в массы из-за дороговизны и сложности оптической системы сканирования. И до недавнего времени всё так и оставалось, хотя алгоритмы продолжали развиваться.
На сегодняшний день технология 3d печати позволила сильно удешевить сканеры сетчатки глаза. Эндрю Баставрус вместе со своей командой напечатали на 3d принтере насадку для смартфона, которая позволяет наблюдать сетчатку через камеру телефона.
Данная статья посвящена описанию алгоритмов сопоставления признаков сетчатки глаза и является продолжением статьи о сегментации кровеносных сосудов.
Обзор методов биометрической идентификации/аутентификации приведён здесь.
Одной из наиболее важных проблем при использовании сетчатки глаза для распознавания личности является движение головы или глаза во время сканирования. Из-за этих движений может возникнуть смещение, вращение и масштабирование относительно образца из базы данных (рис. 1).
Рис. 1. Результат движения головы и глаза при сканировании сетчатки.
Влияние изменения масштаба на сравнение сетчаток не так критично, как влияние других параметров, поскольку положение головы и глаза более или менее зафиксировано по оси, соответствующей масштабу. В случае, когда масштабирование всё же есть, оно столь мало, что не оказывает практически никакого влияния на сравнение сетчаток. Таким образом, основным требованием к алгоритму является устойчивость к вращению и смещению сетчатки.
Алгоритмы аутентификации по сетчатке глаза можно разделить на два типа: те, которые для извлечения признаков используют алгоритмы сегментации (алгоритм, основанный на методе фазовой корреляции; алгоритм, основанный на поиске точек разветвления) и те, которые извлекают признаки непосредственно с изображения сетчатки (алгоритм, использующий углы Харриса).
1. Алгоритм, основанный на методе фазовой корреляции
Суть алгоритма заключается в том, что при помощи метода фазовой корреляции оцениваются смещение и вращение одного изображения относительно другого. После чего изображения выравниваются и вычисляется показатель их схожести.
В реализации метод фазовой корреляции работает с бинарными изображениями, однако может применяться и для изображений в 8-битном цветовом пространстве.
Пусть и – изображения, одно из которых сдвинуто на относительно другого, а и – их преобразования Фурье, тогда:
где – кросс-спектр;
– комплексно сопряженное
Вычисляя обратное преобразование Фурье кросс-спектра, получим импульс-функцию:
Найдя максимум этой функции, найдём искомое смещение.
Теперь найдём угол вращения при наличии смещения , используя полярные координаты:
Далее применяется метод фазовой корреляции, как в предыдущем случае. Можно отметить, что такая модификация фазовой корреляции позволяет найти и масштаб по параметру
Данная техника не всегда показывает хорошие результаты на практике из-за наличия небольших шумов и того, что часть сосудов может присутствовать на одном изображении и отсутствовать на другом. Чтобы это устранить применяется несколько итераций данного алгоритма, в том числе меняется порядок подачи изображений в функцию и порядок устранения смещения и вращения. На каждой итерации изображения выравниваются, после чего вычисляется их показатель схожести, затем находится максимальный показатель схожести, который и будет конечным результатом сравнения.
Показатель схожести вычисляется следующим образом:
2. Алгоритм, использующий углы Харриса
Данный алгоритм, в отличие от предыдущего, не требует сегментации сосудов, поскольку может определять признаки не только на бинарном изображении.
В начале изображения выравниваются при помощи метода фазовой корреляции, описанного в предыдущем разделе. Затем на изображениях ищутся углы Харриса (рис. 2).
Рис. 2. Результат поиска углов Харриса на изображениях сетчатки.
Пусть найдена M+1 точка, тогда для каждой j-й точки её декартовы координаты преобразуются в полярные и определяется вектор признаков где
Модель подобия между неизвестным вектором и вектором признаков размера N в точке j определяется следующим образом:
где – константа, которая определяется ещё до поиска углов Харриса.
Функция описывает близость и похожесть вектора ко всем признакам точки j.
Пусть вектор – вектор признаков первого изображения, где размера K–1, а вектор – вектор признаков второго изображения, где размера J–1, тогда показатель схожести этих изображений вычисляется следующим образом:
Нормировочный коэффициент для similarity равняется
Коэффициент в оригинальной статье предлагается определять по следующему критерию: если разница между гистограммами изображений меньше заранее заданного значения, то = 0.25, в противном случае = 1.
3. Алгоритм, основанный на поиске точек разветвления
Данный алгоритм, как и предыдущий, ищет точки разветвления у системы кровеносных сосудов. При этом он более специализирован на поиске точек бифуркации и пересечения (рис. 3) и намного более устойчив к шумам, однако может работать только на бинарных изображениях.
Рис. 3. Типы признаков (слева – точка бифуркации, справа – точка пересечения).
Для поиска точек, как на рис. 3, сегментированные сосуды сжимаются до толщины одного пикселя. Таким образом, можно классифицировать каждую точку сосудов по количеству соседей S:
- если S = 1, то это конечная точка;
- если S = 2, то это внутренняя точка;
- если S = 3, то это точка бифуркации;
- если S = 4, то это точка пересечения.
3.1. Алгоритм сжатия сосудов до толщины одного пикселя и классификация точек разветвления
Вначале выполняется поиск пикселя, являющегося частью сосуда, сверху вниз слева направо. Предполагается, что каждый пиксель сосуда может иметь не более двух соседних пикселей сосудов (предыдущий и следующий), во избежание двусмысленности в последующих вычислениях.
Далее анализируются 4 соседних пикселя найденной точки, которые ещё не были рассмотрены. Это приводит к 16 возможным конфигурациям (рис. 4). Если пиксель в середине окна не имеет соседей серого цвета, как показано на рис. 4 (a), то он отбрасывается и ищется другой пиксель кровеносных сосудов. В других случаях это либо конечная точка, либо внутренняя (не включая точки бифуркации и пересечения).
Рис. 4. 16 возможных конфигураций четырёх соседних пикселей (белые точки – фон, серые – сосуды). 3 верхних пикселя и один слева уже были проанализированы, поэтому игнорируются. Серые пиксели с крестиком внутри также игнорируются. Точки со стрелочкой внутри – точки, которые могут стать следующим центральным пикселем. Пиксели с чёрной точкой внутри – это конечные точки.
На каждом шаге сосед серого цвета последнего пикселя помечается как пройденный и выбирается следующим центральным пикселем в окошке 3 x 3. Выбор такого соседа определяется следующим критерием: наилучший сосед тот, у которого наибольшее количество непомеченных серых соседей. Такая эвристика обусловлена идеей поддержания однопиксельной толщины в середине сосуда, где большее число соседей серого цвета.
Из вышеизложенного алгоритма следует, что он приводит к разъединению сосудов. Также сосуды могут разъединиться ещё на этапе сегментации. Поэтому необходимо соединить их обратно.
Для восстановления связи между двумя близлежащими конечными точками определяются углы и как на рис. 5, и если они меньше заранее заданного угла то конечные точки объединяются.
Рис. 5. Объединение конечных точек после сжатия.
Чтобы восстановить точки бифуркации и пересечения (рис. 6) для каждой конечной точки вычисляется её направление, после чего производится расширение сегмента фиксированной длины Если это расширение пересекается с другим сегментом, то найдена точка бифуркации либо пересечения.
Рис. 6. Восстановление точки бифуркации.
Точка пересечения представляет собой две точки бифуркации, поэтому для упрощения задачи можно искать только точки бифуркации. Чтобы удалить ложные выбросы, вызванные точками пересечения, можно отбрасывать точки, которые находится слишком близко к другой найденной точке.
Для нахождения точек пересечения необходим дополнительный анализ (рис. 7).
Рис. 7. Классификация точек разветвления по количеству пересечений сосудов с окружностью. (a) Точка бифуркации. (b) Точка пересечения.
Как видно на рис. 7 (b), в зависимости от длины радиуса окружность с центром в точке разветвления может пересекаться с кровеносными сосудами либо в трех, либо в четырёх точках. Поэтому точка разветвления может быть не правильно классифицирована. Чтобы избавиться от этой проблемы используется система голосования, изображённая на рис. 8.
Рис. 8. Схема классификации точек бифуркации и пересечения.
В этой системе голосования точка разветвления классифицируется для трёх различных радиусов по количеству пересечений окружности с кровеносными сосудами. Радиусы определяются как: где и принимают фиксированные значения. При этом вычисляются два значения и означающие количество голосов за то, чтобы точка была классифицирована как точка пересечения и как точка бифуркации соответственно:
где и – бинарные значения, указывающие идентифицирована ли точка с использованием радиуса как точка пересечения либо как точка бифуркации соответственно.
В случае если то тип точки не определён. Если же значение отличаются друг от друга, то при точка классифицируется как точка пересечения, в противном случае как точка бифуркации.
3.2. Поиск преобразования подобия и определение метрики схожести
После того, как точки найдены, необходимо найти преобразование подобия. Это преобразование описывается 4 параметрами – смещение по оси и , масштаб и вращение соответственно.
Само преобразование определяется как:
где – координаты точки на первом изображении
– на втором изображении
Для нахождения преобразования подобия используются пары контрольных точек. Например, точки определяют вектор где – координаты начала вектора, – длина вектора и – направление вектора. Таким же образом определяется вектор для точек Пример представлен на рис. 9.
Рис. 9. Пример двух пар контрольных точек.
Параметры преобразования подобия находятся из следующих равенств:
Пусть количество найденных точек на первом изображения равняется M, а на втором N, тогда количество пар контрольных точек на первом изображении равно а на втором Таким образом, получаем возможных преобразований, среди которых верным выбирается то, при котором количество совпавших точек наибольшее.
Поскольку значение параметра S близко к единице, то T можно уменьшить, отбрасывая пары точек, неудовлетворяющие следующему неравенству:
где – это минимальный порог для параметра
– это максимальный порог для параметра
– пара контрольных точек из
– пара контрольных точек из
После применения одного из возможных вариантов выравнивания для точек и вычисляется показатель схожести:
где – пороговая максимальная дистанция между точками.
В случае если то
В некоторых случаях обе точки могут иметь хорошее значение похожести с точкой . Это случается, когда и находятся близко друг к другу. Для определения наиболее подходящей пары вычисляется вероятность схожести:
где
Если то
Чтобы найти количество совпавших точек строится матрица Q размера M x N так, что в i-й строке и j-м столбце содержится
Затем в матрице Q ищется максимальный ненулевой элемент. Пусть этот элемент содержится в -й строке и -м столбце, тогда точки и определяются как совпавшие, а -я строка и -й столбец обнуляются. После чего опять ищется максимальный элемент. Поиск таких максимумов повторяется до тех пор, пока все элементы матрицы Q не обнулятся. На выходе алгоритма получаем количество совпавших точек C.
Метрику схожести двух сетчаток можно определить несколькими способами:
где – параметр, который вводится для настройки влияния количества совпавших точек;
f выбирается одним из следующих вариантов:
Метрика нормализуется одним из двух способов:
где и – некоторые константы.
3.3. Дополнительные усложнения алгоритма
Метод, основанный на поиске точек разветвления, можно усложнить, добавляя дополнительные признаки, например углы, как на рис. 10.
Рис. 10. Углы, образованные точками разветвления, в качестве дополнительных признаков.
Также можно применять шифр гаммирования. Как известно, сложение по модулю 2 является абсолютно стойким шифром, когда длина ключа равна длине текста, а поскольку количество точек бифуркации и пересечения не превышает порядка 100, но всё же больше длины обычных паролей, то в качестве ключа можно использовать комбинацию хешей пароля. Это избавляет от необходимости хранить в базе данных сетчатки глаза и хеши паролей. Нужно хранить только координаты, зашифрованные абсолютно стойким шифром.
Аутентификация по сетчатке действительно показывает точные результаты. Алгоритм, основанный на методе фазовой корреляции, не допустил ни одной ошибки при тестировании на базе данных VARIA. Также алгоритм был протестирован на неразмеченной базе MESSIDOR с целью проверки алгоритма на ложные срабатывания. Все найденные алгоритмом пары похожих сетчаток были проверены вручную. Они действительно являются одинаковыми. На сравнение кровеносных сосудов двух сетчаток глаз из базы VARIA уходит в среднем 1.2 секунды на двух ядрах процессора Pentium Dual-CoreT4500 с частотой 2.30 GHz. Время исполнения алгоритма получилось довольно большое для идентификации, но оно приемлемо для аутентификации.
Также была предпринята попытка реализации алгоритма, использующего углы Харриса, но получить удовлетворительных результатов не удалось. Как и в предыдущем алгоритме, возникла проблема в устранении вращения и смещения при помощи метода фазовой корреляции. Вторая проблема связана с недостатками алгоритма поиска углов Харриса. При одном и том же пороговом значении для отсева точек, количество найденных точек может оказаться либо слишком большим либо слишком малым.
В дальнейших планах стоит разработка алгоритма, основанного на поиске точек разветвления. Он требует гораздо меньше вычислительных ресурсов по сравнению с алгоритмом, основанном на методе фазовой корреляции. Кроме того, существуют возможности для его усложнения в целях сведения к минимуму вероятности взлома системы.
Другим интересным направлением в дальнейших исследованиях является разработка автоматических систем для ранней диагностики заболеваний, таких как глаукома, сахарный диабет, атеросклероз и многие другие.
Список использованных источников и литературы
- Reddy B.S. and Chatterji B.N. An FFT-Based Technique for Translation, Rotation, and Scale-Invariant Image Registration // IEEE Transactions on Image Processing. 1996. Vol. 5. No. 8. pp. 1266-1271.
- Human recognition based on retinal images and using new similarity function / A. Dehghani [et al.] // EURASIP Journal on Image and Video Processing. 2013.
- Hortas M.O. Automatic system for personal authentication using the retinal vessel tree as biometric pattern. PhD Thesis. Universidade da Coruña. La Coruña. 2009.
- VARIA database
- MESSIDOR database
p.s. по немногочисленным просьбам выкладываю ссылку на проект на гитхабе.
Источник
Аутентификация по сетчатке глаза — это одна из биометрических технологий, используемая для проверки подлинности личности.
Тип биометрической технологии, который рассматривается в данной статье, использует физиологический параметр — уникальность сетчатки глаза. Данный метод часто путают с аутентификацией по радужной оболочке глаза, однако это совершенно другой способ аутентификации.
История[править | править код]
Первые упоминания об использовании сетчатки в качестве средства для проверки и идентификации восходят к 1930-м годам. Первое научное исследование было проведено доктором Карлтоном Саймоном и доктором Изодором Гольдштейном. В своей работе они предположили, что из-за различного распределения кровеносных сосудов сетчатка обладает структурой, уникальной для каждого человека, а значит может быть использована в качестве средства подтверждения личности.
Следующее научное исследование, которое подтвердило уникальность сетчатки, было проведено в 1950-х годах ученым, известным как доктор Пол Тауэр. Благодаря его работе было обнаружено, что даже у близнецов структура сетчатки различна. Более того, как и радужная оболочка глаза, сетчатка практически не изменяется в течение жизни человека, за исключением случаев болезни или слепоты.
Таким образом, распознавание по сетчатке является очень надежной системой биометрической аутентификации по сравнению с такими, как распознавание лиц или отпечатков пальцев.
Процесс распознавания сетчатки[править | править код]
В отличие от других биометрических способов, для распознавания сетчатки требуется большое количество требований от пользователя для сбора высококачественных данных. Необходимо, чтобы пользователь находился в непосредственной близости от устройства сканирования сетчатки. В этом состоит большое различие с распознаванием радужной оболочки, когда данные можно собирать с очень большого расстояния.
Процесс можно разбить следующим образом.
Сбор и обработка данных[править | править код]
На этом первом этапе человек должен зафиксировать свой глаз перед небольшим приемником. Отсюда инфракрасный световой луч затем излучается в глаз, чтобы полностью осветить сетчатку. Чтобы уменьшить вероятность ошибки, этот свет излучается на 360 градусов. Данный процесс может занять до нескольких минут. Чтобы обеспечить сбор качественных изображений, человек должен оставаться абсолютно неподвижным, очков или линз быть не должно в целях устранения помех. На этой стадии можно собрать и проанализировать до пяти необработанных изображений, чтобы создать комплексное изображение, из которого затем будут извлечены уникальные признаки.
Создание шаблона регистрации и подтверждения[править | править код]
На этом втором этапе извлекаются уникальные признаки. Генетические факторы фактически не определяют состав структуры кровеносных сосудов, из которых состоит сетчатка. Другими словами, это не вписывается в структуру ДНК человека и не передается потомству. Из-за этого с сетчатки может быть получено до 400 уникальных признаков (для отпечатка пальца — примерно в 30-40). После этого создается шаблон регистрации. Размер шаблона регистрации сетчатки составляет всего 96 байт и считается самым маленьким биометрическим шаблоном из всех. Это, очевидно, имеет многочисленные преимущества. Во-первых, при проверке статистической схожести между шаблонами проверки и регистрации значительно снижаются расходы на вычисления. Во-вторых, этот небольшой размер означает, что большее количество шаблонов может храниться в одной базе данных. Этот же процесс также используется для создания шаблона подтверждения.
Поскольку для распознавания сетчатки требуется высокая точность при сборе данных, существует ряд факторов, которые могут значительно помешать процессу распознавания:
- Неаккуратность пользователя при считывании данных:
Как было описано, человек должен оставаться совершенно неподвижным на протяжении всего процесса. Любое внезапное или непреднамеренное движение может негативно повлиять на относительное расположение линзы, которая используется для передачи луча инфракрасного света в сетчатку.
- Большое расстояние между глазом и объективом:
Для выполнения высококачественного сканирования между приемником и сетчаткой должно быть расстояние не более 3 дюймов. Если расстояние превышает вышеуказанное, процесс сканирования должен повторяться снова, пока данное требование не будет соблюдено. В этом отношении, по сравнению с другими биометрическими методами, точность имеет первостепенное значение при распознавании сетчатки.
- Размер зрачка человека:
Маленький зрачок может значительно уменьшить количество внешнего света, который передается на сетчатку. Также, данная проблема может усугубиться при сжатии зрачка из-за неправильных условий освещения.
Преимущества и недостатки[править | править код]
Преимущества[править | править код]
- Сетчатка считается очень стабильной и практически не меняется в течение жизни человека. Таким образом, в этом отношении она считается самой надежной биометрической технологией, доступной на рынке сегодня.
- Учитывая небольшой размер считываемых и анализируемых данных распознавания сетчатки, система способна быстро подтверждать личность человека.
- Из-за большого количества уникальных признаков, которыми обладает сетчатка, вероятность ложного срабатывания крайне низка.
- Поскольку сетчатка расположена внутри самой структуры глаза, она не подвержена влиянию внешней среды, в отличие от геометрии рук и отпечатков пальцев.
Недостатки[править | править код]
- Многие люди опасаются, что данная процедура негативно влияет на зрение (хотя научно данный факт не доказан)
- По сравнению со всеми другими биометрическими методами распознавание сетчатки требует от пользователя больше всего усилий.
- Из-за высоких требований к пользователю может понадобиться несколько попыток аутентификации и длительное время для получения результатов. Таким образом, если процесс не будет выполнен правильно, это может привести к очень большой частоте ложных отказов.
Алгоритмы, используемые при аутентификации[править | править код]
Алгоритм, основанный на методе фазовой корреляции[править | править код]
В данном алгоритме оцениваются вращение и смещение изображений относительно друг друга при помощи метода фазовой корреляции. После этого изображения выравниваются и вычисляется коэффициент, называемый показателем схожести.
Пусть и — изображения, одно из которых сдвинуто на относительно другого, а и — их преобразования Фурье, тогда:
, где R — кросс-спектр
Получим импульс-функцию, вычислив обратное преобразование Фурье кросс-спектра
Найдем искомое смещение, предварительно определив максимум этой функции
Затем при помощи полярных координат найдем угол вращения при наличии смещения :
Затем, как и в предыдущем случае, применяется метод фазовой корреляции.
После этого вычисляется показатель схожести по следующей формуле:
Вышеописанная техника на практике не всегда показывает хорошие результаты вследствие наличия шумов на изображениях. Для устранения этого недостатка данный алгоритм применяется итеративно (возможно, с изменением порядка подачи изображений в функцию). Каждый раз изображения выравниваются и рассчитывается показатель схожести. Конечным результатом будет считаться наибольший показатель схожести.
Интересные факты[править | править код]
- В среднем сетчатка глаза человека содержит 92 миллиона палочек, поэтому ее действительно можно считать уникальной.
- Исследования национальной лаборатории США показали, что вероятность ошибки второго рода при данном способе аутентификации крайне мала (меньше 1%).
Ссылки[править | править код]
- Explainer: Retinal Scan Technology
- Retina Recognition
- Retinal Recognition — the Ultimate Biometric
- Retinography
- Retinal recognition: Personal identification using blood vessels
- Методы аутентификации по сетчатке глаза
Источник