Грандиозный вызов распознавания лиц - Face Recognition Grand Challenge

Final Large logo.png

Face Recognition Grand Challenge (FRGC) был проведен в целях поощрения и продвижения распознавания лиц технологии. Это был преемник теста поставщиков распознавания лиц .

Обзор

Основная цель FRGC заключалась в продвижении и продвижении технологии распознавания лиц, разработанной для поддержки существующих усилий правительства США по распознаванию лиц. FRGC разработала новые методы распознавания лиц и прототипы систем, повысив производительность на порядок. FRGC была открыта для исследователей и разработчиков распознавания лиц из компаний, академических кругов и исследовательских институтов. ФРСК действовала с мая 2004 г. по март 2006 г.

FRGC состояла из все более сложных задач. Каждая задача-испытание состояла из набора данных изображений лиц и определенного набора экспериментов. Одним из препятствий на пути развития улучшенного распознавания лиц является отсутствие данных. Задачи FRGC включают достаточно данных, чтобы преодолеть это препятствие. Набор определенных экспериментов помогает исследователям и разработчикам добиться прогресса в достижении новых целей производительности.

Есть три основных претендента на улучшение алгоритмов распознавания лиц: изображения с высоким разрешением, трехмерное (3D) распознавание лиц и новые методы предварительной обработки. FRGC одновременно применяет и оценивает достоинства всех трех методов. Современные системы распознавания лиц предназначены для работы с относительно небольшими неподвижными изображениями лиц. Традиционный метод измерения размера лица - это количество пикселей между центрами глаз. На текущих изображениях между центрами глаз находится от 40 до 60 пикселей (от 10 000 до 20 000 пикселей на лице). В FRGC изображения с высоким разрешением состоят из изображений лиц, в среднем с 250 пикселями между центрами глаз. FRGC будет способствовать разработке новых алгоритмов , использующих дополнительную информацию, присущую изображениям с высоким разрешением.

Алгоритмы трехмерного (3D) распознавания лиц идентифицируют лица по трехмерной форме лица человека. В существующих системах распознавания лиц изменение освещения ( освещенности ) и позы лица снижает производительность. Поскольку на форму лиц не влияют изменения освещения или позы, 3D-распознавание лиц может улучшить производительность в этих условиях.

За последние пару лет в компьютерной графике и компьютерном зрении произошел прогресс в моделировании освещения и изменении изображений лиц. Эти достижения привели к разработке новых компьютерных алгоритмов, которые могут автоматически корректировать освещение и изменять изображения лиц. Эти новые алгоритмы работают путем предварительной обработки изображения лица для корректировки освещения и позы перед обработкой в ​​системе распознавания лиц. Часть предварительной обработки FRGC будет измерять влияние новых алгоритмов предварительной обработки на производительность распознавания.

FRGC улучшил возможности систем автоматического распознавания лиц путем экспериментов с четко сформулированными целями и задачами. Исследователи и разработчики могут разрабатывать новые алгоритмы и системы, отвечающие целям FRGC. Разработке новых алгоритмов и систем способствуют сложные задачи FRGC.

Структура Grand Challenge по распознаванию лиц

FRGC структурирован вокруг проблемных задач, которые призваны побудить исследователей достичь цели FRGC.

Есть три аспекта FRGC, которые будут новыми для сообщества распознавания лиц. Первый аспект - это размер FRGC с точки зрения данных. Набор данных FRGC содержит 50 000 записей. Второй аспект - сложность ФРСК. Предыдущие наборы данных распознавания лиц были ограничены неподвижными изображениями. FRGC будет состоять из трех режимов:

  • неподвижные изображения с высоким разрешением
  • 3D изображения
  • мульти-изображения человека.

Третий новый аспект - это инфраструктура. Инфраструктура FRGC будет предоставлена биометрическое экспериментирование окружающей среды (BEE), в XML на основе рамки для описания и документирования вычислительных экспериментов. BEE позволит описывать и распространять эксперименты в общем формате, записывать необработанные результаты эксперимента в общем формате, анализировать и представлять необработанные результаты в общем формате и документировать формат эксперимента в общем формате. . Это первый случай, когда вычислительно-экспериментальная среда поддерживает сложную задачу распознавания лиц или биометрии.

Набор данных FRGC

Распространение данных FRGC состоит из трех частей. Первый - это набор данных FRGC. Вторая часть - это ФРСК ПЧЕЛ. Распределение BEE включает все наборы данных для выполнения и оценки шести экспериментов. Третья часть представляет собой набор базовых алгоритмов для экспериментов с 1 по 4. Со всеми тремя компонентами можно проводить эксперименты с 1 по 4, от обработки необработанных изображений до получения рабочих характеристик приемника (ROC).

Данные для FRGC состоят из 50 000 записей, разделенных на разделы для обучения и проверки. Раздел обучения предназначен для алгоритмов обучения, а раздел проверки предназначен для оценки эффективности подхода в лабораторных условиях. Раздел проверки состоит из данных 4003 тематических сеансов. Тематический сеанс - это набор всех изображений человека, получаемых каждый раз, когда собираются биометрические данные человека, и состоит из четырех контролируемых неподвижных изображений, двух неконтролируемых неподвижных изображений и одного трехмерного изображения. Контролируемые изображения были сняты в студийных условиях и представляют собой полные фронтальные изображения лица, сделанные при двух условиях освещения и с двумя выражениями лица (улыбающееся и нейтральное). Неконтролируемые изображения были получены при различных условиях освещения; например, коридоры, атриумы или снаружи. Каждый набор неконтролируемых изображений содержит два выражения лица: улыбающееся и нейтральное. Трехмерное изображение было получено в условиях контролируемого освещения. Трехмерные изображения состоят из диапазона и изображения текстуры. Трехмерные изображения были получены с помощью сенсора Minolta Vivid серии 900/910.

Распределение FRGC состоит из шести экспериментов. В эксперименте 1 галерея состоит из одного контролируемого неподвижного изображения человека, а каждый зонд состоит из одного контролируемого неподвижного изображения. Эксперимент 1 - контрольный. Эксперимент 2 изучает влияние использования нескольких неподвижных изображений человека на производительность. В эксперименте 2 каждый биометрический образец состоит из четырех контролируемых изображений человека, снятых во время тематической сессии. Например, галерея состоит из четырех изображений каждого человека, причем все изображения сделаны в рамках одной тематической сессии. Аналогичным образом зонд теперь состоит из четырех изображений человека.

Эксперимент 3 измеряет производительность 3D-распознавания лиц. В эксперименте 3 галерея и набор датчиков состоят из трехмерных изображений человека. В эксперименте 4 измеряется эффективность распознавания неконтролируемых изображений. В эксперименте 4 галерея состоит из одного контролируемого неподвижного изображения, а набор датчиков состоит из одного неконтролируемого неподвижного изображения.

Эксперименты 5 и 6 исследуют сравнение 3D и 2D изображений. В обоих экспериментах галерея состоит из трехмерных изображений. В эксперименте 5 набор датчиков состоит из одного управляемого неподвижного изображения. В эксперименте 6 набор датчиков состоит из одного неуправляемого перегонного куба.

Спонсоры

использованная литература

Всеобщее достояние Эта статья включает материалы, являющиеся  общественным достоянием, из документа Национального института стандартов и технологий : «NIST Face Recognition Grand Challenge» .

внешние ссылки