Адаптация аффинной формы - Affine shape adaptation

Адаптация аффинной формы - это методология итеративной адаптации формы сглаживающих ядер в аффинной группе сглаживающих ядер к локальной структуре изображения в области окрестности конкретной точки изображения. Эквивалентно адаптация аффинной формы может быть выполнена путем итеративного деформирования локального фрагмента изображения с помощью аффинных преобразований при применении осесимметричного фильтра к искаженным фрагментам изображения. При условии, что этот итерационный процесс сходится, полученная фиксированная точка будет аффинно-инвариантной . В области компьютерного зрения эта идея использовалась для определения аффинно-инвариантных операторов точки интереса, а также методов анализа аффинно-инвариантной текстуры.

Аффинно-адаптированные операторы точки интереса

Точки интереса, полученные с помощью адаптированного к масштабу лапласовского детектора капель или многомасштабного углового детектора Харриса с автоматическим выбором масштаба, инвариантны к сдвигам, поворотам и равномерному изменению масштаба в пространственной области. Однако изображения, входящие в систему компьютерного зрения, также подвержены перспективным искажениям. Чтобы получить точки интереса, которые более устойчивы к перспективным преобразованиям, естественным подходом является разработка детектора признаков, инвариантного к аффинным преобразованиям .

Аффинная инвариантность может быть достигнута из измерений той же многомасштабной матрицы второго момента с окнами, которая используется в многомасштабном операторе Харриса, при условии, что мы расширим концепцию регулярного масштабного пространства, полученную сверткой с вращательно-симметричными гауссовыми ядрами, до аффинной гауссовой шкалы. пространство, полученное с помощью адаптированных по форме гауссовых ядер (Lindeberg 1994, раздел 15.3; Lindeberg and Garding 1997). Для двумерного изображения , пусть и пусть будет положительно определенная матрица 2 × 2. Тогда неоднородное гауссово ядро ​​можно определить как

и для любого входного изображения аффинное гауссово масштабное пространство - это трехпараметрическое масштабное пространство, определяемое как

Затем введите аффинное преобразование, где - матрица 2 × 2, и определите преобразованное изображение как

.

Затем, аффинные масштабно-пространственные представления и из и , соответственно, связаны в соответствии с

при условии, что матрицы аффинной формы и связаны согласно

.

Не обращая внимания на математические детали, которые, к сожалению, становятся несколько техническими, если кто-то стремится к точному описанию происходящего, важно отметить, что аффинное гауссовское масштабное пространство замкнуто относительно аффинных преобразований .

Если мы, учитывая обозначения, а также локальную матрицу формы и матрицу интегрированной формы , введем аффинно адаптированную многомасштабную матрицу второго момента в соответствии с

можно показать, что при любом аффинном преобразовании аффинно-адаптированная многомасштабная матрица второго момента преобразуется в соответствии с

.

Опять же, не обращая внимания на несколько беспорядочные технические детали, важное сообщение здесь состоит в том, что, учитывая соответствие между точками изображения и , аффинное преобразование может быть оценено по измерениям многомасштабных матриц второго момента и в двух областях.

Важным следствием этого исследования является то, что если мы сможем найти аффинное преобразование , умноженное на константу единичной матрицы, то мы получим неподвижную точку, инвариантную для аффинных преобразований (Lindeberg 1994, раздел 15.4; Lindeberg and Garding 1997). Для практической реализации это свойство часто может быть достигнуто одним из двух основных способов. Первый подход основан на преобразованиях сглаживающих фильтров и состоит из:

  • оценка матрицы второго момента в области изображения,
  • определение нового адаптированного сглаживающего ядра с ковариационной матрицей, пропорциональной ,
  • сглаживание исходного изображения с помощью ядра сглаживания адаптированной формы, и
  • повторение этой операции до тех пор, пока разница между двумя последовательными матрицами второго момента не станет достаточно малой.

Второй подход основан на искажениях в области изображения и подразумевает:

  • оценка в области изображения,
  • оценка локального аффинного преобразования, пропорционального где обозначает матрицу квадратного корня из ,
  • искажение входного изображения аффинным преобразованием и
  • повторение этой операции до тех пор, пока не станет достаточно близким к постоянному, умноженному на единичную матрицу.

Этот общий процесс называется адаптацией аффинной формы (Lindeberg and Garding 1997; Baumberg 2000; Mikolajczyk and Schmid 2004; Tuytelaars and van Gool 2004; Ravela 2004; Lindeberg 2008). В идеальном непрерывном случае оба подхода математически эквивалентны. Однако на практике первый подход, основанный на фильтре, обычно более точен при наличии шума, в то время как второй подход, основанный на искажении, обычно быстрее.

На практике описанный здесь процесс адаптации аффинной формы часто сочетается с автоматическим выбором шкалы обнаружения точек интереса, как описано в статьях об обнаружении больших двоичных объектов и обнаружении углов , для получения точек интереса, инвариантных для полной аффинной группы, включая изменения масштаба. Помимо широко используемого многомасштабного оператора Харриса, эта адаптация аффинной формы также может применяться к другим типам операторов точки интереса, таким как оператор Лапласа / разности гауссовских капель и определитель гессиана (Lindeberg 2008). Адаптация аффинной формы также может использоваться для распознавания аффинно-инвариантной текстуры и аффинно-инвариантной сегментации текстуры.

Тесно связано с понятием адаптации аффинной формы понятие аффинной нормализации , которое определяет аффинную инвариантную систему отсчета, как далее описано в Lindeberg (2013a, b, 2021: Приложение I.3), так что любое измерение изображения, выполняемое в аффинной инвариантная система отсчета аффинно инвариантна.

Смотрите также

использованная литература