Прокрустовый анализ - Procrustes analysis

Наложение прокруста. На рисунке показаны три этапа преобразования обычного Прокруста, пригодного для двух конфигураций ориентиров. а) масштабирование обеих конфигураций до одинакового размера; b) перенос в то же положение центра тяжести; (c) Вращение к ориентации, которая обеспечивает минимальную сумму квадратов расстояний между соответствующими ориентирами.

В статистике , анализ Procrustes является формой анализа статистической формы , используемым для анализа распределения множества форм . Имя Прокруст ( греч . Προκρούστης ) относится к бандиту из греческой мифологии, который заставлял своих жертв умещаться в его постели, растягивая конечности или отрезая их.

По математике:

  • ортогональна проблема Procrustes представляет собой метод , который может быть использован , чтобы найти оптимальное вращение и / или отражение (то есть, оптимальный ортогонален линейное преобразование) для Procrustes наложению (PS) объекта по отношению к другому.
  • ортогональная проблема Прокруста с ограничениями, при условии, что det ( R ) = 1 (где R - матрица вращения), представляет собой метод, который может использоваться для определения оптимального поворота для PS одного объекта относительно другого (отражение не допускается ). В некоторых контекстах этот метод называется алгоритмом Кабша .

Когда форма сравнивается с другой или набор форм сравнивается с произвольно выбранной эталонной формой, анализ Прокруста иногда дополнительно квалифицируется как классический или обычный , в отличие от обобщенного анализа Прокруста (GPA), который сравнивает три или более форм с оптимально определенная «средняя форма».

Вступление

Чтобы сравнить формы двух или более объектов, объекты должны быть сначала оптимально «наложены». Procrustes накладывание (ПС) выполняются оптимальным образом перевода , вращающиеся и равномерно масштабирования объектов. Другими словами, как размещение в пространстве, так и размер объектов свободно регулируются. Цель состоит в том, чтобы получить подобное расположение и размер, минимизируя различие форм, называемое расстоянием Прокруста между объектами. Иногда это называют полным , в отличие от частичного PS, при котором масштабирование не выполняется (т. Е. Сохраняется размер объектов). Обратите внимание, что после полного PS объекты будут точно совпадать, если их форма идентична. Например, при полном PS две сферы с разными радиусами всегда будут совпадать, потому что они имеют абсолютно одинаковую форму. И наоборот, при частичном PS они никогда не совпадут. Это означает, что согласно строгому определению термина « форма» в геометрии , анализ формы должен выполняться с использованием полного PS. Статистический анализ, основанный на частичном PS, не является анализом чистой формы, поскольку он чувствителен не только к различиям формы, но и к различиям в размерах. И полный, и частичный PS никогда не смогут идеально сопоставить два объекта разной формы, например, куб и сферу, или правую и левую руки.

В некоторых случаях как полное, так и частичное PS может также включать отражение . Отражение позволяет, например, удачно (возможно, идеально) наложить правую руку на левую. Таким образом, частичный PS с включенным отражением сохраняет размер, но допускает перемещение, вращение и отражение, тогда как полный PS с включенным отражением допускает перемещение, вращение, масштабирование и отражение.

Оптимальный перенос и масштабирование определяются с помощью гораздо более простых операций (см. Ниже).

Обычный анализ Прокруста

Здесь мы просто рассматриваем объекты, состоящие из конечного числа k точек в n измерениях. Часто эти точки выбираются на непрерывной поверхности сложных объектов, таких как человеческая кость, и в этом случае они называются ориентирами .

Форму объекта можно рассматривать как член класса эквивалентности, образованного удалением компонентов поступательного , вращательного и равномерного масштабирования .

Перевод

Например, трансляционные компоненты могут быть удалены из объекта путем перевода объекта так, чтобы среднее значение всех точек объекта (то есть его центроид ) лежало в начале координат.

Математически: возьмите точки в двух измерениях, скажем

.

Среднее значение этих точек - это где

Теперь переведите эти точки так, чтобы их среднее значение было переведено в начало координат , давая точку .

Равномерное масштабирование

Аналогично, компонент масштаба может быть удален путем масштабирования объекта так, чтобы среднеквадратичное расстояние ( RMSD ) от точек до переведенной исходной точки было 1. Это RMSD является статистической мерой масштаба или размера объекта :

Масштаб становится равным 1, когда координаты точки делятся на исходный масштаб объекта:

.

Обратите внимание, что в литературе иногда используются другие методы определения и удаления шкалы.

Вращение

Удаление вращающегося компонента сложнее, так как стандартная справочная ориентация не всегда доступна. Рассмотрим два объекта, состоящих из одинакового количества точек, с удаленными масштабом и перемещением. Пусть точки Сии , . Один из этих объектов можно использовать для справочной ориентации. Зафиксируйте эталонный объект и поверните другой вокруг начала координат, пока не найдете оптимальный угол поворота , при котором сумма квадратов расстояний ( SSD ) между соответствующими точками будет минимальной (пример метода наименьших квадратов ).

Поворот на угол дает

.

где (u, v) - координаты повернутой точки. Взяв производную по и решив, когда производная равна нулю, получаем

Когда объект является трехмерным, оптимальное вращение представлено матрицей вращения 3 на 3 R , а не простым углом, и в этом случае разложение по сингулярным числам может использоваться для нахождения оптимального значения для R (см. решение ортогональной задачи Прокруста с ограничениями , при условии, что det ( R ) = 1).

Сравнение форм

Разницу между формой двух объектов можно оценить только после «наложения» двух объектов путем их перемещения, масштабирования и оптимального поворота, как описано выше. Квадратный корень из вышеупомянутого SSD между соответствующими точками может использоваться как статистическая мера этой разницы в форме:

Эту меру часто называют расстоянием Прокруста . Обратите внимание, что в литературе иногда используются другие более сложные определения расстояния Прокруста и другие меры «различия формы».

Наложение набора фигур

Мы показали, как наложить две формы. Тот же метод может применяться для наложения набора из трех или более форм, если для всех из них используется указанная выше справочная ориентация. Однако обобщенный анализ Прокруста предоставляет лучший метод для достижения этой цели.

Обобщенный анализ Прокруста (GPA)

GPA применяет метод анализа Прокруста для оптимального наложения набора объектов вместо наложения их на произвольно выбранную форму.

Обобщенный и обычный анализ Прокруста отличаются только определением опорной ориентации объектов, которая в первом методе определяется оптимально, а во втором - произвольно. Масштабирование и перевод выполняются одинаково обоими методами. Когда сравниваются только две формы, средний балл эквивалентен обычному анализу Прокруста.

Схема алгоритма следующая:

  1. произвольно выбрать справочную форму (обычно выбирая ее среди доступных экземпляров)
  2. наложить все экземпляры на текущую ссылочную форму
  3. вычислить среднюю форму текущего набора наложенных форм
  4. если расстояние Прокруста между средним значением и опорной формой превышает пороговое значение, установите опорное значение для средней формы и перейдите к шагу 2.

Вариации

Есть много способов представить форму объекта. Форму объекта можно рассматривать как член класса эквивалентности, образованного путем взятия набора всех наборов из k точек в n измерениях, то есть R kn, и выделения набора всех перемещений, поворотов и масштабов. Конкретное представление формы находится путем выбора конкретного представления класса эквивалентности. Это даст многообразие размерности kn -4. Прокруст - один из способов сделать это с особым статистическим обоснованием.

Букштейн получает представление формы, фиксируя положение двух точек, называемых базовой линией. Одна точка будет зафиксирована в начале координат, а другая - в (1,0). Остальные точки образуют координаты Букстейна .

Также принято рассматривать форму и масштаб с удаленными поступательными и вращательными компонентами.

Примеры

Анализ формы используется в биологических данных для выявления вариаций анатомических особенностей, характеризующихся данными ориентиров, например, при рассмотрении формы костей челюсти.

В одном исследовании Дэвида Джорджа Кендалла изучались треугольники, образованные стоячими камнями, чтобы определить, часто ли они располагаются в виде прямых линий. Форму треугольника можно представить как точку на сфере, а распределение всех форм можно представить как распределение по сфере. Распределение выборки из стоячих камней сравнивалось с теоретическим распределением, чтобы показать, что наличие прямых линий было не более чем средним.

Смотрите также

Рекомендации

  • FL Bookstein, Морфометрические инструменты для данных ориентиров , Cambridge University Press, (1991).
  • JC Gower, GB Dijksterhuis, Procrustes Problems , Oxford University Press (2004).
  • ILDryden, KV Mardia, Статистический анализ формы , Wiley, Chichester, (1998).

Внешние ссылки