Анализ пути (статистика) - Path analysis (statistics)

В статистике , анализ пути используются для описания направленных зависимостей между набором переменных. Сюда входят модели, эквивалентные любой форме множественного регрессионного анализа , факторного анализа , канонического корреляционного анализа , дискриминантного анализа , а также более общие семейства моделей в многомерном анализе дисперсии и ковариационного анализа ( MANOVA , ANOVA , ANCOVA ).

Помимо того, что анализ пути рассматривается как форма множественной регрессии с упором на причинно-следственную связь, он может рассматриваться как частный случай моделирования структурным уравнением (SEM), в котором для каждой из переменных в причинной модели используются только отдельные индикаторы. . То есть, анализ пути - это SEM со структурной моделью, но без модели измерения. Другие термины, используемые для обозначения анализа путей, включают причинное моделирование, анализ ковариационных структур и модели скрытых переменных .

Анализ пути считается Judea Pearl прямым предшественником техники причинного вывода .

История

Анализ пути был разработан примерно в 1918 году генетиком Сьюэлом Райтом , который более подробно писал об этом в 1920-х годах. С тех пор он был применен к огромному количеству сложных областей моделирования, включая биологию , психологию , социологию и эконометрику .

Моделирование пути

Как правило, модели путей состоят из независимых и зависимых переменных, графически изображенных прямоугольниками или прямоугольниками. Переменные, которые являются независимыми переменными, а не зависимыми переменными, называются «экзогенными». Графически эти блоки экзогенных переменных лежат на внешних краях модели и имеют только односторонние стрелки, выходящие из них. Односторонние стрелки не указывают на экзогенные переменные. Переменные, которые являются исключительно зависимыми переменными или одновременно независимыми и зависимыми переменными, называются «эндогенными». Графически эндогенные переменные имеют по крайней мере одну однонаправленную стрелку, указывающую на них.

В модели ниже две экзогенные переменные (пример 1 и пример 2 ) моделируются как коррелированные, как показано двунаправленной стрелкой. Обе эти переменные оказывают прямое и косвенное (через En 1 ) влияние на En 2 (две зависимые или «эндогенные» переменные / факторы). В большинстве моделей реального мира на эндогенные переменные могут также влиять переменные и факторы, происходящие извне модели (внешние эффекты, включая ошибку измерения). Эти эффекты обозначены буквой «е» или ошибкой в ​​модели.

Пример пути.JPG

Возможны альтернативные модели с использованием тех же переменных. Например, можно предположить, что Ex 1 имеет только косвенное влияние на En 2 , удаляя стрелку от Ex 1 к En 2 ; и вероятность или «соответствие» этих двух моделей можно сравнить статистически.

Правила трассировки пути

Чтобы правильно рассчитать взаимосвязь между любыми двумя прямоугольниками на диаграмме, Райт (1934) предложил простой набор правил трассировки пути для расчета корреляции между двумя переменными. Корреляция равна сумме вклада всех путей, которыми связаны две переменные. Сила каждого из этих способствующих путей рассчитывается как произведение коэффициентов пути для этого пути.

Правила трассировки пути:

  1. Вы можете проследить назад по стрелке вверх, а затем вперед по следующей или вперед от одной переменной к другой, но никогда не вперед, а затем назад. Другой способ подумать об этом правиле состоит в том, что вы никогда не можете перейти из одного наконечника стрелы в другой наконечник стрелы: орел-решка или решка-острие, но не орел-острие.
  2. Вы можете пройти через каждую переменную только один раз в заданной цепочке путей.
  3. В каждую цепочку путей можно включить не более одной двунаправленной стрелки.

Опять же, ожидаемая корреляция из-за каждой цепи, прослеживаемой между двумя переменными, является произведением стандартизованных коэффициентов пути, а общая ожидаемая корреляция между двумя переменными является суммой этих способствующих цепочек путей.

NB : правила Райта предполагает модель без петель обратной связи: ориентированный граф модели не должен содержать циклов , т.е. это направленный ациклический граф , который широко изучается в рамках причинного анализа в Иудею Pearl .

Трассировка пути в нестандартных моделях

Если смоделированные переменные не были стандартизированы, дополнительное правило позволяет рассчитывать ожидаемые ковариации до тех пор, пока не существует путей, соединяющих зависимые переменные с другими зависимыми переменными.

В простейшем случае все остаточные дисперсии моделируются явно. В этом случае, в дополнение к трем правилам, указанным выше, рассчитайте ожидаемые ковариации по:

  1. Вычислите произведение коэффициентов в каждом маршруте между интересующими переменными, отслеживая в обратном направлении, изменяя направление по двуглавой стрелке, а затем отслеживая вперед.
  2. Суммируйте все различные маршруты, где пути считаются различными, если они содержат разные коэффициенты, или встречаются с этими коэффициентами в другом порядке.

Если остаточная дисперсия не включена явно или в качестве более общего решения, при любом изменении направления, встречающемся на маршруте (за исключением двухсторонних стрелок), включите дисперсию переменной в точке изменения. То есть, при отслеживании пути от зависимой переменной к независимой переменной, включайте дисперсию независимой переменной, за исключением случаев, когда это нарушает правило 1 выше (проход через соседние стрелки: то есть, когда независимая переменная также соединяется с двойным стрелка, соединяющая его с другой независимой переменной). При выводе дисперсий (что необходимо в том случае, если они не моделируются явно), путь от зависимой переменной к независимой и обратно учитывается только один раз.

Смотрите также

Рекомендации

внешние ссылки