Причинность Грейнджера - Granger causality

Когда временной ряд X по Грейнджеру вызывает временной ряд Y , паттерны в X приблизительно повторяются в Y через некоторое время (два примера показаны стрелками). Таким образом, прошлые значения X может быть использованы для прогнозирования значений будущих Y .

Тест причинности Грейнджера - это тест статистической гипотезы для определения полезности одного временного ряда для прогнозирования другого, впервые предложенный в 1969 году. Обычно регрессии отражают «простые» корреляции , но Клайв Грейнджер утверждал, что причинно-следственная связь в экономике может быть проверена путем измерения способность предсказывать будущие значения временного ряда, используя предыдущие значения другого временного ряда. Поскольку вопрос «истинной причинности» является глубоко философским, и из-за постфактум ergo propter hocОшибочность предположения, что одно предшествующее другому может быть использовано в качестве доказательства причинной связи, эконометристы утверждают, что тест Грейнджера обнаруживает только «предсказуемую причинность». Использование одного только термина «причинность» является неправильным, поскольку причинность по Грейнджеру лучше описывать как «предшествование» или, как позже сам Грейнджер утверждал в 1977 году, «временную связь». Вместо того, чтобы проверять, является ли X причиной Y, причинно-следственная связь Грейнджера проверяет, прогнозирует ли X Y.

Временной ряд Х называется Грейнжеру Y , если оно может быть показано, как правило , через серию т-тестов и F-тестах на запаздывающих значений из X (и запаздывающих значений Y , также включены), что эти X значения обеспечивают статистически значимая информация о значениях будущих  Y .

Грейнджер также подчеркнула, что некоторые исследования с использованием проверки «причинности по Грейнджеру» в областях, не связанных с экономикой, привели к «смехотворным» выводам. «Конечно, появилось много нелепых работ», - сказал он в своей Нобелевской лекции. Однако он остается популярным методом анализа причинно-следственных связей во временных рядах из-за его вычислительной простоты. Первоначальное определение причинности по Грейнджеру не учитывает скрытые смешивающие эффекты и не фиксирует мгновенные и нелинейные причинные связи, хотя для решения этих проблем было предложено несколько расширений.

Интуиция

Будем говорить , что переменная X , которая эволюционирует с течением времени Грейнджер-вызывает другую развивающуюся переменную Y , если предсказания значения Y на основе его собственных прошлых значений и на прошлых значений X лучше , чем предсказания Y основаны только на s собственный прошлые ценности.

Основные принципы

Грейнджер определила причинно-следственную связь на основе двух принципов:

  1. Причина происходит до ее следствия.
  2. Причина имеет уникальную информацию о будущих значениях ее следствия.

Учитывая эти два предположения о причинно-следственной связи, Грейнджер предложила проверить следующую гипотезу для выявления причинного воздействия на :

где относится к вероятности, является произвольным непустым набором, и и соответственно обозначают информацию, доступную на данный момент во всей вселенной, и информацию в модифицированной вселенной, в которой исключена. Если эта гипотеза принимается, мы говорим, что Грейнджер-причины .

Метод

Если временной ряд является стационарным процессом , тест выполняется с использованием значений уровня двух (или более) переменных. Если переменные нестационарны, то тест выполняется с использованием первых (или более высоких) разностей. Количество включаемых лагов обычно выбирается с использованием информационного критерия, такого как информационный критерий Акаике или информационный критерий Шварца . Любое конкретное запаздывающее значение одной из переменных сохраняется в регрессии, если (1) оно является значимым согласно t-критерию и (2) оно и другие запаздывающие значения переменной совместно добавляют объяснительную силу модели в соответствии с F-тест. Тогда нулевая гипотеза об отсутствии причинности по Грейнджеру не отвергается тогда и только тогда, когда в регрессии не сохраняются запаздывающие значения независимой переменной.

На практике может быть обнаружено, что ни одна переменная Грейнджера не вызывает другую, или что каждая из двух переменных Грейнджера вызывает другую.

Математическое утверждение

Пусть y и x - стационарные временные ряды. Для того, чтобы проверить нулевую гипотезу , что х не Грейнжер у , один сначала находит правильные отставали значения у для включения в одномерных авторегрессиях от у :

Затем авторегрессия дополняется включением запаздывающих значений x :

В этой регрессии сохраняются все запаздывающие значения x, которые являются индивидуально значимыми в соответствии с их t-статистикой, при условии, что вместе они добавляют объясняющую силу к регрессии в соответствии с F-тестом (чья нулевая гипотеза не является объяснительной силой, совместно добавляемой x ' с). В обозначениях вышеупомянутой расширенной регрессии p - самый короткий, а q - самый длинный, длина запаздывания, для которой значение x с запаздыванием является значительным.

Нулевая гипотеза о том, что x не является причиной y по Грейнджеру, принимается тогда и только тогда, когда в регрессии не сохраняются запаздывающие значения x .

Многомерный анализ

Многомерный анализ причинно-следственной связи по Грейнджеру обычно выполняется путем подбора модели векторной авторегрессии (VAR) к временному ряду. В частности, пусть для - многомерный многомерный временной ряд. Причинность по Грейнджеру выполняется путем подбора модели VAR с временными лагами следующим образом:

где - белый гауссовский случайный вектор, а - матрица для каждого . Временной ряд называется причиной Грейнджера другого временного ряда , если хотя бы один из элементов для значительно больше нуля (по абсолютной величине).

Непараметрический тест

Вышеупомянутые линейные методы подходят для проверки причинности по Грейнджеру в среднем. Однако они не могут обнаружить причинность Грейнджера в более высокие моменты, например, в дисперсии. Непараметрические тесты на причинность по Грейнджеру предназначены для решения этой проблемы. Определение причинности по Грейнджеру в этих тестах является общим и не включает никаких допущений моделирования, таких как линейная авторегрессионная модель. Непараметрические тесты на причинность по Грейнджеру могут использоваться в качестве диагностических инструментов для построения более качественных параметрических моделей, включая моменты более высокого порядка и / или нелинейность.

Ограничения

Как следует из названия, причинность по Грейнджеру не обязательно является истинной причинностью. Фактически, тесты на причинность Грейнджера соответствуют только юмовскому определению причинности, которое идентифицирует причинно-следственные связи с постоянными конъюнкциями. Если и X, и Y управляются общим третьим процессом с разными задержками, можно все же не отвергнуть альтернативную гипотезу причинности Грейнджера. Тем не менее, изменение одной из переменных не изменит другую. Действительно, тесты на причинность по Грейнджеру предназначены для работы с парами переменных и могут давать вводящие в заблуждение результаты, когда истинная связь включает три или более переменных. Сказав это, утверждалось, что с учетом вероятностного взгляда на причинность, причинность Грейнджера может считаться истинной причинностью в этом смысле, особенно когда принимается во внимание «экранирующее» понятие Рейхенбаха о вероятностной причинности. Другими возможными источниками ошибочных результатов тестирования являются: (1) недостаточно частая или слишком частая выборка, (2) нелинейная причинно-следственная связь, (3) нестационарность и нелинейность временных рядов и (4) наличие рациональных ожиданий. Аналогичный тест, включающий большее количество переменных, можно применить с векторной авторегрессией . Недавно было проведено фундаментальное математическое исследование механизма, лежащего в основе метода Грейнджера. Используя исключительно математические инструменты (преобразование Фурье и дифференциальное исчисление), было обнаружено, что даже самое основное требование, лежащее в основе любого возможного определения причинности, не удовлетворяется тестом причинности Грейнджера: любое определение причинности должно относиться к предсказанию причинности. будущее из прошлого; вместо этого, инвертируя временной ряд, можно показать, что Грейнджер позволяет «предсказывать» прошлое и из будущего.

Расширения

Был разработан метод причинности по Грейнджеру, который нечувствителен к отклонениям от предположения о нормальном распределении члена ошибки. Этот метод особенно полезен в финансовой экономике, поскольку многие финансовые переменные распределены ненормально. Недавно в литературе было предложено провести тестирование на асимметричную причинно-следственную связь, чтобы отделить причинное влияние положительных изменений от отрицательных. Также доступно расширение (не) причинно-следственного тестирования по Грейнджеру на панельные данные. Модифицированный тест причинности Грейнджера, основанный на типе GARCH (обобщенная авторегрессивная условная гетероскедастичность) моделей целочисленных временных рядов, доступен во многих областях.

В неврологии

Давнее мнение о нейронных функциях утверждало, что разные области мозга зависят от конкретной задачи; что структурная связь, локальная для определенной области, каким-то образом диктовала функцию этой части. Собирая работу, которая выполнялась на протяжении многих лет, произошел переход к другому, сетецентрическому подходу к описанию потока информации в мозгу. Объяснение функции начинает включать концепцию сетей, существующих на разных уровнях и в разных частях мозга. Поведение этих сетей можно описать недетерминированными процессами, развивающимися во времени. Это означает, что при одном и том же входном стимуле вы не получите такой же выходной сигнал от сети. Динамика этих сетей определяется вероятностями, поэтому мы рассматриваем их как стохастические (случайные) процессы, чтобы мы могли уловить такие виды динамики между различными областями мозга.

В прошлом изучались различные методы получения некоторой степени информационного потока от активированной активности нейрона и окружающего его ансамбля, но они ограничены в видах выводов, которые можно сделать, и дают мало информации о направленном потоке информации. , размер его эффекта и то, как он может измениться со временем. Недавно причинно-следственная связь Грейнджера была применена для решения некоторых из этих проблем с большим успехом. Проще говоря, каждый исследует, как лучше всего предсказать будущее нейрона: используя либо весь ансамбль, либо весь ансамбль, кроме определенного целевого нейрона. Если прогноз ухудшается из-за исключения целевого нейрона, то мы говорим, что он имеет «g-причинную» связь с текущим нейроном.

Расширения для точечных моделей процессов

Предыдущие методы причинности Грейнджера могли работать только с непрерывными данными, поэтому анализ записей последовательности нейронных всплесков включал преобразования, которые в конечном итоге изменяли стохастические свойства данных, косвенно влияя на достоверность выводов, которые можно было сделать из них. Однако в 2011 году была предложена новая универсальная структура причинно-следственной связи Грейнджера, которая могла напрямую работать с любой модальностью, включая цепочки нейронных всплесков.

Данные последовательности нейронных всплесков можно смоделировать как точечный процесс . Временной точечный процесс - это стохастический временной ряд двоичных событий, происходящих в непрерывном времени. Он может принимать только два значения в каждый момент времени, указывая, действительно ли произошло событие. Этот тип двоичного представления информации подходит для активности нейронных популяций, потому что потенциал действия отдельного нейрона имеет типичную форму волны. Таким образом, фактическую информацию, выводимую из нейрона, несет в себе возникновение «всплеска», а также время между последовательными всплесками. Используя этот подход, можно было бы абстрагировать поток информации в нейронной сети, чтобы он был просто временем всплеска для каждого нейрона в течение периода наблюдения. Точечный процесс может быть представлен либо временем самих всплесков, временем ожидания между всплесками, использованием процесса подсчета, либо, если время достаточно дискретно, чтобы гарантировать, что в каждом окне только одно событие имеет возможность произойти, что означает, что один временной интервал может содержать только одно событие в виде набора единиц и нулей, что очень похоже на двоичное.

Одним из простейших типов моделей нейронных всплесков является процесс Пуассона . Однако это ограничено тем, что не требует памяти. Он не учитывает историю всплесков при расчете текущей вероятности срабатывания. Нейроны, однако, демонстрируют фундаментальную (биофизическую) зависимость от истории в виде относительных и абсолютных рефрактерных периодов. Чтобы решить эту проблему, используется функция условной интенсивности, чтобы представить вероятность выброса нейрона, обусловленную его собственной историей. Функция условной интенсивности выражает мгновенную вероятность срабатывания и неявно определяет полную вероятностную модель для точечного процесса. Он определяет вероятность в единицу времени. Таким образом, если эта единица времени выбрана достаточно малой, чтобы гарантировать, что в этом временном окне может произойти только один всплеск, тогда наша функция условной интенсивности полностью определяет вероятность того, что данный нейрон сработает в определенное время.

Смотрите также

использованная литература

дальнейшее чтение