Оценка инструментальных переменных - Instrumental variables estimation

В статистике , эконометрике , эпидемиологии и смежных дисциплинах метод инструментальных переменных ( IV ) используется для оценки причинно-следственных связей, когда контролируемые эксперименты неосуществимы или когда лечение не проводится успешно для каждого подразделения в рандомизированном эксперименте. Интуитивно IV используются, когда интересующая независимая переменная коррелирует с ошибкой, и в этом случае обычные методы наименьших квадратов и ANOVA дают предвзятые результаты. Действительный инструмент вызывает изменения в объясняющей переменной, но не оказывает независимого воздействия на зависимую переменную, позволяя исследователю выявить причинный эффект объясняющей переменной на зависимую переменную.

Методы инструментальных переменных позволяют проводить непротиворечивую оценку, когда объясняющие переменные (ковариаты) коррелируют с условиями ошибки в регрессионной модели. Такая корреляция может возникнуть, когда:

  1. изменения в зависимой переменной изменяют значение хотя бы одной из ковариат («обратная» причинность),
  2. Есть опущенные переменные , которые влияют как на зависимые и независимые переменные, или
  3. в ковариаты подлежат неслучайной ошибки измерения .

Объясняющие переменные, которые страдают от одной или нескольких из этих проблем в контексте регрессии, иногда называют эндогенными . В этой ситуации обычный метод наименьших квадратов дает предвзятые и непоследовательные оценки. Однако, если инструмент доступен, согласованные оценки все же могут быть получены. Инструмент - это переменная, которая сама по себе не входит в объясняющее уравнение, но коррелируется с эндогенными объясняющими переменными, при условии, что значения других ковариант.

В линейных моделях есть два основных требования к использованию IV:

  • Инструмент должен быть коррелирован с эндогенными независимыми переменными, при условии, что другие ковариаты. Если эта корреляция сильная, то говорят, что у инструмента сильная первая стадия . Слабая корреляция может привести к ошибочным выводам об оценках параметров и стандартных ошибках.
  • Инструмент не может быть коррелирован с ошибкой в ​​пояснительном уравнении, при условии, что другие ковариаты. Другими словами, инструмент не может иметь тех же проблем, что и исходная прогнозирующая переменная. Если это условие выполняется, считается, что инструмент удовлетворяет ограничению исключения .

Вступление

Концепция инструментальных переменных была впервые получена Филипом Г. Райтом , возможно, в соавторстве с его сыном Сьюоллом Райтом , в контексте одновременных уравнений в его книге 1928 года «Тарифы на животные и растительные масла» . В 1945 году Олав Рейерсол применил тот же подход в контексте моделей ошибок в переменных в своей диссертации, дав этому методу название.

Хотя идеи, лежащие в основе IV, распространяются на широкий класс моделей, очень распространенным контекстом для IV является линейная регрессия. Традиционно инструментальная переменная определяется как переменная Z, которая коррелирована с независимой переменной X и не коррелирована с "членом ошибки" U в линейном уравнении.

вектор. представляет собой матрицу, обычно со столбцом из единиц и, возможно, с дополнительными столбцами для других ковариат. Рассмотрим, как можно восстановить инструмент . Напомним, что OLS решает такие проблемы , что (когда мы минимизируем сумму квадратов ошибок, условие первого порядка является точным .) Если истинная модель считается имеющей место по какой-либо из причин, перечисленных выше, например, если есть опущено переменный , которая влияет как и по отдельности, то это МНК процедура не дает причинное воздействие на . OLS просто выберет параметр, с которым результирующие ошибки кажутся некоррелированными .

Рассмотрим для простоты случай с одной переменной. Предположим, мы рассматриваем регрессию с одной переменной и константой (возможно, никакие другие ковариаты не нужны, или, возможно, мы выделили любые другие соответствующие ковариаты):

В этом случае коэффициент при интересующем регрессоре равен . Замена на дает

где это то, каким был бы оценочный вектор коэффициентов, если бы x не коррелировал с u . В этом случае можно показать, что это объективная оценка If в базовой модели, которую мы считаем, тогда OLS дает коэффициент, который не отражает лежащий в основе причинный эффект, представляющий интерес. IV помогает решить эту проблему, определяя параметры не на основании того, не коррелирован ли с ним , а на основании того, не коррелирован ли с ним другая переменная . Если теория предполагает, что это связано с (первым этапом), но не коррелировано с (ограничением исключения), то IV может определить интересующий причинный параметр, где OLS не работает. Поскольку существует несколько конкретных способов использования и получения оценок IV даже в линейном случае (IV, 2SLS, GMM), мы сохраняем дальнейшее обсуждение для раздела « Оценка » ниже.

Пример

Неформально, в попытке оценить причинный эффект некоторой переменной X на другой Y , инструмент является третьей переменной Z , которая влияет на Y только через его влияние на  X . Например, предположим, что исследователь хочет оценить причинное влияние курения на общее состояние здоровья. Корреляция между здоровьем и курением не означает, что курение вызывает плохое здоровье, потому что другие переменные, такие как депрессия, могут влиять как на здоровье, так и на курение, или потому, что здоровье может влиять на курение. В лучшем случае сложно и дорого проводить контролируемые эксперименты по курению среди населения в целом. Исследователь может попытаться оценить причинное влияние курения на здоровье на основе данных наблюдений, используя ставку налога на табачные изделия в качестве инструмента для курения. Ставка налога на табачные изделия - разумный выбор для инструмента, поскольку исследователь предполагает, что ее можно соотнести со здоровьем только через ее влияние на курение. Если затем исследователь обнаружит, что налоги на табак и состояние здоровья взаимосвязаны, это можно рассматривать как доказательство того, что курение вызывает изменения в здоровье.

Angrist и Krueger (2001) представляют обзор истории и использования методов инструментальных переменных.

Графическое определение

Конечно, методы IV были разработаны среди гораздо более широкого класса нелинейных моделей. Общие определения инструментальных переменных с использованием контрфактического и графического формализма были даны Перлом (Pearl, 2000; p. 248). Графическое определение требует, чтобы Z удовлетворял следующим условиям:

где обозначает d- разделение, а обозначает график, на котором все стрелки, входящие в X , обрезаны.

Контрфактическое определение требует, чтобы Z удовлетворяла

где Y x обозначает значение, которое Y достиг бы, если бы X был x, и обозначает независимость.

Если есть дополнительные ковариаты W , то приведенные выше определения изменяются таким образом , что Z квалифицируется как инструмент , если заданные критерии провести обусловливающие Вт .

Суть определения Перла такова:

  1. Представляющие интерес уравнения являются «структурными», а не «регрессионными».
  2. Термин ошибки U обозначает все внешние факторы, которые влияют на Y, когда X остается постоянным.
  3. Инструмент Z не должен зависеть от U.
  4. Инструмент Z не должен влиять на Y, когда X остается постоянным (ограничение исключения).
  5. Инструмент Z не должен быть независимым от X.

Эти условия не зависят от конкретной функциональной формы уравнений и поэтому применимы к нелинейным уравнениям, где U может быть неаддитивным (см. Непараметрический анализ). Они также применимы к системе множественных уравнений, в которой X (и другие факторы) влияют на Y через несколько промежуточных переменных. Инструментальная переменная не обязательно должна быть причиной X ; также может использоваться указание такой причины, если оно удовлетворяет условиям 1–5. Ограничение исключения (условие 4) является избыточным; это следует из условий 2 и 3.

Выбор подходящих инструментов

Поскольку U не наблюдается, требование, чтобы Z не зависело от U, не может быть выведено из данных и вместо этого должно быть определено из структуры модели, то есть процесса генерации данных. Причинно графики являются представлением этой структуры, а также графическое определение , данное выше , можно использовать , чтобы быстро определить , является ли переменная а Z квалифицируется как инструментальной переменной задано множество ковариатами W . Чтобы увидеть, как это сделать, рассмотрим следующий пример.

Предположим, что мы хотим оценить влияние программы репетиторства в университете на средний балл . Взаимосвязь между посещением программы репетиторства и средним баллом может быть нарушена рядом факторов. Учащиеся, посещающие программу репетиторства, могут больше заботиться о своих оценках или могут испытывать трудности с работой. Это смешение показано на рисунках 1–3 справа через двунаправленную дугу между программой наставничества и средним баллом успеваемости. Если студентов распределяют по общежитиям наугад, близость студенческого общежития к программе репетиторства является естественным кандидатом на роль инструментальной переменной.

Однако что, если программа репетиторства находится в библиотеке колледжа? В этом случае близость может также побудить студентов проводить больше времени в библиотеке, что, в свою очередь, улучшает их средний балл (см. Рисунок 1). Используя причинно-следственный граф, изображенный на рисунке 2, мы видим, что Proximity не квалифицируется как инструментальная переменная, потому что она связана с GPA через путь Proximity Library Hours GPA in . Однако, если мы контролируем часы работы библиотеки, добавляя их в качестве ковариаты, то Proximity становится инструментальной переменной, поскольку Proximity отделяется от GPA с учетом часов библиотеки в .

Теперь предположим, что мы замечаем, что «естественные способности» студента влияют на его или ее количество часов в библиотеке, а также на его или ее средний балл, как показано на рисунке 3. Используя причинно-следственный график, мы видим, что количество часов библиотеки является коллайдером и кондиционирование по нему открывает путь Proximity Library Hours GPA. В результате близость не может использоваться в качестве инструментальной переменной.

Наконец, предположим, что часы работы библиотеки на самом деле не влияют на средний балл, потому что студенты, которые не учатся в библиотеке, просто учатся в другом месте, как показано на рисунке 4. В этом случае контроль часов библиотеки по-прежнему открывает ложный путь от близости к среднему баллу. Однако, если мы не контролируем часы работы библиотеки и удаляем его как ковариату, то Proximity снова можно использовать в качестве инструментальной переменной.

Предварительный расчет

Теперь мы вернемся к механике IV и более подробно остановимся на ней. Предположим, данные генерируются процессом формы

куда

  • я индексирую наблюдения,
  • является i -м значением зависимой переменной,
  • - вектор i -ых значений независимой (ых) переменной (ей) и константы,
  • является i -м значением ненаблюдаемого члена ошибки, представляющего все причины, кроме , и
  • - ненаблюдаемый вектор параметров.

Вектор параметров - это причинное воздействие на одну единицу изменения каждого элемента, при этом все остальные причины остаются постоянными. Эконометрическая цель - оценить . Для простоты предположим, что значения e некоррелированы и взяты из распределений с одинаковой дисперсией (т. Е. Что ошибки последовательно некоррелированы и гомоскедастичны ).

Предположим также, что предлагается регрессионная модель номинально такой же формы. Учитывая случайную выборку T наблюдений в результате этого процесса, обычная оценка методом наименьших квадратов имеет вид

где Х , Y и е векторы - столбцы обозначают длины T . Это уравнение аналогично уравнению во введении (это матричная версия этого уравнения). Когда Х и е являются некоррелированными , при определенных условиях регулярности второго член имеет ожидаемое значение в зависимость X от нуля и сходится к нулю в пределе, так что оценка является несмещенной и последовательной. Когда X и другие неизмеряемые, причинные переменные, свернутые в член е , коррелируются, однако, оценка МНК обычно смещена и непоследовательна для  β . В этом случае допустимо использовать оценки для прогнозирования значений y при заданных значениях X , но оценка не восстанавливает причинное влияние X на  y .

Чтобы восстановить базовый параметр , мы вводим набор переменных Z, который сильно коррелирует с каждым эндогенным компонентом X, но (в нашей базовой модели) не коррелирует с  e . Для простоты можно рассматривать X как матрицу T × 2, состоящую из столбца констант и одной эндогенной переменной, а Z как T × 2, состоящую из столбца констант и одной инструментальной переменной. Однако этот метод обобщается на X, являющийся матрицей констант и, скажем, 5 эндогенных переменных, при этом Z - это матрица, состоящая из константы и 5 инструментов. В последующем обсуждении мы будем предполагать, что X является матрицей T × K, и оставим это значение K неопределенным. Оценщик, в котором X и Z обе являются матрицами T × K, называется только что идентифицированной .

Предположим, что взаимосвязь между каждым эндогенным компонентом x i и инструментами определяется выражением

Наиболее распространенная спецификация IV использует следующую оценку:

Эта спецификация приближается к истинному параметру по мере увеличения выборки, пока в истинной модели:

Пока в базовом процессе, который генерирует данные, соответствующее использование оценщика IV будет определять этот параметр. Это работает, потому что IV вычисляет уникальный параметр, который удовлетворяет , и, следовательно, оттачивает истинный базовый параметр по мере роста размера выборки.

Теперь расширение: предположим , что есть больше инструментов , чем есть ковариат в уравнении интерес, так что Z является T × M матрица с M> K . Это часто называют сверхидентифицированным случаем. В этом случае можно использовать обобщенный метод моментов (ОММ). Оценка GMM IV:

где относится к матрице проекции .

Это выражение сворачивается к первому, когда количество инструментов равно количеству ковариат в интересующем уравнении. Таким образом, чрезмерно идентифицированная IV является обобщением только что идентифицированной IV.

Доказательство того, что β GMM коллапсирует до β IV в только что указанном случае.

Развитие выражения:

В только идентифицированной случае, у нас есть так много инструментов , как ковариат, так что размерность X такое же , как и  Z . Следовательно, и - все квадратные матрицы одной размерности. Мы можем расширить обратные, используя тот факт , что для любого обратимого п матрицы с размерностью п матриц A и B , ( AB ) -1 = B -1 A -1 (см обратимой матрицы # Свойства ):

Ссылка: см. Davidson and Mackinnnon (1993).

Существует эквивалентная недоидентифицированная оценка для случая, когда m <k . Поскольку параметры являются решениями набора линейных уравнений, недоидентифицированная модель, использующая набор уравнений , не имеет единственного решения.

Интерпретация как двухэтапный метод наименьших квадратов

Одним из вычислительных методов, который можно использовать для расчета оценок IV, является двухэтапный метод наименьших квадратов (2SLS или TSLS). На первом этапе каждая независимая переменная, которая является эндогенной ковариатой в интересующем уравнении, подвергается регрессии по всем экзогенным переменным в модели, включая как экзогенные ковариаты в интересующем уравнении, так и исключенные инструменты. Прогнозируемые значения из этих регрессий получены:

Этап 1: регрессируйте каждый столбец X на Z , ( ):

и сохраните прогнозируемые значения:

На втором этапе интересующая регрессия оценивается как обычно, за исключением того, что на этом этапе каждая эндогенная ковариата заменяется предсказанными значениями из первого этапа:

Этап 2: Регресс Y по прогнозируемым значениям из первого этапа:

который дает

Этот метод действителен только в линейных моделях. Для категориальных эндогенных ковариат может возникнуть соблазн использовать первый этап, отличный от обычного метода наименьших квадратов, например, пробит-модель для первого этапа, за которым следует МНК для второго. Это широко известно в эконометрической литературе как запрещенная регрессия , поскольку оценки параметров IV второго этапа согласованы только в особых случаях.

Доказательство: вычисление оценки 2SLS.

Обычная МНК - оценка является: . Заменив и отметив, что это симметричная и идемпотентная матрица, так что

Результирующая оценка численно идентична приведенному выше выражению. Небольшая поправка должна быть сделана в сумму квадратов остатков в подобранной модели второго этапа, чтобы ковариационная матрица рассчитывалась правильно.

Непараметрический анализ

Когда форма структурных уравнений неизвестна, инструментальная переменная все еще может быть определена с помощью уравнений:

где и - две произвольные функции и не зависит от . Однако, в отличие от линейных моделей, измерения и не позволяют идентифицировать средний причинный эффект включения , обозначаемый ACE

Balke и Pearl [1997] получили жесткие границы для ACE и показали, что они могут предоставить ценную информацию о знаке и размере ACE.

В линейном анализе нет теста, чтобы опровергнуть предположение, что это инструментальная пара . Это не тот случай, когда дискретный. Перл (2000) показал, что для всех и следующее ограничение, называемое «инструментальным неравенством», должно выполняться всякий раз, когда удовлетворяет двум приведенным выше уравнениям:

Интерпретация при неоднородности эффекта лечения

Изложение выше предполагает, что интересующий причинный эффект не меняется в зависимости от наблюдений, то есть является постоянным. Как правило, разные субъекты по-разному реагируют на изменения в «лечении» x . Когда эта возможность признается, средний эффект изменения x на y в популяции может отличаться от эффекта в данной подгруппе населения. Например, средний эффект программы профессионального обучения может существенно различаться для группы людей, которые фактически проходят обучение, и для группы, которая решает не проходить обучение. По этим причинам методы IV используют неявные предположения о поведенческой реакции или, в более общем плане, предположения о корреляции между реакцией на лечение и склонностью к лечению.

Стандартная оценка IV может восстановить местные средние эффекты лечения (LATE), а не средние эффекты лечения (ATE). Имбенс и Ангрист (1994) демонстрируют, что линейная оценка IV может быть интерпретирована в слабых условиях как средневзвешенное значение местных средних эффектов лечения, где веса зависят от эластичности эндогенного регрессора к изменениям инструментальных переменных. Грубо говоря, это означает, что влияние переменной выявляется только для субпопуляций, на которые влияют наблюдаемые изменения в инструментах, и что субпопуляции, которые больше всего реагируют на изменения в инструментах, будут иметь наибольшее влияние на величину оценки IV.

Например, если исследователь использует наличие колледжа, предоставившего землю, в качестве инструмента для получения высшего образования в регрессии доходов, он определяет влияние колледжа на заработки в подгруппе населения, которая получила бы высшее образование, если бы колледж присутствует, но которая могла бы не получить степень, если колледж отсутствует. Этот эмпирический подход без дополнительных предположений ничего не говорит исследователю о влиянии колледжа на людей, которые либо всегда, либо никогда не получат диплом о высшем образовании, независимо от того, существует ли местный колледж.

Проблема слабых инструментов

Как отмечают Баунд, Джегер и Бейкер (1995), проблема вызвана выбором «слабых» инструментов, инструментов, которые являются плохими предикторами предиктора эндогенного вопроса в уравнении первой стадии. В этом случае инструмент прогнозирования вопроса будет плохим, и прогнозируемые значения будут иметь очень небольшие вариации. Следовательно, они вряд ли добьются большого успеха в прогнозировании окончательного результата, если они используются для замены предиктора вопроса в уравнении второго этапа.

В контексте примера курения и здоровья, обсужденного выше, налоги на табак являются слабым инструментом для борьбы с курением, если статус курения в значительной степени не реагирует на изменения в налогах. Если более высокие налоги не побуждают людей бросить курить (или не начать курить), то изменение налоговых ставок ничего не говорит нам о влиянии курения на здоровье. Если налоги влияют на здоровье по другим каналам, а не через их влияние на курение, тогда инструменты недействительны, и подход с использованием инструментальных переменных может привести к ошибочным результатам. Например, места и время с относительно заботящимся о своем здоровье населением могут как вводить высокие налоги на табак, так и демонстрировать лучшее здоровье, даже при сохранении постоянного уровня курения, поэтому мы наблюдали бы корреляцию между налогами на здоровье и табак, даже если бы курение не имело никакого эффекта. на здоровье. В этом случае мы ошибемся, если предположим, что курение влияет на здоровье, исходя из наблюдаемой корреляции между налогами на табак и здоровьем.

Тестирование слабых инструментов

Сила инструментов может быть непосредственно оценена, потому что и эндогенные ковариаты, и инструменты наблюдаемы. Общее практическое правило для моделей с одним эндогенным регрессором: F-статистика против нуля, что исключенные инструменты не имеют отношения к регрессии на первом этапе, должна быть больше 10.

Статистический вывод и проверка гипотез

Когда ковариаты являются экзогенными, малые выборки свойства МНК - оценки могут быть получены простым способом путем вычисления моментов оценивани обусловливающие X . Когда некоторые из ковариат являются эндогенными, так что выполняется оценка инструментальных переменных, простые выражения для моментов оценщика не могут быть получены таким образом. Как правило, оценщики инструментальных переменных имеют только желаемые асимптотические, а не конечные выборочные свойства, и вывод основан на асимптотических приближениях к выборочному распределению оценщика. Даже когда инструменты не коррелируют с ошибкой в ​​интересующем уравнении и когда инструменты не слабые, свойства конечной выборки оценщика инструментальных переменных могут быть плохими. Например, точно идентифицированные модели создают конечные выборочные оценки без моментов, поэтому можно сказать, что оценка не является ни смещенной, ни несмещенной, номинальный размер тестовой статистики может быть существенно искажен, а оценки обычно могут быть далеки от истинного значения. параметра.

Проверка ограничения исключения

Предположение о том, что инструменты не коррелированы с ошибкой в ​​интересующем уравнении, не может быть проверено в точно идентифицированных моделях. Если модель переопределена, имеется информация, которая может быть использована для проверки этого предположения. Наиболее распространенный тест этих ограничений сверхидентификации , называемый тестом Саргана – Хансена , основан на наблюдении, что остатки не должны коррелировать с набором экзогенных переменных, если инструменты действительно экзогенные. Статистику теста Саргана – Хансена можно рассчитать как (количество наблюдений, умноженное на коэффициент детерминации ) из регрессии остатков по методу наименьших квадратов на набор экзогенных переменных. Эта статистика будет асимптотически хи-квадрат с m  -  k степенями свободы при нулевом значении, когда ошибка не коррелирует с инструментами.

Применение к моделям со случайными и фиксированными эффектами

В стандартных моделях случайных эффектов (RE) и фиксированных эффектов (FE) для панельных данных предполагается, что независимые переменные не коррелируют с членами ошибки. При наличии действительных инструментов методы RE и FE распространяются на случай, когда некоторым независимым переменным разрешено быть эндогенными. Как и во внешних условиях, модель RE с инструментальными переменными (REIV) требует более строгих допущений, чем модель FE с инструментальными переменными (FEIV), но она имеет тенденцию быть более эффективной при соответствующих условиях.

Чтобы исправить идеи, рассмотрите следующую модель:

где - это ненаблюдаемый неизменяющийся во времени эффект, зависящий от единицы (назовем его ненаблюдаемым эффектом), и может быть коррелирован с for s, возможно, отличным от t . Предположим, существует набор действительных инструментов .

При настройке REIV, основные допущения включают , что является коррелируют с , а также для . Фактически, для того, чтобы оценка REIV была эффективной, необходимы условия более сильные, чем некоррелированность между инструментами и ненаблюдаемый эффект.

С другой стороны, FeIV оценщик только требует , чтобы инструменты экзогенными с точки зрения ошибок после кондиционирования на ненаблюдаемой эффект т.е. . Условие FEIV допускает произвольную корреляцию между инструментами и ненаблюдаемым эффектом. Однако эта общность не дается даром: не допускаются инвариантные во времени объясняющие и инструментальные переменные. Как и в обычном методе FE, оценщик использует ограниченные по времени переменные, чтобы удалить ненаблюдаемый эффект. Следовательно, оценка FEIV будет иметь ограниченное применение, если интересующие переменные будут включать переменные, не зависящие от времени.

Вышеупомянутое обсуждение аналогично экзогенному случаю моделей RE и FE. В экзогенном случае RE предполагает некоррелированность между независимыми переменными и ненаблюдаемым эффектом, а FE допускает произвольную корреляцию между ними. Подобно стандартному случаю, REIV имеет тенденцию быть более эффективным, чем FEIV, при условии, что выполняются соответствующие допущения.

Смотрите также

использованная литература

дальнейшее чтение

Библиография

  • Вулдридж, Дж. (1997): Методы квази-правдоподобия для подсчета данных, Справочник по прикладной эконометрике, том 2, изд. MH Pesaran and P. Schmidt, Oxford, Blackwell, стр. 352–406.
  • Терца, СП (1998): «Оценка моделей подсчета с эндогенным переключением: отбор образцов и эндогенные эффекты лечения». Journal of Econometrics (84), стр. 129–154.
  • Вулдридж, Дж. (2002): «Эконометрический анализ поперечных сечений и панельных данных», MIT Press , Кембридж, Массачусетс.

внешние ссылки