Дизайн разрывов регрессии - Regression discontinuity design

В статистике , эконометрике , политологии , эпидемиологии и смежных дисциплинах план прерывания регрессии (RDD) представляет собой квазиэкспериментальный план до и после тестирования, целью которого является определение причинно-следственных эффектов вмешательств путем определения порогового значения выше или ниже назначается вмешательство. Сравнивая наблюдения, расположенные близко по обе стороны от порога, можно оценить средний эффект лечения в средах, в которых рандомизация невозможна. Однако по-прежнему невозможно сделать истинный причинно-следственный вывод с помощью одного только этого метода, поскольку он не отвергает автоматически причинные эффекты какой-либо потенциальной мешающей переменной. RDD, впервые примененный Дональдом Тистлтуэйтом и Дональдом Кэмпбеллом для оценки стипендиальных программ, в последние годы становится все более популярным. Недавние сравнения рандомизированных контролируемых исследований (РКИ) и RDD эмпирически продемонстрировали внутреннюю валидность дизайна.

Пример

Интуиция, лежащая в основе RDD, хорошо иллюстрируется оценкой стипендий на основе заслуг. Основная проблема с оценкой причинно-следственного эффекта такого вмешательства - это однородность выполнения назначенного лечения (например, присуждение стипендии). Поскольку наиболее успешные студенты с большей вероятностью получат стипендию за заслуги и в то же время продолжат хорошо успевать, сравнение результатов стипендий и нереципиентов приведет к смещению оценок в сторону увеличения. Даже если бы стипендия вообще не улучшала оценки, стипендиаты работали бы лучше, чем не получатели, просто потому, что стипендии предоставлялись студентам, которые хорошо успевали заранее .

Несмотря на отсутствие экспериментального плана , RDD может использовать экзогенные характеристики вмешательства для выявления причинных эффектов . Если всем учащимся выше определенного класса - например, 80% - предоставляется стипендия, можно выявить местный лечебный эффект, сравнивая учащихся с пороговым значением 80%. Интуиция здесь заключается в том, что ученик, набравший 79%, скорее всего, будет очень похож на ученика, набравшего 81% - с учетом заранее определенного порога в 80%. Однако один студент получит стипендию, а другой - нет. Таким образом, сравнение результата получателя (группа лечения) с контрфактическим результатом нереципиента (контрольная группа) обеспечит местный лечебный эффект.

Методология

Два наиболее распространенных подхода к оценке с использованием RDD - это непараметрический и параметрический (обычно полиномиальная регрессия ).

Непараметрическая оценка

Наиболее распространенный непараметрический метод, используемый в контексте СДР, - это локальная линейная регрессия. Это имеет вид:

где - граница обработки, а - двоичная переменная, равная единице, если . Пусть будет пропускная способность используемых данных, у нас есть . Разные уклоны и пересечения соответствуют данным по обе стороны от границы. Обычно используется прямоугольное ядро (без взвешивания) или треугольное ядро. Исследования отдают предпочтение треугольному ядру, но прямоугольное ядро ​​имеет более прямую интерпретацию.

Основным преимуществом использования непараметрических методов в СДР является то, что они предоставляют оценки на основе данных, близких к пороговому значению, что интуитивно привлекательно. Это снижает некоторую погрешность, которая может возникнуть в результате использования данных, находящихся дальше от границы отсечки, для оценки неоднородности в точке отсечки. Более формально предпочтительны локальные линейные регрессии, поскольку они обладают лучшими свойствами смещения и лучшей сходимостью. Однако использование обоих типов оценки, если это возможно, является полезным способом доказать, что оценочные результаты не слишком сильно зависят от конкретного принятого подхода.

Параметрическая оценка

Пример параметрической оценки:

где

и является отсечкой лечения. Обратите внимание, что полиномиальная часть может быть сокращена или расширена в соответствии с потребностями.

Другие примеры

  • Политика, при которой лечение определяется возрастным критерием приемлемости (например, пенсия, минимальный возраст для употребления алкоголя).
  • Выборы, на которых один политик побеждает с незначительным большинством голосов.
  • Очки зачисления в систему образования, которые распределяют студентов по программам лечения.

Необходимые допущения

Дизайн прерывания регрессии требует, чтобы все потенциально значимые переменные, кроме переменной лечения и переменной результата, были непрерывными в точке, где происходят прерывания лечения и исхода. Одним из достаточных, хотя и не обязательных, условий является то, что назначение лечения является «практически случайным» на пороговом уровне для лечения. Если это так, то это гарантирует, что те, кто едва получал лечение, сопоставимы с теми, кто почти не получал лечения, поскольку статус лечения фактически случайный.

Назначение лечения на пороге может быть «практически случайным», если в переменной назначения присутствует случайность и рассматриваемые агенты (отдельные лица, фирмы и т. Д.) Не могут в совершенстве манипулировать своим статусом лечения. Например, предположим, что лечение проходит экзамен, где требуется оценка 50%. В этом случае этот пример является допустимым планом с разрывом регрессии, если оценки являются в некоторой степени случайными из-за случайности оценок или случайности успеваемости учащихся.

Учащиеся также не должны уметь точно управлять своей оценкой, чтобы точно определить статус своего лечения. Два примера включают в себя то, что учащиеся могут убедить учителей «сдать экзамен», или учащимся, которым разрешено пересдавать экзамен, пока они не сдадут. В первом случае те ученики, которые почти не проигрывают, но могут получить «пропуск милосердия», могут отличаться от тех, кто едва терпит неудачу, но не может получить «пропуск милосердия». Это приводит к смещению отбора , так как экспериментальная и контрольная группы теперь различаются. В последнем случае некоторые студенты могут решить пересдать экзамен, остановившись после сдачи. Это также приводит к предвзятости при отборе, поскольку только некоторые студенты решают пересдать экзамен.

Проверка обоснованности предположений

Невозможно окончательно проверить достоверность, если агенты могут точно определить статус своего лечения. Однако некоторые тесты могут предоставить доказательства, которые либо подтверждают, либо опровергают достоверность плана прерывности регрессии.

Тест на плотность

McCrary (2008) тест плотности на данных Lee, Moretti, and Butler (2004).

МакКрари (2008) предложил изучить плотность наблюдений за переменной присваивания. Предположим, имеется разрыв в плотности переменной присваивания на пороге для лечения. В этом случае это может указывать на то, что некоторые агенты смогли идеально манипулировать своим статусом лечения.

Например, если несколько учеников могут получить «пропуск милосердия», то будет больше учеников, которые едва сдали экзамен, чем тех, кто едва не сдал. Аналогичным образом, если студентам разрешено пересдавать экзамен до тех пор, пока они не сдадут экзамен, результат будет аналогичным. В обоих случаях это, скорее всего, проявится при проверке плотности оценок за экзамен. Подобная «игра в систему» ​​может исказить оценку эффекта лечения.

Непрерывность наблюдаемых переменных

Поскольку валидность плана прерывности регрессии зависит от того, чтобы те, кого почти не лечили, были такими же, как и те, кого почти не лечили, имеет смысл проверить, основаны ли эти группы аналогичным образом на наблюдаемых переменных. В предыдущем примере можно было проверить, имеют ли те, кто едва сдал экзамен, другие характеристики (демографические данные, семейный доход и т. Д.), Чем те, кто едва сдал экзамен. Хотя некоторые переменные могут различаться для двух групп на основе случайного совпадения, большинство этих переменных должны быть одинаковыми.

Тесты на фальсификацию

Предопределенные переменные

Подобно непрерывности наблюдаемых переменных, можно было бы ожидать, что будет непрерывность в заранее определенных переменных в момент прекращения лечения. Поскольку эти переменные были определены до принятия решения о лечении, статус лечения не должен влиять на них. Рассмотрим предыдущий пример стипендии, основанной на заслугах. Если интересующий результат - будущие оценки, то мы не ожидаем, что стипендия повлияет на предыдущие оценки. Если разрыв в заранее определенных переменных присутствует в точке отсечения лечения, то это ставит под сомнение обоснованность плана прерывания регрессии.

Другие нарушения непрерывности

Если разрывы присутствуют в других точках переменной присваивания, где они не ожидаются, то это может сделать подозрительным дизайн разрывов регрессии. Рассмотрим пример Карпентера и Добкина (2011), которые изучали влияние легального доступа к алкоголю в Соединенных Штатах. Поскольку доступ к алкоголю увеличивается в возрасте 21 года, это приводит к изменению различных результатов, таких как уровни смертности и заболеваемости. Если показатели смертности и заболеваемости также скачкообразно увеличиваются в других возрастах, то это ставит под сомнение интерпретацию разрыва в возрасте 21 года.

Включение и исключение ковариат

Если оценки параметров чувствительны к удалению или добавлению ковариат в модель, это может поставить под сомнение достоверность плана прерывности регрессии. Значительное изменение может указывать на то, что те, кто почти не лечился, отличаются по этим ковариатам от тех, кто почти не лечился. Включение ковариат частично устранит эту предвзятость. Если присутствует большое количество систематической ошибки, и ковариаты объясняют ее значительную часть, то их включение или исключение существенно изменит оценку параметра.

Недавняя работа показала, как добавлять ковариаты, при каких условиях это допустимо, а также потенциал для повышения точности.

Преимущества

  • При правильном применении и анализе RDD дает объективную оценку местного лечебного эффекта. RDD может быть почти таким же хорошим, как рандомизированный эксперимент по измерению лечебного эффекта.
  • RDD, как квазиэксперимент , не требует предварительной рандомизации и позволяет обойти этические проблемы случайного распределения .
  • Хорошо выполненные RDD-исследования могут генерировать оценки эффекта лечения, аналогичные оценкам рандомизированных исследований.

Недостатки

  • Предполагаемые эффекты являются объективными только в том случае, если функциональная форма взаимосвязи между лечением и результатом правильно смоделирована. Самые популярные предостережения - это нелинейные отношения, которые ошибочно принимают за разрыв.
  • Загрязнение от других методов лечения. Предположим, что другая обработка происходит при том же пороговом значении той же переменной присваивания. В этом случае измеренная нестабильность переменной результата может быть частично отнесена к этому другому лечению. Например, предположим, что исследователь хочет изучить влияние легального доступа к алкоголю на психическое здоровье, используя план прерывания регрессии при минимальном разрешенном возрасте для употребления алкоголя. Измеренное воздействие можно спутать с легальным доступом к азартным играм, который может иметь место в том же возрасте.

Расширения

Нечеткий RDD

Идентификация причинных эффектов шарниров на решающем предположении , что есть на самом деле резкая отсечка, вокруг которого существует разрыв в вероятности назначения от 0 до 1. В действительности, однако, обрезания часто не строго реализованы (например , осуществляется усмотрение для студентов, которые только что не достигли порогового значения), и, следовательно, оценки будут смещенными .

В отличие от плана с резким разрывом регрессии, нечеткий план с разрывом регрессии (FRDD) не требует резкого разрыва в вероятности назначения. Тем не менее, это применимо, если вероятность присвоения различна. Интуиция, лежащая в основе этого, связана со стратегией инструментальной переменной и намерением лечить .

Конструкция регрессионного перегиба

Когда переменная назначения является непрерывной (например, помощь студентам) и предсказуемо зависит от другой наблюдаемой переменной (например, дохода семьи), можно определить эффекты лечения, используя резкие изменения наклона функции лечения. Этот метод был придуман регрессионного Кинк дизайн Нильсен, Соренсен и Табер (2010), хотя они и ссылаются на аналогичные ранее анализы. Они пишут: «Этот подход напоминает идею прерывности регрессии. Вместо разрыва уровня функции стипендия-доход у нас есть разрыв в наклоне функции». Строгие теоретические основы были предоставлены Card et al. (2012) и эмпирическое приложение Bockerman et al. (2018).

Обратите внимание, что перегибы регрессии (или перегибы регрессии ) также могут означать тип сегментированной регрессии , которая представляет собой другой тип анализа.

Заключительные соображения

Дизайн RD принимает форму квазиэкспериментального исследования с четкой структурой, лишенной рандомизированных экспериментальных особенностей. Некоторые аспекты отрицают, что конструкции RD допускают сохранение статус-кво. Например, конструкции часто включают серьезные проблемы, не оставляющие места для случайных экспериментов. Кроме того, дизайн экспериментов зависит от точности процесса моделирования и соотношения между входами и выходами.

Смотрите также

Рекомендации

дальнейшее чтение

Внешние ссылки