Соответствие оценки склонности - Propensity score matching

В статистическом анализе данных наблюдений , склонность оценки совпадения ( ПСМ ) представляет собой статистический соответствующий метод , что попытки оценить эффект лечения, политики, или другого вмешательства путем учета ковариаций , которые предсказывают , получающих лечение. PSM пытается уменьшить систематическую ошибку из-за мешающих переменных, которые можно найти при оценке эффекта лечения, полученного путем простого сравнения результатов между подразделениями, которые получали лечение, и теми, которые его не получали . Пол Р. Розенбаум и Дональд Рубин представил эту технику в 1983 году.

Возможность систематической ошибки возникает из-за того, что разница в исходе лечения (например, средний эффект лечения ) между леченными и нелеченными группами может быть вызвана фактором, предсказывающим лечение, а не самим лечением. В рандомизированных экспериментах рандомизация позволяет объективно оценивать эффекты лечения; для каждой ковариаты рандомизация подразумевает, что лечебные группы будут сбалансированы в среднем по закону больших чисел . К сожалению, в обсервационных исследованиях назначение лечения субъектам исследования обычно не является случайным. Сопоставление пытается уменьшить систематическую ошибку назначения лечения и имитировать рандомизацию путем создания выборки единиц, получивших лечение, сопоставимых по всем наблюдаемым ковариатам с выборкой единиц, которые не получали лечение.

Например, кому-то может быть интересно узнать о последствиях курения . Требуется обсервационное исследование, поскольку неэтично случайным образом назначать людей для лечения «курение». Эффект лечения, оцениваемый простым сравнением тех, кто курил, с теми, кто не курил, будет зависеть от каких-либо факторов, предсказывающих курение (например, пола и возраста). PSM пытается контролировать эти систематические ошибки, делая группы, получающие лечение и не получавшие лечения, сопоставимыми с контрольными переменными.

Обзор

PSM предназначен для случаев причинно-следственного вывода и простой ошибки отбора в неэкспериментальных условиях, в которых: (i) несколько единиц в группе сравнения без лечения сопоставимы с единицами лечения; и (ii) выбор подмножества блоков сравнения, подобных блоку обработки, затруднен, потому что блоки должны сравниваться по многомерному набору характеристик предварительной обработки.

При нормальном сопоставлении сравниваются отдельные характеристики, которые различают экспериментальную и контрольную группы, чтобы сделать группы более похожими. Но если две группы не имеют существенного совпадения, тогда может быть внесена существенная ошибка . Например, если сравнивать только наихудшие случаи из необработанной «группы сравнения» только с лучшими случаями из экспериментальной группы , результатом может быть регрессия к среднему значению , из-за чего группа сравнения может выглядеть лучше или хуже, чем в действительности.

PSM использует прогнозируемую вероятность членства в группе - например, лечение по сравнению с контрольной группой - на основе наблюдаемых предикторов, обычно получаемых с помощью логистической регрессии, для создания контрфактической группы . Показатели склонности могут использоваться для сопоставления или в качестве ковариат , отдельно или с другими переменными сопоставления или ковариатами.

Общая процедура

1. Выполните логистическую регрессию :

  • Зависимая переменная: Z = 1, если объект участвовал (т.е. является членом группы лечения); Z = 0, если объект не участвовал (т.е. входит в контрольную группу).
  • Выберите подходящие искажающие факторы (переменные, предположительно связанные как с лечением, так и с исходом)
  • Получите оценку для оценки склонности: прогнозируемая вероятность ( p ) или log [ p / (1 -  p )].

2. Убедитесь, что ковариаты сбалансированы по группам лечения и сравнения внутри слоев оценки склонности.

  • Используйте стандартизированные различия или графики для изучения распределений

3. Сопоставьте каждого участника с одним или несколькими неучастниками по оценке склонности, используя один из следующих методов:

  • Соответствие ближайшего соседа
  • Сопоставление штангенциркуля: сравниваемые единицы в пределах определенной ширины оценки склонности обрабатываемых единиц сопоставляются, причем ширина, как правило, составляет часть стандартного отклонения оценки склонности.
  • Метрическое сопоставление Махаланобиса в сочетании с PSM
  • Соответствие стратификации
  • Сопоставление разностей в различиях (ядерные и локальные линейные веса)
  • Точное соответствие

4. Убедитесь, что ковариаты сбалансированы по группам лечения и сравнения в согласованной или взвешенной выборке.

5. Многомерный анализ на основе новой выборки.

  • Используйте анализы, подходящие для независимых сопоставленных выборок, если с каждым участником сопоставлено более одного неучастника.

Примечание. Если у вас есть несколько совпадений для одного обработанного наблюдения, важно использовать взвешенные наименьшие квадраты, а не обычные наименьшие квадраты.

Формальные определения

Базовые настройки

Базовый случай - это два лечения (пронумерованные 1 и 0) с N [независимыми и одинаково распределенными случайными величинами | iid]. Каждый субъект, которым я отвечал на лечение и на контроль, отвечал . Количество , чтобы оценить это средний эффект лечения : . Переменная указывает, получал ли я лечение ( Z  = 1) или контроль ( Z  = 0). Пусть будет вектором наблюдаемого измерения до лечения (или ковариата) для i- го субъекта. Наблюдения проводятся до назначения лечения, но характеристики могут не включать все (или какие-либо) из тех, которые использовались для принятия решения о назначении лечения. Предполагается, что нумерация единиц (т.е. i  = 1, ...,  i  =  N ) не содержит никакой информации, кроме той, которая содержится в . В следующих разделах индекс i будет опущен, но при этом будет продолжено обсуждение стохастического поведения некоторых субъектов.

Совершенно игнорируемое назначение лечения

Пусть у некоторого субъекта есть вектор ковариат X (т. Е. Условно несвязанный) и некоторые потенциальные исходы r 0 и r 1 под контролем и лечением, соответственно. Назначение Лечение называется сильно игнорируемые , если потенциальные результаты являются независимыми от лечения ( Z ) зависимость от фоновых величин X . Это можно записать компактно как

где означает статистическую независимость .

Балансировка

Балансирование оценки б ( Х ) является функцией наблюдаемого ковариата Х таким , что условное распределение по X дано Ь ( X ) является одинаковым для обработанных ( Z  = 1) и контрольных ( Z  = 0) единиц:

Самая тривиальная функция - это .

Оценка склонности

Оценка склонности - это вероятность того, что единице (например, человеку, классу, школе) будет назначено конкретное лечение с учетом набора наблюдаемых ковариат. Оценки предрасположенности используются для уменьшения систематической ошибки отбора путем приравнивания групп на основе этих ковариат.

Предположим , что мы имеем бинарную обработку индикатора Z , переменная отклика г и фона наблюдается ковариатами X . Оценка предрасположенности определяется как условная вероятность лечения с учетом фоновых переменных:

В контексте причинно-следственного вывода и методологии обследования оценки склонности оцениваются (с помощью таких методов, как логистическая регрессия , случайные леса или другие) с использованием некоторого набора ковариат. Эти оценки склонности затем используются в качестве оценок для весов, которые будут использоваться с методами взвешивания обратной вероятности .

Основные теоремы

Следующее было впервые представлено и доказано Розенбаумом и Рубином в 1983 году:

  • Оценка склонности - это балансирующая оценка.
  • Любая оценка, которая «лучше», чем оценка склонности, является уравновешивающей оценкой (т. Е. Для некоторой функции f ). Оценка склонности - это самая грубая функция уравновешивающей оценки, поскольку она берет (возможно) многомерный объект ( X i ) и преобразует его в одно измерение (хотя другие, очевидно, также существуют), в то время как оно является лучшим.
  • Если назначение лечения строго игнорируется с учетом X, тогда:
  • Это также совершенно игнорируется при любой балансировочной функции. В частности, с учетом оценки предрасположенности:
  • При любом значении балансировочного балла, разница между лечебной и контрольной помощью образцов под руку (то есть: ), основанная на предметах , которые имеют то же значение балансировочного счета, может служить в качестве несмещенной оценки от среднего эффекта лечения : .
  • Использование выборочных оценок балансовых баллов может дать выборочный баланс по  X

Отношение к достаточности

Если мы думаем о значении Z в качестве параметра населения , что влияет на распределении X , то балансирование оценки служит достаточной статистикой для Z . Кроме того, приведенные выше теоремы показывают , что оценка Склонность является минимально достаточной статистикой , если думать о Z в качестве параметра X . Наконец, если назначение лечения Z строго игнорируется для данного X, тогда оценка склонности является минимальной достаточной статистикой для совместного распределения .

Графический тест для обнаружения наличия мешающих переменных

Judea Pearl показала, что существует простой графический тест, называемый критерием черного хода, который обнаруживает наличие мешающих переменных. Чтобы оценить эффект лечения, фоновые переменные X должны блокировать все лазейки на графике. Это блокирование может быть выполнено либо путем добавления смешивающей переменной в качестве элемента управления в регрессии, либо путем сопоставления смешивающей переменной.

Недостатки

Было показано, что PSM увеличивает «несбалансированность, неэффективность, зависимость модели и смещение», чего нельзя сказать о большинстве других методов сопоставления. Идеи, лежащие в основе использования сопоставления, все еще актуальны, но должны применяться с другими методами сопоставления; оценки предрасположенности также могут использоваться в других продуктивных целях для взвешивания и оценки с двойной надежностью.

Как и другие процедуры сопоставления, PSM оценивает средний эффект лечения на основе данных наблюдений. Ключевыми преимуществами PSM на момент его внедрения было то, что, используя линейную комбинацию ковариат для одного балла, он уравновешивает группы лечения и контроля по большому количеству ковариат без потери большого количества наблюдений. Если бы единицы в обработке и контроле были сбалансированы по большому количеству ковариат по одному, потребовалось бы большое количество наблюдений, чтобы преодолеть «проблему размерности», посредством которой введение новой балансирующей ковариаты увеличивает минимально необходимое количество наблюдений в образец геометрически .

Одним из недостатков PSM является то, что он учитывает только наблюдаемые (и наблюдаемые) ковариаты, а не скрытые характеристики. Факторы, которые влияют на назначение лечения и результат, но которые нельзя наблюдать, не могут быть учтены в процедуре сопоставления. Поскольку процедура контролирует только наблюдаемые переменные, любое скрытое смещение из-за скрытых переменных может остаться после сопоставления. Другая проблема заключается в том, что для PSM требуются большие выборки со значительным перекрытием между экспериментальной и контрольной группами.

Общие опасения по поводу сопоставления также были высказаны Джудеей Перл , которая утверждала, что скрытая систематическая ошибка может на самом деле увеличиваться, поскольку сопоставление наблюдаемых переменных может вызвать систематическую ошибку из-за бездействующих ненаблюдаемых искажающих факторов. Точно так же Перл утверждал, что снижение систематической ошибки может быть обеспечено (асимптотически) только путем моделирования качественных причинно-следственных связей между лечением, результатом, наблюдаемыми и ненаблюдаемыми ковариатами. Заблуждение возникает, когда экспериментатор не может найти альтернативные, не причинно-следственные объяснения наблюдаемой взаимосвязи между независимыми и зависимыми переменными. Такой контроль должен удовлетворять « черному критерию » Pearl.

Реализации в статистических пакетах

  • R : сопоставление оценок предрасположенности доступно как часть MatchIt пакета. Его также легко реализовать вручную.
  • SAS : процедура PSMatch и OneToManyMTCH наблюдения за макро- соответствием на основе оценки склонности.
  • Stata : несколько команд реализуют сопоставление оценок склонности, в том числе написанные пользователем psmatch2 . Stata версии 13 и более поздних также предлагает встроенную команду teffects psmatch .
  • SPSS : диалоговое окно для сопоставления показателей склонности доступно из меню IBM SPSS Statistics (Сопоставление оценок данных / склонностей) и позволяет пользователю установить допуск совпадения, рандомизировать порядок наблюдений при отборе образцов, установить приоритет точных совпадений, образец с или без замените, установите случайное начальное число и максимизируйте производительность за счет увеличения скорости обработки и минимизации использования памяти. Процедуру FUZZY Python также можно легко добавить в качестве расширения к программному обеспечению через диалоговое окно «Расширения». Эта процедура сопоставляет наблюдения и элементы управления путем использования случайных выборок из элементов управления на основе указанного набора ключевых переменных. Команда FUZZY поддерживает точное и нечеткое соответствие.

Смотрите также

Рекомендации

Библиография