Причинный вывод - Causal inference

Причинно-следственный вывод - это процесс определения независимого фактического воздействия определенного явления, которое является компонентом более крупной системы. Основное различие между причинным выводом и выводом ассоциации состоит в том, что причинный вывод анализирует реакцию переменной эффекта, когда причина переменной эффекта изменяется. Наука о том, почему что-то происходит, называется этиологией . Говорят, что причинный вывод обеспечивает доказательство причинности, теоретизируемой с помощью причинных рассуждений .

Причинный вывод широко изучается во всех науках. Несколько нововведений в разработке и внедрении методологии, предназначенной для определения причинно-следственной связи, получили распространение в последние десятилетия. Причинный вывод остается особенно трудным там, где экспериментирование затруднено или невозможно, что является обычным явлением для большинства наук.

Подходы к причинному выводу широко применимы во всех типах научных дисциплин, и многие методы причинного вывода, которые были разработаны для определенных дисциплин, нашли применение и в других дисциплинах. В этой статье описывается основной процесс, лежащий в основе причинно-следственного вывода, и подробно описываются некоторые из наиболее традиционных тестов, используемых в различных дисциплинах; однако это не следует принимать за предположение, что эти методы применимы только к этим дисциплинам, а просто потому, что они наиболее часто используются в этой дисциплине.

Причинный вывод сложно сделать, и среди ученых ведутся серьезные споры о правильном способе определения причинности. Несмотря на другие нововведения, сохраняются опасения по поводу неправильной атрибуции учеными корреляционных результатов как причинных, использования учеными неправильных методологий и преднамеренного манипулирования учеными аналитическими результатами с целью получения статистически значимых оценок. Особое беспокойство вызывает использование регрессионных моделей, особенно линейных регрессионных моделей.

Определение

Выявление причины чего-либо было описано как:

  • «... рассуждения [в] к заключению, что что-то является или может быть причиной чего-то еще».
  • «Идентификация причины или причин явления путем установления ковариации причины и следствия, взаимосвязи во времени с причиной, предшествующей следствию, и устранения вероятных альтернативных причин».

Методология

Общий

Причинно-следственный вывод осуществляется путем изучения систем, в которых предполагается, что мера одной переменной влияет на меру другой. Причинно-следственный вывод делается с учетом научного метода . Первым шагом причинно-следственного вывода является формулировка фальсифицируемой нулевой гипотезы , которая впоследствии проверяется статистическими методами . Статистический вывод Frequentist - это использование статистических методов для определения вероятности того, что данные возникают при нулевой гипотезе случайно: байесовский вывод используется для определения эффекта независимой переменной. Статистический вывод в целом используется для определения разницы между вариациями исходных данных, которые являются случайными вариациями, или эффектом четко определенного причинного механизма. Примечательно, что корреляция не подразумевает причинно-следственную связь , поэтому изучение причинности связано с изучением потенциальных причинных механизмов как с изменением данных. Часто востребованный стандарт причинного вывода - это эксперимент, в котором лечение назначается случайным образом, но все другие смешивающие факторы остаются неизменными. Большинство попыток причинно-следственного вывода предпринимаются в попытках воспроизвести экспериментальные условия.

В эпидемиологических исследованиях используются разные эпидемиологические методы сбора и измерения доказательств факторов риска и их воздействия, а также различные способы измерения связи между ними. Результаты обзора методов причинно-следственного вывода, проведенного в 2020 году, показали, что использование существующей литературы для программ клинической подготовки может быть сложной задачей. Это связано с тем, что опубликованные статьи часто предполагают продвинутую техническую подготовку, они могут быть написаны с разных статистических, эпидемиологических, компьютерных или философских точек зрения, методологические подходы продолжают быстро расширяться, а многие аспекты причинного вывода получают ограниченное освещение.

Обычными каркасами для причинного вывода являются моделирование структурными уравнениями и причинная модель Рубина .

Экспериментальный

Экспериментальная проверка причинных механизмов возможна с помощью экспериментальных методов. Основная мотивация эксперимента состоит в том, чтобы поддерживать постоянными другие экспериментальные переменные при целенаправленном манипулировании интересующей переменной. Если эксперимент дает статистически значимые эффекты в результате манипулирования только переменной лечения, есть основания полагать, что причинно-следственный эффект может быть отнесен к переменной лечения, предполагая, что были соблюдены другие стандарты дизайна эксперимента.

Квазиэкспериментальный

Квазиэкспериментальная проверка причинных механизмов проводится, когда традиционные экспериментальные методы недоступны. Это может быть результатом непомерно высоких затрат на проведение эксперимента или неотъемлемой неосуществимости проведения эксперимента, особенно экспериментов, которые связаны с большими системами, такими как экономика избирательных систем, или лечения, которое, как считается, представляет опасность для колодца. -бытие подопытных. Квазиэксперименты также могут иметь место, когда информация не разглашается по юридическим причинам.

Подходы в эпидемиологии

Эпидемиология изучает паттерны здоровья и болезней в определенных популяциях живых существ , чтобы сделать выводы о причинах и следствиях. Связь между воздействием предполагаемого фактора риска и заболеванием может наводить на размышления, но не эквивалентна причинно-следственной связи, поскольку корреляция не подразумевает причинной связи . Исторически постулаты Коха использовались с XIX века для определения того, был ли микроорганизм причиной заболевания. В 20-м веке критерии Брэдфорд-Хилла , описанные в 1965 году, использовались для оценки причинной связи переменных вне микробиологии, хотя даже эти критерии не являются исключительными способами определения причинной связи.

В молекулярной эпидемиологии изучаемые явления находятся на уровне молекулярной биологии , включая генетику, где биомаркеры являются свидетельством причины или следствия.

Недавняя тенденция заключается в выявлении доказательств влияния воздействия на молекулярную патологию в пораженной ткани или клетках в возникающей междисциплинарной области молекулярной патологической эпидемиологии (MPE). Связывание воздействия с молекулярными патологическими признаками заболевания может помочь оценить причинно-следственную связь. Учитывая неотъемлемую природу гетерогенности данного заболевания, принцип уникальности болезни, фенотипирование и подтипирование болезни являются тенденциями в биомедицинских науках и науках об общественном здравоохранении , примерами которых являются персонализированная медицина и точная медицина .

Подходы в информатике

Определение причины и следствия на основе совместных данных наблюдений для двух переменных, не зависящих от времени, скажем X и Y, решалось с использованием асимметрии между свидетельствами для некоторой модели в направлениях X → Y и Y → X. Основные подходы основаны на алгоритмических методах. модели теории информации и модели шума.

Шумовые модели

Включите в модель независимый шумовой член, чтобы сравнить свидетельства двух направлений.

Вот некоторые из моделей шума для гипотезы Y → X с шумом E:

  • Аддитивный шум:
  • Линейный шум:
  • Постнелинейный:
  • Гетероскедастический шум:
  • Функциональный шум:

Общие допущения в этих моделях:

  • Других причин Y.
  • X и E не имеют общих причин.
  • Распространение причин не зависит от причинных механизмов.

На интуитивном уровне идея состоит в том, что факторизация совместного распределения P (Причина, Следствие) в P (Причина) * P (Эффект | Причина) обычно дает модели более низкой общей сложности, чем факторизация в P (Эффект) * P (Причина | Следствие). Хотя понятие «сложность» интуитивно привлекательно, неясно, как его следует точно определить. Другое семейство методов пытается обнаружить причинные «следы» на больших объемах помеченных данных и позволяет прогнозировать более гибкие причинные связи.

Подходы в социальных науках

Социальная наука

Социальные науки в целом все больше переходят к включению количественных рамок для оценки причинности. Многое из этого было описано как средство придания большей строгости методологии социальных наук. На политологию значительное влияние оказала публикация « Designing Social Inquiry » Гэри Кинга, Роберта Кеохана и Сиднея Вербы в 1994 году. Кинг, Кеохейн и Верба рекомендуют исследователям применять как количественные, так и качественные методы и использовать язык статистических выводов. быть более ясными в отношении интересующих их предметов и единиц анализа. Сторонники количественных методов также все чаще применяют схему потенциальных результатов , разработанную Дональдом Рубином , в качестве стандарта для вывода причинно-следственной связи.

В то время как значительный упор по-прежнему делается на статистический вывод в структуре потенциальных результатов, методологи в области социальных наук разработали новые инструменты для проведения причинно-следственных выводов с использованием как качественных, так и количественных методов, иногда называемых подходом «смешанных методов». Сторонники различных методологических подходов утверждают, что разные методологии лучше подходят для разных предметов исследования. Социолог Герберт Смит и политологи Джеймс Махони и Гэри Герц процитировали наблюдение Пола Холланда, статистика и автора статьи 1986 года «Статистика и причинный вывод», о том, что статистический вывод наиболее подходит для оценки «следствий причин», а не «причины следствий». Качественные методологи утверждали, что формализованные модели причинно-следственной связи, включая отслеживание процессов и теорию нечетких множеств , предоставляют возможности для вывода причинно-следственной связи посредством выявления критических факторов в тематических исследованиях или посредством процесса сравнения нескольких тематических исследований. Эти методологии также ценны для субъектов, в которых ограниченное количество потенциальных наблюдений или наличие мешающих переменных ограничивают применимость статистического вывода.

Экономика и политология

В экономических и политических науках причинно-следственный вывод часто затруднен из-за сложности реальных экономических и политических реалий и невозможности воссоздать многие крупномасштабные явления в рамках контролируемых экспериментов. Причинный вывод в экономических и политических науках продолжает улучшаться в методологии и строгости из-за повышения уровня технологий, доступных социологам, увеличения числа социологов и исследований, а также усовершенствований методологий причинного вывода во всех социальных науках.

Несмотря на трудности, присущие определению причинно-следственной связи в экономических системах, в этих областях существует несколько широко используемых методов.

Теоретические методы

Экономисты и политологи могут использовать теорию (часто изучаемую с помощью эконометрики, основанной на теории) для оценки величины предположительно причинно-следственных связей в тех случаях, когда они считают, что причинно-следственная связь существует. Теоретики могут предположить механизм, который считается причинным, и описать эффекты, используя анализ данных, чтобы обосновать свою предложенную теорию. Например, теоретики могут использовать логику для построения модели, например, предполагая, что дождь вызывает колебания экономической производительности, но обратное неверно. Тем не менее, использование чисто теоретических утверждений, не предлагающих никаких предсказаний, было названо «донаучным», потому что нет возможности предсказать влияние предполагаемых причинных свойств. Стоит повторить, что регрессионный анализ в социальных науках по своей сути не подразумевает причинно-следственную связь, поскольку многие явления могут коррелировать в краткосрочной перспективе или в определенных наборах данных, но не демонстрируют корреляции в другие периоды времени или другие наборы данных. Таким образом, приписывание причинности коррелятивным свойствам преждевременно, поскольку отсутствует четко определенный и аргументированный причинный механизм.

Инструментальные переменные

Метод инструментальных переменных (IV) - это метод определения причинной связи, который включает устранение корреляции между одной из объясняющих переменных модели и членом ошибки модели. Здесь полагают, что, если член ошибки модели идет рука об руку с изменением другой переменной, то член ошибки модели, вероятно, является результатом изменения этой объясняющей переменной. Устранение этой корреляции путем введения новой инструментальной переменной, таким образом, уменьшает ошибку, присутствующую в модели в целом.

Спецификация модели

Спецификация модели - это акт выбора модели, которая будет использоваться при анализе данных. Социологи (да и вообще все ученые) должны определить правильную модель для использования, потому что разные модели хороши для оценки разных отношений.

Спецификация модели может быть полезна при определении медленно возникающей причинно-следственной связи, когда последствия действия в один период ощущаются только в более поздний период. Стоит помнить, что корреляции измеряют только то, имеют ли две переменные одинаковую дисперсию, а не влияют ли они друг на друга в определенном направлении; таким образом, нельзя определить направление причинной связи, основываясь только на корреляциях. Поскольку считается, что причинные действия предшествуют причинным эффектам, социологи могут использовать модель, которая специально ищет влияние одной переменной на другую в течение определенного периода времени. Это приводит к использованию переменных, представляющих явления, происходящие ранее, как эффекты лечения, где эконометрические тесты используются для поиска более поздних изменений в данных, которые приписываются эффекту таких эффектов лечения, где значимая разница в результатах после значимой разницы в эффектах лечения. может указывать на причинно-следственную связь между эффектами лечения и измеряемыми эффектами (например, тесты причинно-следственной связи Грейнджера). Такие исследования являются примерами анализа временных рядов .

Анализ чувствительности

Другие переменные или регрессоры в регрессионном анализе либо включаются, либо не включаются в различные реализации одной и той же модели, чтобы гарантировать, что различные источники вариаций можно изучать отдельно друг от друга. Это форма анализа чувствительности: это исследование того, насколько чувствительна реализация модели к добавлению одной или нескольких новых переменных.

Основным мотивирующим фактором при использовании анализа чувствительности является стремление обнаружить смешивающие переменные . Смешивающие переменные - это переменные, которые имеют большое влияние на результаты статистического теста, но не являются той переменной, которую пытается изучить причинный вывод. Смешивающие переменные могут привести к тому, что регрессор будет казаться значимым в одной реализации, но не в другой.

Мультиколлинеарность

Другой причиной использования анализа чувствительности является обнаружение мультиколлинеарности . Мультиколлинеарность - это явление, при котором корреляция между двумя переменными очень высока. Высокий уровень корреляции между двумя переменными может резко повлиять на результат статистического анализа, где небольшие вариации в сильно коррелированных данных могут изменить влияние переменной с положительного направления на отрицательное или наоборот. Это неотъемлемое свойство дисперсионного тестирования. Определение мультиколлинеарности полезно при анализе чувствительности, потому что устранение сильно коррелированных переменных в различных реализациях модели может предотвратить резкие изменения в результатах, которые возникают в результате включения таких переменных.

Однако есть пределы способности анализа чувствительности предотвращать пагубные последствия мультиколлинеарности, особенно в социальных науках, где системы сложны. Поскольку теоретически невозможно включить или даже измерить все смешивающие факторы в достаточно сложной системе, эконометрические модели подвержены ошибке общей причины, когда причинные эффекты неправильно приписываются неправильной переменной, потому что правильная переменная не была отражена в исходные данные. Это пример неспособности учесть скрытую переменную .

Эконометрика на основе дизайна

В последнее время усовершенствованная методология эконометрики, основанной на дизайне, привела к популяризации использования как естественных экспериментов, так и квазиэкспериментальных исследовательских планов для изучения причинных механизмов, которые, как считается, идентифицируются такими экспериментами.

Злоупотребление служебным положением в причинно-следственном выводе

Несмотря на успехи в разработке методологий, используемых для определения причинно-следственной связи, остаются существенные недостатки в определении причинно-следственной связи. Эти недостатки можно отнести как к изначальной сложности определения причинно-следственных связей в сложных системах, так и к случаям научной халатности.

Помимо трудностей причинного вывода, среди некоторых больших групп социологов существует представление о том, что большое количество ученых в области социальных наук занимаются ненаучной методологией. Критика экономистов и социологов, выдающих описательные исследования за причинно-следственные связи, широко распространена в этих областях.

Научная халатность и ошибочная методология

В естественных науках, особенно в социальных, среди ученых есть опасения, что научная халатность широко распространена. Поскольку научное исследование - это обширная тема, существует теоретически неограниченное количество способов подорвать причинный вывод не по вине исследователя. Тем не менее, ученые по-прежнему обеспокоены тем, что большое количество исследователей не выполняют основные обязанности или не применяют достаточно разнообразные методы для причинного вывода.

Одним из ярких примеров общей непричинной методологии является ошибочное предположение о коррелятивных свойствах как о каузальных свойствах. Феноменонам, которые коррелируют, не присуща причинность. Регрессионные модели предназначены для измерения дисперсии данных по сравнению с теоретической моделью: нет ничего, что указывало бы на то, что данные, которые представляют высокие уровни ковариации, имеют какую-либо значимую взаимосвязь (при отсутствии предлагаемого причинно-следственного механизма с прогностическими свойствами или случайного назначения лечения). Было заявлено, что использование некорректной методологии широко распространено, и типичными примерами такой злоупотребления служебным положением является чрезмерное использование корреляционных моделей, особенно чрезмерное использование регрессионных моделей и, в частности, моделей линейной регрессии. Предположение о том, что два коррелированных феномена изначально связаны, является логической ошибкой, известной как ложная корреляция . Некоторые социологи утверждают, что широкое использование методологии, которая приписывает причинность ложным корреляциям, нанесло ущерб целостности социальных наук, хотя были отмечены улучшения, вытекающие из более совершенных методологий.

Потенциальный эффект научных исследований, которые ошибочно объединяют корреляцию с причинностью, заключается в увеличении количества научных открытий, результаты которых не могут быть воспроизведены третьими сторонами. Такая невоспроизводимость является логическим следствием выводов о том, что корреляция только временно чрезмерно обобщается в механизмы, которые не имеют внутренней взаимосвязи, где новые данные не содержат предыдущих идиосинкразических корреляций исходных данных. Продолжаются споры о влиянии злоупотреблений служебным положением на влияние присущих им трудностей поиска причинно-следственной связи. Критики широко применяемых методологий утверждают, что исследователи использовали статистические манипуляции для публикации статей, которые якобы демонстрируют доказательства причинной связи, но на самом деле являются примерами ложной корреляции, рекламируемой как доказательство причинной связи: такие попытки можно назвать P-взломом . Чтобы предотвратить это, некоторые выступали за то, чтобы исследователи предварительно регистрировали свои исследовательские проекты до их проведения, чтобы они случайно не переоценили невоспроизводимый результат, который не был первоначальным предметом исследования, но был признан статистически значимым во время анализа данных.

Смотрите также

использованная литература

Библиография

внешние ссылки