Корреляция не подразумевает причинно-следственной связи - Correlation does not imply causation

Фраза «корреляция не подразумевает причинно-следственную связь» относится к неспособности законно вывести причинно-следственную связь между двумя событиями или переменными исключительно на основе наблюдаемой ассоциации или корреляции между ними. Идея о том, что «корреляция подразумевает причинную связь», является примером логической ошибки с сомнительной причиной , в которой два события, происходящие вместе, считаются установившими причинно-следственную связь. Это заблуждение также известно по латинскому выражению cum hoc ergo propter hoc («с этим, следовательно, из-за этого»). Это отличается от заблуждения, известного как post hoc ergo propter hoc («после этого, следовательно, из-за этого»), в котором событие, следующее за другим, рассматривается как необходимое следствие предыдущего события, а от слияния - ошибочное слияние двух события, идеи, базы данных и т. д. в одно целое.

Как и в случае с любой логической ошибкой, определение того, что аргумент в основе аргумента ошибочен , не обязательно означает, что полученный в результате вывод является ложным. Были предложены статистические методы, использующие корреляцию в качестве основы для проверки гипотез о причинной связи, включая тест причинности Грейнджера и конвергентное перекрестное отображение .

использование

В логике техническое использование слова «подразумевает» означает «является достаточным условием для». Именно это подразумевают статистики, когда говорят, что причинно-следственная связь не определена. В самом деле, p подразумевает, что q имеет технический смысл материального условия : если p, то q обозначается как p → q . То есть «если обстоятельство p истинно, то q следует». В этом смысле всегда правильно сказать: «Корреляция не подразумевает причинно-следственной связи». В случайном употреблении слово «подразумевает» в широком смысле означает скорее предполагает , чем требует .

Там, где есть причинная связь, есть корреляция, но также и последовательность во времени от причины к следствию, вероятный механизм, а иногда и общие и промежуточные причины. Хотя корреляция часто используется при выводе причинно-следственной связи, поскольку это необходимое условие, этого недостаточно.

В широко изученном примере трудностей, которые эта возможность статистической ошибки создает при определении причины, многочисленные эпидемиологические исследования показали, что у женщин, принимающих комбинированную заместительную гормональную терапию (ЗГТ), также частота ишемической болезни сердца (ИБС) ниже средней , ведущие врачи предполагают, что ЗГТ защищает от ИБС. Но более поздние рандомизированные контролируемые испытания показали, что использование ЗГТ привело к небольшому, но статистически значимому увеличению риска ИБС. Повторный анализ данных эпидемиологических исследований показал, что женщины, проходящие ЗГТ, с большей вероятностью принадлежали к более высоким социально-экономическим группам ( ABC1 ), с диетой и режимами упражнений выше среднего. Таким образом, использование ЗГТ и снижение заболеваемости ишемической болезнью сердца были совпадающими эффектами общей причины (т. Е. Преимуществами, связанными с более высоким социально-экономическим статусом), а не одной прямой причиной другой, как предполагалось. Широко распространенное (но ошибочное) мнение о том, что РКИ предоставляют более сильные доказательства причинно-следственной связи, чем обсервационные исследования, последние продолжали неизменно демонстрировать преимущества, а последующий анализ и последующие исследования продемонстрировали значительную пользу в отношении риска ИБС у здоровых женщин, начинающих терапию эстрогенами вскоре после начала лечения. наступление менопаузы.

Причинно-следственный анализ

Причинный анализ - это область экспериментального плана и статистики, относящаяся к установлению причины и следствия. Для любых двух коррелированных событий, A и B, их возможные отношения включают:

  • A вызывает B (прямая причинность);
  • B вызывает A (обратная причинность);
  • И A, и B вызваны C (общая причинность);
  • A вызывает B, а B вызывает A (двунаправленная или циклическая причинность);
  • Нет связи между A и B; корреляция - совпадение .

Таким образом, нельзя сделать вывод о существовании или направлении причинно-следственной связи только на основании того факта, что А и В коррелированы. Определение наличия фактической причинно-следственной связи требует дальнейшего исследования, даже если взаимосвязь между A и B является статистически значимой , наблюдается большой размер эффекта или объясняется большая часть дисперсии .

По философии и физике

Природа причинности систематически исследуется в нескольких академических дисциплинах , включая философию и физику .

В академических кругах существует значительное количество теорий причинно-следственной связи; Оксфордский справочник причинно-следственных связей ( Beebee, Hitchcock & Menzies, 2009 ) включает 770 страниц. Среди наиболее влиятельных теорий в рамках философии являются Аристотель «s Четыре причины и Аль-Газали » s окказионализм . Дэвид Хьюм утверждал, что убеждения о причинности основаны на опыте, и опыт аналогичным образом основан на предположении, что будущее моделирует прошлое, которое, в свою очередь, может быть основано только на опыте, что ведет к круговой логике . В заключение он утверждал, что причинность не основана на фактических рассуждениях : на самом деле может быть воспринята только корреляция. Иммануил Кант , согласно Beebee, Hitchcock & Menzies (2009) , считал, что «причинный принцип, согласно которому каждое событие имеет причину или следует в соответствии с причинным законом, не может быть установлен посредством индукции как чисто эмпирическое утверждение, поскольку оно тогда будет отсутствовать строгая универсальность или необходимость ".

Вне философии теории причинности можно найти в классической механике , статистической механике , квантовой механике , теориях пространства-времени , биологии , социальных науках и праве . Чтобы установить корреляцию как причинную в рамках физики , обычно понимается, что причина и следствие должны быть связаны через локальный механизм (см., Например, концепцию удара ) или нелокальный механизм (см. Концепцию поля ), в соответствии с с известными законами природы .

С точки зрения термодинамики , универсальные свойства причин по сравнению со следствиями были определены с помощью второго закона термодинамики , подтверждающего древнюю, средневековую и картезианскую точку зрения о том, что «причина больше, чем следствие» для частного случая термодинамики. свободная энергия . Это, в свою очередь, оспаривается популярными интерпретациями концепций нелинейных систем и эффекта бабочки , в которых небольшие события вызывают большие эффекты из-за, соответственно, непредсказуемости и маловероятного срабатывания большого количества потенциальной энергии .

Причинность, основанная на контрфактических состояниях

Интуитивно кажется, что причинно-следственная связь требует не просто корреляции, а контрфактической зависимости. Предположим, что ученик плохо справился с тестом и догадывается, что причина в том, что он не учился. Чтобы доказать это, можно подумать о контрфакте: тот же ученик пишет тот же тест при тех же обстоятельствах, но учился накануне вечером. Если бы можно было перемотать историю назад и изменить только одну мелочь (заставить студента готовиться к экзамену), тогда можно было бы наблюдать причинно-следственную связь (сравнивая версию 1 с версией 2). Поскольку невозможно перемотать историю назад и воспроизвести события после внесения небольших контролируемых изменений, причинно-следственная связь может быть только предположена, но никогда точно не известна. Это называется фундаментальной проблемой причинного вывода - невозможно непосредственно наблюдать причинные эффекты.

Основная цель научных экспериментов и статистических методов - максимально приблизить контрфактическое состояние мира. Например, можно провести эксперимент на однояйцевых близнецах, которые, как известно, постоянно получали одинаковые оценки на тестах. Одного из близнецов отправляют учиться на шесть часов, а другого отправляют в парк развлечений. Если их результаты тестов внезапно сильно разойдутся, это станет веским доказательством того, что учеба (или поход в парк развлечений) оказывает причинное влияние на результаты тестов. В этом случае корреляция между результатами обучения и тестами почти наверняка будет означать наличие причинно-следственной связи.

Хорошо спланированные экспериментальные исследования заменяют равенство людей, как в предыдущем примере, равенством групп. Цель состоит в том, чтобы создать две группы, которые похожи, за исключением лечения, которое получают группы. Это достигается путем выбора субъектов из одной популяции и случайного распределения их по двум или более группам. Вероятность того, что группы будут вести себя одинаково (в среднем), возрастает с увеличением количества испытуемых в каждой группе. Если группы по существу эквивалентны, за исключением лечения, которое они получают, и наблюдается различие в результатах для групп, то это свидетельствует о том, что лечение отвечает за результат, или, другими словами, лечение вызывает наблюдаемый эффект. Однако наблюдаемый эффект также может быть вызван «случайностью», например, в результате случайных возмущений в популяции. Существуют статистические тесты для количественной оценки вероятности ошибочного заключения о том, что наблюдаемая разница существует, хотя на самом деле ее нет (например, см. P-значение ).

Причинно-следственная связь, предсказанная экстраполяцией тенденций

Когда экспериментальные исследования невозможны и доступны только ранее существовавшие данные, как это обычно бывает, например, в экономике , можно использовать регрессионный анализ . Факторы, отличные от интересующей потенциальной причинной переменной, контролируются путем включения их в качестве регрессоров в дополнение к регрессору, представляющему интересующую переменную. Ложных выводов о причинно-следственной связи из-за обратной причинно-следственной связи (или неправильных оценок величины причинно-следственной связи из-за наличия двунаправленной причинно-следственной связи) можно избежать, используя объяснители (регрессоры), которые обязательно являются экзогенными , например, физические объяснения, такие как количество осадков (в качестве определяющего фактора). например, фьючерсных цен), запаздывающих переменных, значения которых были определены до определения значения зависимой переменной, инструментальных переменных для объяснителей (выбранных на основе их известной экзогенности) и т. д. См. причинно-следственную связь в статистике и экономике . Труднее избежать ложной корреляции из-за взаимного влияния третьей общей причинной переменной: модель должна быть указана таким образом, чтобы существовала теоретическая причина полагать, что никакая такая основная причинная переменная не была исключена из ее анализа.

Примеры нелогичного вывода причинно-следственной связи из корреляции

B вызывает A (обратная причинность или обратная причинность)

Обратный причинно - следственная связь или обратная причинно - следственная связь или неправильное направление является неформальным заблуждением из сомнительных причин , где причины и следствия меняются местами. Причина называется следствием, и наоборот.

Пример 1
Чем быстрее наблюдается вращение ветряных мельниц, тем сильнее наблюдается ветер.
Следовательно, ветер вызывается вращением ветряных мельниц. (Или, проще говоря: ветряные мельницы, как следует из их названия, - это машины, используемые для производства ветра.)

В этом примере корреляция (одновременность) между работой ветряной мельницы и скоростью ветра не означает, что ветер вызывается ветряными мельницами. Это скорее наоборот, о чем свидетельствует тот факт, что ветру не нужны ветряные мельницы для существования, в то время как ветряным мельницам нужен ветер для вращения. Ветер можно наблюдать в местах, где нет ветряных мельниц или невращающихся ветряных мельниц, и есть веские основания полагать, что ветер существовал до изобретения ветряных мельниц.

Пример 2
Субъекты с низким уровнем холестерина коррелируют с увеличением смертности.
Следовательно, низкий уровень холестерина увеличивает риск смерти.

Это наоборот. Таким образом, болезнь, такая как рак, вызывает низкий уровень холестерина из-за множества факторов, таких как потеря веса и увеличение смертности. То же самое наблюдается и с бывшими курильщиками. Бывшие курильщики с большей вероятностью умрут от рака легких, чем нынешние курильщики. Когда курильщикам, которые всю жизнь говорят, что у них рак легких, многие бросают курить. Это изменение может создать впечатление, будто бывшие курильщики с большей вероятностью умрут от рака легких, чем нынешние курильщики. Это также можно увидеть у алкоголиков. Когда у алкоголиков диагностируют цирроз печени, многие бросают пить. Однако они также подвержены повышенному риску смертности. В этих случаях именно болезни вызывают повышенный риск смертности, но повышенная смертность объясняется благотворными эффектами, которые следуют после постановки диагноза, в результате чего изменения в здоровье выглядят нездоровыми.

Пример 3

В других случаях может быть просто неясно, что является причиной, а что следствием. Например:

Дети, которые много смотрят телевизор, являются самыми жестокими. Очевидно, что телевидение делает детей более жестокими .

Это могло легко быть наоборот; То есть жестокие дети любят больше смотреть телевизор, чем менее жестокие.

Пример 4

Корреляция между употреблением рекреационных наркотиков и психическими расстройствами может быть любой: возможно, наркотики вызывают расстройства, или, возможно, люди используют наркотики для самолечения при уже существующих состояниях. Теория о наркотиках Gateway может утверждать, что употребление марихуаны ведет к употреблению более тяжелых наркотиков, но употребление тяжелых наркотиков может привести к употреблению марихуаны (см. Также путаницу с обратным ). Действительно, в социальных науках, где контролируемые эксперименты часто не могут использоваться для определения направления причинной связи, это заблуждение может подпитывать давние научные аргументы. Один из таких примеров можно найти в экономике образования , между моделями скрининга / сигнализации и человеческого капитала : это может быть либо то, что наличие врожденных способностей позволяет человеку завершить образование, либо то, что завершение образования развивает его способности.

Пример 5

Историческим примером этого является то, что европейцы в средние века считали, что вши полезны для вашего здоровья, поскольку вши редко появляются на больных людях. Причина заключалась в том, что люди заболели, потому что ушли вши. Однако настоящая причина в том, что вши чрезвычайно чувствительны к температуре тела. Небольшое повышение температуры тела, например, при лихорадке , заставит вшей искать другого хозяина. Медицинский термометр еще не был изобретен, поэтому такое повышение температуры замечалось редко. Заметные симптомы проявились позже, создавая впечатление, что вши ушли до того, как человек заболел.

В других случаях два явления могут быть частичной причиной другого; подумайте о бедности и отсутствии образования, или промедлении и низкой самооценке. Тем не менее, аргумент, основанный на этих двух явлениях, должен быть осторожен, чтобы избежать ошибки круговой причины и следствия . Бедность - это причина отсутствия образования, но не единственная причина, и наоборот.

Третий фактор C (общая причинная переменная) вызывает как A, так и B

Третья причина заблуждение (также известное как игнорируя общую причину или сомнительную причину ) является логической ошибкой , когда ложные отношения запутаны для причинно - следственной связи . Он утверждает, что X вызывает Y, тогда как на самом деле X и Y оба вызваны Z. Это разновидность заблуждения post hoc ergo propter hoc и член группы сомнительных причин заблуждений.

Все эти примеры имеют дело со скрытой переменной , которая является просто скрытой третьей переменной, влияющей на обе причины корреляции. Сложность также часто возникает, когда третий фактор, хотя и принципиально отличается от A и B, настолько тесно связан с A и / или B, что его можно спутать с ними или очень трудно с научной точки зрения отделить от них (см. Пример 4).

Пример 1
Сон в обуви сильно коррелирует с пробуждением с головной болью.
Поэтому сон в обуви вызывает головную боль.

Приведенный выше пример допускает ошибку корреляции, подразумевающей причинно-следственную связь, поскольку преждевременно делается вывод о том, что сон в обуви вызывает головную боль. Более правдоподобное объяснение состоит в том, что оба они вызваны третьим фактором, в данном случае пьяным ложем спать , что, таким образом, вызывает корреляцию. Так что вывод ложный.

Пример 2
Маленькие дети, которые спят с включенным светом, гораздо чаще разовьются близорукостью в более позднем возрасте.
Поэтому сон с включенным светом вызывает близорукость.

Это научный пример, полученный в результате исследования, проведенного в Медицинском центре Университета Пенсильвании . Исследование , опубликованное в журнале Nature от 13 мая 1999 г. , в то время широко освещалось в популярной прессе. Однако более позднее исследование в Университете штата Огайо не показало, что младенцы, спящие с включенным светом, вызывают развитие миопии. Он действительно обнаружил сильную связь между родительской близорукостью и развитием детской миопии, а также отметил, что близорукие родители с большей вероятностью оставляли свет включенным в спальне своих детей. В данном случае причиной обоих состояний является близорукость родителей, и вышеприведенное заключение неверно.

Пример 3
По мере увеличения продаж мороженого резко возрастает количество смертей от утопления.
Следовательно, употребление мороженого вызывает утопление.

В этом примере не учитывается важность времени года и температуры для продаж мороженого. Мороженое продается в жаркие летние месяцы по гораздо более высоким ценам, чем в более холодное время, и именно в эти жаркие летние месяцы люди с большей вероятностью будут заниматься водными видами спорта, такими как плавание . Увеличение числа смертей от утопления просто вызвано большим воздействием на воду, а не мороженым. Заявленный вывод неверен.

Пример 4
Гипотетическое исследование показывает взаимосвязь между оценками тестовой тревожности и застенчивостью со статистическим значением r (сила корреляции) +,59.
Таким образом, можно просто сделать вывод, что застенчивость в некоторой степени причинно влияет на тревожность при тестировании.

Однако, как обнаруживается во многих психологических исследованиях, обнаруживается еще одна переменная, «оценка самосознания», которая имеет более резкую корреляцию (+,73) с застенчивостью. Это предполагает возможную проблему «третьей переменной», однако, когда обнаруживаются три таких тесно связанных показателя, это также предполагает, что каждая из них может иметь двунаправленные тенденции (см. « Двунаправленная переменная » выше), будучи кластером коррелированных значений, каждое из которых влияет друг на друга. в некоторой степени. Следовательно, простой вывод, сделанный выше, может быть ложным.

Пример 5
С 1950-х годов резко возросли как уровень CO 2 в атмосфере, так и уровень ожирения .
Следовательно, атмосферный CO 2 вызывает ожирение.

Более богатые люди, как правило, едят больше еды и производят больше CO 2 .

Пример 6
ЛПВП («хороший») холестерин отрицательно коррелирует с частотой сердечных приступов.
Следовательно, прием лекарств, повышающих уровень ЛПВП, снижает вероятность сердечного приступа.

Дальнейшие исследования поставили этот вывод под сомнение. Вместо этого возможно, что другие основные факторы, такие как гены, диета и упражнения, влияют как на уровни ЛПВП, так и на вероятность сердечного приступа; возможно, что лекарства могут повлиять на непосредственно измеряемый фактор, уровни ЛПВП, не влияя на вероятность сердечного приступа.

Двунаправленная причинность: A вызывает B, а B вызывает A

Причинность не обязательно односторонняя; В отношениях хищник-жертва количество хищников влияет на количество жертв, но количество жертв, то есть количество пищи, также влияет на количество хищников. Другой известный пример - у велосипедистов более низкий индекс массы тела, чем у людей, которые не ездят на велосипеде. Это часто объясняется предположением, что езда на велосипеде увеличивает уровень физической активности и, следовательно, снижает ИМТ. Поскольку результаты проспективных исследований людей, которые чаще используют велосипед, показывают меньшее влияние на ИМТ, чем перекрестные исследования, также может иметь место некоторая обратная причинно-следственная связь (т.е. люди с более низким ИМТ с большей вероятностью будут ездить на велосипеде).

Отношения между A и B случайны

Эти две переменные никак не связаны, а коррелируют случайно. Чем больше исследуется, тем больше вероятность того, что две несвязанные переменные окажутся связанными. Например:

Использование корреляции как научного доказательства

Многие научные данные основаны на корреляции переменных - они наблюдаются вместе. Ученые осторожно указывают на то, что корреляция не обязательно означает причинную связь. Предположение, что A вызывает B просто потому, что A коррелирует с B, часто не принимается в качестве законной формы аргумента.

Однако иногда люди допускают противоположное заблуждение - полностью игнорируют корреляцию. Это отвергнет большое количество важных научных данных. Поскольку проведение контролируемых двойных слепых исследований может быть трудным или этически невозможным , корреляционные доказательства с нескольких разных точек зрения могут быть полезны для прогнозирования, несмотря на то, что они не могут предоставить доказательства причинно-следственной связи . Например, социальные работники могут быть заинтересованы в том, чтобы узнать, как жестокое обращение с детьми связано с успеваемостью. Хотя было бы неэтично проводить эксперимент, в котором детей случайным образом распределяют, чтобы они получали или не подвергались насилию, исследователи могут изучить существующие группы, используя неэкспериментальный корреляционный план. Если на самом деле существует отрицательная корреляция между жестоким обращением и академической успеваемостью, исследователи могут потенциально использовать это знание о статистической корреляции, чтобы делать прогнозы о детях вне исследования, которые подвергаются жестокому обращению, даже несмотря на то, что исследование не предоставило причинно-следственных доказательств того, что насилие снижает академическую успеваемость. Комбинация ограниченных доступных методологий с отклонением ошибки корреляции иногда использовалась для противодействия научным открытиям. Например, табачная промышленность исторически полагалась на отклонение корреляционных данных, чтобы отвергнуть связь между табаком и раком легких , как это делал биолог и статистик Рональд Фишер , часто в ее пользу.

Корреляция - это ценный вид научных данных в таких областях, как медицина, психология и социология. Корреляции сначала должны быть подтверждены как реальные, а затем необходимо систематически исследовать все возможные причинные отношения. В конце концов, корреляция сама по себе не может использоваться в качестве доказательства причинно-следственной связи между лечением и пользой, фактором риска и заболеванием, или социальным или экономическим фактором и различными результатами. Это один из наиболее часто используемых типов доказательств, потому что легко и даже соблазнительно прийти к преждевременным выводам, основанным на предварительном появлении корреляции.

Смотрите также

использованная литература

Связанные ссылки

Библиография