Вероятностная причинность - Probabilistic causation

Вероятностная причинность - это понятие в группе философских теорий, которые стремятся охарактеризовать отношения между причиной и следствием с использованием инструментов теории вероятностей . Центральная идея, лежащая в основе этих теорий, заключается в том, что причины повышают вероятность их последствий при прочих равных условиях .

Детерминистская теория против вероятностной

Интерпретация каузации как детерминированное средство соотношения , которое , если вызывает B , то должно всегда быть с последующим B . В этом смысле война не вызывает смертей, а курение не вызывает рака . В результате многие обращаются к понятию вероятностной причинности. Неформально, вероятностным вызывает B , если А» возникновение s увеличивает вероятность B . Иногда это интерпретируется как отражение несовершенного знания о детерминированной системе, но иногда интерпретируется как означающее, что исследуемая причинная система по своей сути имеет недетерминированную природу. ( Вероятность предрасположенности - это аналогичная идея, согласно которой вероятности объективно существуют, а не являются просто ограничениями в знаниях субъекта).

Такие философы, как Хью Меллор и Патрик Суппес , определили причинность в терминах причины, предшествующей и увеличивающей вероятность следствия. (Кроме того, Меллор утверждает, что причина и следствие являются фактами, а не событиями, поскольку даже непредвиденное событие, такое как отказ поезда, может вызвать такие эффекты, как то, что я сижу на автобусе. Суппес, напротив, полагается на события определены теоретически множеством, и большая часть его обсуждения основана на этой терминологии.)

Перл утверждает, что вся попытка вероятностной причинности была ошибочной с самого начала, потому что центральное понятие, которое вызывает «повышение вероятности» их последствий, не может быть выражено на языке теории вероятностей. В частности, неравенство Pr (следствие | причина)> Pr (следствие | ~ причина), которое философы использовали для определения причинности, а также его многочисленные вариации и нюансы, не в состоянии уловить интуицию, лежащую в основе «повышения вероятности», которая по своей сути является манипулятивное или контрфактическое понятие.

Правильная формулировка, согласно Перл, должна гласить:

Pr (эффект | do (причина))> Pr (эффект | do (~ причина))

где делать (C) означает внешнее вмешательство , которое заставляет истину C . Условная вероятность Pr (E | C) , напротив, представляет собой вероятность, полученную в результате пассивного наблюдения за C , и редко совпадает с Pr (E | do (C)) . Действительно, наблюдение за падением барометра увеличивает вероятность приближения шторма, но не «вызывает» шторм; если бы манипулирование барометром изменяло вероятность шторма, падающий барометр считался бы причиной шторма. В целом, формулировка понятия «повышения вероятности» в рамках исчисления do- операторов разрешает трудности, с которыми вероятностная причинность столкнулась за последние полвека, в том числе печально известный парадокс Симпсона , и точно проясняет, какие отношения существуют между вероятностями и причинно-следственной связью. .

Установление причины и следствия, даже при таком расслабленном чтении, общеизвестно сложно, что выражается в широко признанном утверждении « Корреляция не подразумевает причинной связи ». Например, наблюдение, что у курильщиков резко повышается уровень заболеваемости раком легких, не доказывает, что курение должно быть причиной такого увеличения заболеваемости раком: возможно, существует определенный генетический дефект, который вызывает как рак, так и стремление к никотину; или даже, возможно, тяга к никотину является признаком очень ранней стадии рака легких, который иначе не обнаруживается. Ученые всегда ищут точные механизмы , с помощью которых событие производит событие B . Но ученым также удобно делать такие утверждения, как «курение, вероятно, вызывает рак», когда статистическая корреляция между ними, согласно теории вероятности, намного больше, чем случайность. В этом двойном подходе ученые принимают в своей терминологии как детерминированную, так и вероятностную причинность.

В статистике общепринято, что обсервационные исследования (например, подсчет случаев рака среди курильщиков и некурящих с последующим их сравнением) могут дать подсказки, но никогда не могут установить причину и следствие. Однако часто качественные причинные допущения (например, отсутствие причинно-следственной связи между некоторыми переменными) могут позволить получить согласованные оценки причинного воздействия на основе наблюдательных исследований.

Золотым стандартом причинно-следственной связи здесь является рандомизированный эксперимент : возьмите большое количество людей, случайным образом разделите их на две группы, заставьте одну группу курить и запретите курить другой группе, а затем определите, развивается ли в одной группе значительно более высокая частота рака легких. . Случайное распределение играет решающую роль в выводе о причинно-следственной связи, потому что в конечном итоге оно делает две группы эквивалентными с точки зрения всех других возможных воздействий на результат (рак), так что любые изменения в исходе будут отражать только манипуляции ( курение). Очевидно, по этическим причинам этот эксперимент не может быть проведен, но метод широко применим для менее разрушительных экспериментов. Однако одним из ограничений экспериментов является то, что, хотя они хорошо справляются с проверкой наличия какого-либо причинного эффекта, они хуже оценивают размер этого эффекта в интересующей нас популяции. (Это распространенная критика исследований безопасности пищевых добавок, в которых используются дозы, намного превышающие дозу, которую люди, потребляющие продукт, фактически принимают.)

Закрытые и открытые системы

В закрытой системе данные могут указывать на то, что причина A * B предшествует эффекту C в определенный интервал времени τ . Эта связь может с уверенностью определять причинно-следственную связь, ограниченную τ . Однако эта же взаимосвязь не может быть детерминированной с уверенностью в открытой системе, где неконтролируемые факторы могут повлиять на результат.

Примером может служить система A, B и C, где A, B и C известны. Характеристики приведены ниже и ограничены заданным временем (например, 50 мс или 50 часов):

^ A * ^ B => ^ C (99,9999998027%)

A * ^ B => ^ C (99,9999998027%)

^ A * B => ^ C (99,9999998027%)

А * В => С (99,9999998027%)

В пределах 6 стандартных отклонений можно обоснованно утверждать, что A * B вызывает C с учетом временной границы (например, 50 мс или 50 часов), ЕСЛИ И только ЕСЛИ A, B и C являются единственными частями рассматриваемой системы. Любой результат за пределами этого может рассматриваться как отклонение.

Ноты

Ссылки