Проблема трех узников - Three Prisoners problem

Задача о трех заключенных появилась в колонке Мартина Гарднера « Математические игры » в журнале Scientific American в 1959 году. Она математически эквивалентна проблеме Монти Холла с заменой машины и козла на свободу и казнь соответственно.

Проблема

Трое заключенных, A, B и C, находятся в отдельных камерах и приговорены к смертной казни. Губернатор наугад выбрал одного из них для помилования. Надзиратель знает, кого помилуют, но не может сказать. Заключенный А умоляет надзирателя сообщить ему личность одного из двоих, которых собираются казнить. «Если B должен быть помилован, назовите мне имя C. Если C должен быть помилован, назовите мне имя B. И если меня нужно помиловать, тайно подбросьте монетку, чтобы решить, назвать ли B или C.»

Смотритель говорит А, что Б. должен быть казнен. Заключенный A доволен, потому что он считает, что его вероятность выжить выросла с 1/3 до 1/2, как сейчас между ним и C. Заключенный A тайно сообщает новости C, который считает, что шанс A на помилование составляет остался без изменений на 1/3, но он доволен, потому что его собственный шанс увеличился до 2/3. Какой из заключенных прав?

Решение

Ответ заключается в том, что заключенный А не получил никакой информации о своей судьбе, поскольку он уже знал, что надзиратель назовет ему чье-то имя. Заключенный A, до того как услышать от надзирателя, оценивает свои шансы на помилование как 1/3, то же самое, что и для B, и для C. Поскольку надзиратель говорит, что B будет казнен, это либо потому, что C будет помилован (1/3 шанс), или A будет помилован (шанс 1/3), и монета для решения, назвать ли B или C, которую перевернул надзиратель, выпала B (шанс 1/2; для общего 1/2 × 1/3 = 1 / 6 шанс B был назван, потому что A будет помилован). Следовательно, после того, как он услышал, что B будет казнен, оценка шансов A на помилование вдвое меньше, чем для C. Это означает, что его шансы на помилование, теперь зная, что B нет, снова равны 1/3, но у C есть 2 / 3 шанса на помилование.

Стол

Приведенное выше объяснение можно кратко изложить в следующей таблице. Когда А спрашивает надзирателя, он может ответить только B или C, чтобы он был казнен (или «не помилован»).

Помилование Надзиратель: «не Б» Надзиратель: "не C" Сумма
А 1/6 1/6 1/3
B 0 1/3 1/3
C 1/3 0 1/3

Поскольку надзиратель ответил, что B не будет помилован, решение исходит из второй колонки «не B». Похоже, что шансы на помилование А против С составляют 1: 2.

Математическая формулировка

Вызов , и события , что соответствующий заключенный будет помилованных, и событие, смотритель рассказывает , что заключенный B должен быть выполнен, то, используя теорему Байеса , апостериорная вероятность А помилования, является:

С другой стороны, вероятность того, что C будет помилована, равна:

Решающее различие, делающее A и C неравными, состоит в том, что « но» . Если A будет помилован, надзиратель может сказать A, что B или C должны быть казнены, и, следовательно ,; тогда как если C будет помилован, надзиратель может только сказать A, что B казнен, так что .

Интуитивное объяснение

У заключенного А только 1/3 шанса на помилование. Знание того, будет ли казнен «B» или «C», не меняет его шансов. После того, как он узнает, что B будет казнен, заключенный A понимает, что, если он сам не получит помилование, он должен пойти только к C. Это означает, что у C есть 2/3 шанса получить помилование. Это сравнимо с проблемой Монти Холла .

Перечень возможных случаев

Могут возникнуть следующие сценарии:

  1. A помилован, и надзиратель упоминает, что B должен быть казнен: 1/3 × 1/2 = 1/6 случаев
  2. А помилован, и надзиратель упоминает, что С должен быть казнен: 1/3 × 1/2 = 1/6 случаев
  3. B помилован, и надзиратель упоминает, что C будет казнен: 1/3 случаев
  4. C помилован, и надзиратель упоминает, что B должен быть казнен: 1/3 случаев

С условием, что надзиратель выберет случайным образом, в 1/3 времени, когда А будет помилован, есть 1/2 шанса, что он скажет B, и 1/2 шанса, что он скажет C. Это означает, что принято в целом, в 1/6 случаев (1/3 [что A помилован] × 1/2 [этот надзиратель говорит B]) надзиратель скажет B, потому что A будет помилован, и 1/6 случаев (1 / 3 [что A помилован] × 1/2 [этот надзиратель говорит C]) он скажет C, потому что A помилован. Это в сумме составляет 1/3 времени (1/6 + 1/6) А, что является точным.

Теперь ясно, что если надзиратель отвечает B на A (1/2 случая случая 1 и случая 4), то 1/3 времени C помилован, а A все равно будет казнен (случай 4), и только 1/6 случаев помилования А (случай 1). Следовательно, шансы C равны (1/3) / (1/2) = 2/3, а шансы A равны (1/6) / (1/2) = 1/3.

Ключ к этой проблеме в том, что надзиратель не может раскрыть имя заключенного, который будет помилован. Если мы устраним это требование, это может продемонстрировать исходную проблему другим способом. Единственное изменение в этом примере заключается в том, что заключенный A просит надзирателя раскрыть судьбу одного из других заключенных (не указывая того, который будет казнен). В этом случае надзиратель подбрасывает монету и выбирает одного из B и C, чтобы раскрыть судьбу. Случаи следующие:

  1. Помилованный надзиратель говорит: B казнен (1/6)
  2. Помилованный надзиратель говорит: C казнен (1/6)
  3. B помилован, надзиратель говорит: B помилован (1/6)
  4. B помилован, смотритель говорит: C казнен (1/6)
  5. C помилован, надзиратель говорит: B казнен (1/6)
  6. C помилован, надзиратель говорит: C помилован (1/6)

Каждый сценарий имеет вероятность 1/6. Первоначальную задачу «Три заключенных» можно рассматривать в этом свете: у надзирателя в этой задаче все еще есть эти шесть случаев, вероятность возникновения каждого из которых составляет 1/6. Однако надзиратель в этом случае не может раскрыть судьбу помилованного заключенного. Следовательно, в 1/6 случаев, когда встречается случай 3, поскольку утверждение B не является вариантом, надзиратель вместо этого говорит C (что делает его тем же, что и в случае 4). Точно так же в случае 6 надзиратель должен сказать B вместо C (то же, что и в случае 5). Это оставляет случаи 4 и 5 с вероятностью 1/3 и оставляет нас с той же вероятностью, что и выше.

Почему парадокс?

Тенденция людей давать ответ 1/2 игнорирует тот факт, что надзиратель мог подбросить монетку до того, как дал свой ответ. Надзиратель, возможно, ответил, потому что должен быть освобожден, и подбросил монетку. Или должен быть освобожден. Но вероятности двух событий не равны.

Джудея Перл (1988) использовал вариант этого примера, чтобы продемонстрировать, что обновление убеждений должно зависеть не только от наблюдаемых фактов, но и от эксперимента (то есть запроса), который привел к этим фактам.

Связанные проблемы и приложения

Примечания

использованная литература