Проблема сборщика купонов - Coupon collector's problem

График количества купонов, n в зависимости от ожидаемого количества попыток (т.е. времени), необходимых для их сбора, E  ( T  )

В теории вероятностей , в проблеме купонов коллекционной описывает «собрать все купоны и выиграть» конкурсы. В нем задается следующий вопрос: если в каждой коробке марки зерновых есть купон, и существует n различных типов купонов, какова вероятность того, что потребуется купить более t коробок, чтобы собрать все n купонов? Альтернативное утверждение: учитывая n купонов, сколько купонов, по вашему мнению, вам нужно будет вытянуть с заменой, прежде чем вы будете использовать каждый купон хотя бы один раз? Математический анализ задачи показывает, что ожидаемое количество необходимых испытаний растет по мере роста . Например, при n  = 50 для сбора всех 50 купонов в среднем требуется около 225 попыток.

Решение

Расчет ожидания

Пусть время T будет количеством розыгрышей, необходимых для сбора всех n купонов, и пусть t i будет временем получения i-го купона после того  , как будет собран i - 1 купон. Тогда . Думайте о T и t i как о случайных величинах . Обратите внимание, что вероятность получения нового купона равна . Следовательно, имеет геометрическое распределение с ожиданием . По линейности ожиданий имеем:

Здесь Н п является п -го номера гармоники . Используя асимптотику гармонических чисел, получаем:

где - постоянная Эйлера – Маскерони .

Теперь можно использовать неравенство Маркова, чтобы оценить желаемую вероятность:

Вышеизложенное можно немного изменить, чтобы справиться с ситуацией, когда мы уже собрали некоторые купоны. Пусть k будет количеством уже собранных купонов, тогда:

И когда тогда мы получим исходный результат.

Расчет дисперсии

Используя независимость случайных величин t i , получаем:

поскольку (см. Базельскую проблему ).

Теперь можно использовать неравенство Чебышева, чтобы оценить желаемую вероятность:

Оценки хвоста

Другая верхняя граница может быть получена из следующего наблюдения. Пусть обозначает событие , что -ый купон не был выбран в первых испытаниях. Потом:

Таким образом, мы имеем .

Расширения и обобщения

  • Лаплас , но и Эрдёш и Рение , доказали предельную теорему для распределения Т . Этот результат является дальнейшим расширением предыдущих оценок.
  • Дональд Дж. Ньюман и Лоуренс Шепп дали обобщение проблемы сборщика купонов, когда необходимо собрать m копий каждого купона. Пусть T m будет первым сбором m копий каждого купона. Они показали, что ожидание в этом случае удовлетворяет:
Здесь m фиксировано. Когда m = 1, мы получаем предыдущую формулу математического ожидания.
  • Общее обобщение, также принадлежащее Эрдешу и Реньи:
  • В общем случае неравномерного распределения вероятностей, согласно Филиппу Флажоле ,
Это равно
где м означает число купонов должны быть собраны, а Р J обозначая вероятность получения какой - либо купон в наборе купонов J .

Смотрите также

Примечания

использованная литература

внешние ссылки