Отрицательное биномиальное распределение - Negative binomial distribution

В разных текстах (и даже в разных частях этой статьи) используются несколько разные определения отрицательного биномиального распределения. Их можно различить по тому, начинается ли опора с k  = 0 или с k = r , обозначает ли p вероятность успеха или неудачи и является ли r успешным или неудачным, поэтому определение конкретной используемой параметризации имеет решающее значение в любом данный текст.
Вероятностная функция масс
Negbinomial.gif
Оранжевая линия представляет собой среднее значение, равное 10 на каждом из этих графиков; зеленая линия показывает стандартное отклонение.
Обозначение
Параметры r > 0 - количество неудач до остановки эксперимента ( целое число , но определение можно расширить и на вещественные числа )
p ∈ [0,1] - вероятность успеха в каждом эксперименте (реальный)
Служба поддержки k ∈ {0, 1, 2, 3,…} - количество успехов
PMF с биномиальным коэффициентом
CDF регуляризованная неполная бета - функция
Иметь в виду
Режим
Дисперсия
Асимметрия
Бывший. эксцесс
MGF
CF
PGF
Информация Fisher
Метод моментов

В теории вероятностей и статистике , то отрицательное биномиальное распределение является дискретным распределением вероятностей , что модели число успехов в последовательности независимых одинаково распределенных испытаний Бернулли до заданного (неслучайной) число отказов (обозначается г ) происходит. Например, мы можем определить бросок 6 на кубике как провал, а бросок любого другого числа как успех и спросить, сколько успешных бросков произойдет, прежде чем мы увидим третий провал ( r = 3). В таком случае распределение вероятностей количества не-6, которые появятся, будет отрицательным биномиальным распределением. Мы могли бы аналогичным образом использовать отрицательное биномиальное распределение для моделирования количества дней, в течение которых определенная машина работает до того, как выйдет из строя ( r = 1).

«Успех» и «неудача» - произвольные термины, которые иногда меняют местами. Мы могли бы так же легко сказать, что отрицательное биномиальное распределение - это распределение числа неудач до r успехов. Применительно к реальным проблемам результаты успеха и неудачи могут быть, а могут и не быть результатами, которые мы обычно рассматриваем как хорошие и плохие соответственно. В данной статье эти термины используются непоследовательно, поэтому читателю следует быть внимательным, чтобы определить, какой результат может отличаться по количеству повторов и какой результат останавливает последовательность испытаний. В статье может также непоследовательно использоваться p (вероятность одного из результатов в любом данном испытании Бернулли).

Распределение Паскаля (после Блейза Паскаля ) и распределение Пойа (для Джорджа Полиа ) являются частными случаями отрицательного биномиального распределения. Среди инженеров, климатологов и других существует соглашение об использовании «отрицательного бинома» или «Паскаля» для случая целочисленного параметра времени остановки r и использования «Polya» для случая действительного значения.

Для возникновения связанных дискретных событий, таких как вспышки торнадо, можно использовать распределения Polya для получения более точных моделей, чем распределение Пуассона , позволяя среднему значению и дисперсии быть разными, в отличие от распределения Пуассона. Отрицательное биномиальное распределение имеет дисперсию , при этом распределение становится идентичным распределению Пуассона в пределе для данного среднего значения . Это может сделать распределение полезной сверхдисперсной альтернативой распределению Пуассона, например, для надежной модификации регрессии Пуассона . В эпидемиологии он использовался для моделирования передачи инфекционных заболеваний, где вероятное количество новых инфекций может значительно варьироваться от человека к человеку и от места к месту. В более общем плане это может быть уместным, когда события имеют положительно коррелированные события, вызывающие большую дисперсию, чем если бы события были независимыми, из-за положительного члена ковариации .

Термин «отрицательный биномиальный», вероятно, связан с тем фактом, что определенный биномиальный коэффициент, который появляется в формуле для функции массы вероятности распределения, может быть более просто записан с помощью отрицательных чисел.

Определения

В отличие от введения и информационного окна, в этом разделе термин «успех» используется для обозначения ограничивающего результата. Другими словами, в этом разделе рассматривается последовательность испытаний, которая останавливается после r успехов. Эта терминология может не соответствовать другим частям статьи.

Предположим, есть последовательность независимых испытаний Бернулли . У каждого испытания есть два возможных результата, которые называются «успех» и «неудача». В каждом испытании вероятность успеха равна p, а вероятность неудачи - (1 -  p ). Мы наблюдаем за этой последовательностью до тех пор, пока не будет достигнуто заранее заданное число r успехов. Тогда случайное количество неудач, которое мы видели, X , будет иметь отрицательное биномиальное (или Паскалевое ) распределение:

Вероятностная функция масс

Функция массы вероятности отрицательного биномиального распределения равна

где r - количество успехов, k - количество неудач, а p - вероятность успеха. Здесь величина в скобках - это биномиальный коэффициент , равный

Есть K отказы , выбранных из K + R-1 выборок , а не к + г , потому что последний из K + R выборок, по определению , успех.

В качестве альтернативы эту величину можно записать следующим образом, объясняя название «отрицательный бином»:

Обратите внимание , что в последнем выражении и биномиальный ряд , для каждого 0 ≤ р <1 и ,

следовательно, члены вероятностной функции массы действительно составляют единицу, как показано ниже.

Чтобы понять приведенное выше определение функции массы вероятности, обратите внимание, что вероятность для каждой конкретной последовательности из r  успехов и k  неудач равна p r (1 - p ) k , потому что результаты k  +  r испытаний должны происходить независимо . Поскольку r- й успех всегда приходит последним, остается выбрать k  неудачных испытаний из оставшихся k  +  r  - 1 испытаний. Вышеупомянутый биномиальный коэффициент, благодаря его комбинаторной интерпретации, дает точное количество всех этих последовательностей длины k  +  r  - 1.

Кумулятивная функция распределения

Кумулятивная функция распределения может быть выражена в терминах регуляризованной неполной бета - функции :

Она также может быть выражена в терминах функции распределения от биномиального распределения :

Альтернативные составы

Некоторые источники могут определять отрицательное биномиальное распределение немного иначе, чем здесь первичное. Наиболее распространены варианты, когда случайная величина X считает разные вещи. Эти варианты можно увидеть в таблице здесь:

Х считает ... Вероятностная функция масс Формула Альтернативная формула

(с использованием эквивалентного бинома)

Альтернативная формула

(упрощенный с помощью: )

Служба поддержки
1 k неудач, учитывая r успехов
2 n испытаний, учитывая r успехов
3 n испытаний, учитывая r отказов
4 r успехов, учитывая n попыток Это биномиальное распределение :

Каждое из этих определений отрицательного биномиального распределения может быть выражено несколько разными, но эквивалентными способами. Первая альтернативная формулировка является просто эквивалентной формой биномиального коэффициента, то есть: . Второй альтернативный препарат несколько упрощает выражение, учитывая , что общее число испытаний просто число успехов и неудач, то есть: . Эти вторые формулировки могут быть более интуитивно понятными, однако они, возможно, менее практичны, поскольку содержат больше терминов.

  1. Определение, где X - количество k отказов, которые происходят для данного количества r успехов . Это определение очень похоже на основное определение, используемое в этой статье, только k успехов и r неудач меняются местами при рассмотрении того, что считается и что дано. Однако обратите внимание, что p по- прежнему относится к вероятности «успеха».
  2. Определение, где X - количество n попыток, которые происходят при заданном количестве r успешных попыток . Это определение очень похоже на определение №2, только вместо k неудач дано r успехов . Однако обратите внимание, что p по- прежнему относится к вероятности «успеха».
  • Определение отрицательного биномиального распределения может быть расширено до случая, когда параметр r может принимать положительное действительное значение. Хотя невозможно визуализировать нецелое число «отказов», мы все же можем формально определить распределение через его функцию массы вероятности. Проблема расширения определения до действительного (положительного) r сводится к распространению биномиального коэффициента на его действительный аналог на основе гамма-функции :
После подстановки этого выражения в исходное определение мы говорим, что X имеет отрицательное биномиальное (или Полиа ) распределение, если оно имеет функцию массы вероятности :
Здесь r - действительное положительное число.

В отрицательной биномиальной регрессии распределение определяется в терминах своего среднего значения, которое затем связывается с независимыми переменными, как в линейной регрессии или других обобщенных линейных моделях . Из выражения для среднего m можно получить и . Затем, подставляя эти выражения в выражение для функции массы вероятности, когда r является действительным знаком , получаем следующую параметризацию функции массы вероятности через  m :

Тогда дисперсию можно записать как . Некоторые авторы предпочитают устанавливать и выражать дисперсию как . В этом контексте и в зависимости от автора параметр r или его обратная величина α называется «параметром дисперсии», «параметром формы» или «коэффициентом кластеризации», либо параметром «неоднородности» или «агрегации». Термин «агрегация» особенно используется в экологии при описании количества отдельных организмов. Уменьшение параметра агрегации r до нуля соответствует увеличению агрегации организмов; увеличение r к бесконечности соответствует отсутствию агрегации, что может быть описано регрессией Пуассона .

  • Иногда распределение параметризуется в терминах его среднего μ и дисперсии σ 2 :

Примеры

Продажа конфет

Пэт Коллис должен продавать шоколадные батончики, чтобы собрать деньги на экскурсию в шестом классе. По соседству тридцать домов, и Пэт не должен возвращаться домой, пока не будут проданы пять шоколадных батончиков. Итак, ребенок ходит от двери к двери, продавая шоколадные батончики. В каждом доме вероятность продать один шоколадный батончик составляет 0,6, а ничего не продать - 0,4.

Какова вероятность продать последний моноблок в n- м доме?

Успешная продажа конфет достаточное количество раз - вот что определяет наш критерий остановки (в отличие от неудачной продажи конфет), поэтому k в данном случае представляет количество неудач, а r - количество успехов. Напомним, что распределение NegBin ( r , p ) описывает вероятность k неудач и r успехов в k  +  r испытаниях Бернулли ( p ) с успехом в последнем испытании. Продать пять шоколадных батончиков - значит получить пять успехов. Таким образом, количество испытаний (т.е. домов) составляет k  + 5 =  n . Интересующая нас случайная величина - это количество домов, поэтому мы подставляем k  =  n  - 5 в функцию масс NegBin (5, 0.4) и получаем следующую функцию масс распределения домов (для n  ≥ 5):

Какова вероятность того, что Пэт финиширует в десятом доме?

Какова вероятность того, что Пэт закончит работу в восьмом доме или раньше?

Чтобы закончить в восьмом доме или раньше, Пат должен закончить в пятом, шестом, седьмом или восьмом доме. Суммируйте эти вероятности:

Какова вероятность, что Пэт вымотает все 30 домов по соседству?

Это можно выразить как вероятность того, что Пат не закончит с пятого по тридцатый дома:

Из-за довольно высокой вероятности того, что Пэт будет продавать каждый дом (60 процентов), вероятность того, что она НЕ выполнит свой квест, исчезающе мала.

Продолжительность пребывания в больнице

Продолжительность пребывания в больнице - это пример реальных данных, которые можно хорошо смоделировать с помощью отрицательного биномиального распределения.

Характеристики

Ожидание

Ожидаемое общее количество успехов в отрицательном биномиальном распределении с параметрами ( r , p ) равно rp / (1 -  p ). Чтобы убедиться в этом, представьте, что эксперимент по моделированию отрицательного бинома выполняется много раз. То есть выполняется набор испытаний до тех пор, пока не будет получено r отказов, затем еще один набор испытаний, затем еще один и т. Д. Запишите количество испытаний, выполненных в каждом эксперименте: a , b , c ,… и установите a  +  b  +  с  + ... =  N . Теперь можно было бы ожидать всего Np успехов. Допустим, эксперимент проводился n раз. Тогда всего отказов nr . Таким образом, мы ожидаем, что nr = N (1 -  p ) , поэтому N / nr / (1 -  p ) . Обратите внимание, что N / n - это просто среднее количество испытаний за эксперимент. Вот что мы подразумеваем под «ожиданием». Среднее количество успехов за эксперимент: N / n  -  rr / (1 -  p ) -  r = rp / (1 -  p ) . Это соответствует среднему значению, указанному в поле с правой стороны этой страницы.

Дисперсия

При подсчете количества успехов с учетом количества неудач r дисперсия составляет  rp / (1 -  p ) 2 . При подсчете количества неудач перед r -м успехом дисперсия составляет  r (1 -  p ) / p 2 .

Связь с биномиальной теоремой

Предположим, Y - случайная величина с биномиальным распределением с параметрами n и p . Предположим, что p  +  q  = 1, где pq  ≥ 0, тогда

Используя биномиальную теорему Ньютона , это также можно записать как:

в котором верхняя грань суммирования бесконечна. В этом случае биномиальный коэффициент

определяется, когда n - действительное число, а не просто положительное целое число. Но в нашем случае биномиального распределения он равен нулю при k > n . Тогда мы можем сказать, например,

Теперь предположим, что r > 0, и мы используем отрицательный показатель степени:

Тогда все члены положительны, и член

- это просто вероятность того, что количество неудач до r- го успеха равно k , при условии, что r - целое число. (Если r - отрицательное нецелое число, так что показатель степени является положительным нецелым числом, тогда некоторые из членов в сумме выше отрицательны, поэтому у нас нет распределения вероятностей на множестве всех неотрицательных целых чисел.)

Теперь мы также допускаем нецелые значения r . Тогда у нас есть собственное отрицательное биномиальное распределение, которое является обобщением распределения Паскаля, которое совпадает с распределением Паскаля, когда r оказывается положительным целым числом.

Напомним, что

Сумма независимых отрицательно-биномиально распределенных случайных величин r 1 и r 2 с одинаковым значением параметра p имеет отрицательно-биномиальное распределение с тем же p, но с r- значением  r 1  +  r 2 .

Это свойство сохраняется, когда определение таким образом обобщается, и дает быстрый способ увидеть, что отрицательное биномиальное распределение бесконечно делимо .

Отношение повторения

Имеет место следующее рекуррентное соотношение :

Связанные дистрибутивы

распределение Пуассона

Рассмотрим последовательность отрицательных биномиальных случайных величин, в которой параметр остановки r стремится к бесконечности, а вероятность успеха в каждом испытании p стремится к нулю таким образом, чтобы среднее значение распределения оставалось постоянным. Обозначая это среднее как λ , параметр p будет p  =  λ / ( r  +  λ )

При такой параметризации функция массы вероятности будет

Теперь, если мы рассмотрим предел при r → ∞, второй множитель будет сходиться к единице, а третий - к показательной функции:

которая является функцией масс случайной величины с распределением по Пуассону с математическим ожиданием  λ .

Другими словами, альтернативно параметризованное отрицательное биномиальное распределение сходится к распределению Пуассона, а r контролирует отклонение от Пуассона. Это делает отрицательное биномиальное распределение подходящим в качестве надежной альтернативы Пуассону, который приближается к Пуассону для больших r , но имеет большую дисперсию, чем Пуассон для малых r .

Гамма-пуассоновская смесь

Отрицательное биномиальное распределение также возникает как непрерывная смесь распределений Пуассона (то есть составное распределение вероятностей ), где смешивающее распределение коэффициента Пуассона является гамма-распределением . То есть мы можем рассматривать отрицательный бином как распределение Пуассона ( λ ) , где λ сама по себе является случайной величиной, распределенной как гамма-распределение с shape = r и масштабом θ = p / (1 - p ) или, соответственно, с оценкой β = (1 - п ) / стр .

Чтобы продемонстрировать интуицию, стоящую за этим утверждением, рассмотрим два независимых процесса Пуассона, «Успех» и «Неудача», с интенсивностями p и 1 -  p . Вместе процессы успеха и неудачи эквивалентны одному пуассоновскому процессу с интенсивностью 1, где возникновение процесса является успехом, если соответствующее независимое подбрасывание монеты выпадает орлом с вероятностью p ; в противном случае это неудача. Если r - счетное число, то подбрасывание монеты показывает, что количество успехов перед r- й неудачей следует отрицательному биномиальному распределению с параметрами r и p . Количество также, однако, граф процесса Успех Пуассона в случайный момент времени Т в г - й появления в процессе Failure Пуассона. Счетчик успехов следует распределению Пуассона со средним значением pT , где T - время ожидания r вхождений в пуассоновском процессе с интенсивностью 1 -  p , то есть T имеет гамма-распределение с параметром формы r и интенсивностью 1 -  p . Таким образом, отрицательное биномиальное распределение эквивалентно распределению Пуассона со средним pT , где случайная величина T имеет гамма-распределение с параметром формы r и интенсивностью (1 - p ) / p . Предыдущий абзац следует, потому что λ  =  pT имеет гамма-распределение с параметром формы r и интенсивностью (1 - p ) / p .

Следующий формальный вывод (который не зависит от счетного числа r ) подтверждает интуицию.

Из-за этого отрицательное биномиальное распределение также известно как гамма-пуассоновское (смешанное) распределение . Отрицательное биномиальное распределение первоначально было получено как предельный случай гамма-распределения Пуассона.

Распределение суммы геометрически распределенных случайных величин

Если Y r является случайной величиной, соответствующей отрицательному биномиальному распределению с параметрами r и p , и поддерживает {0, 1, 2, ...}, то Y r является суммой r независимых переменных, следующих геометрическому распределению (на {0 , 1, 2, ...}) с параметром p . В результате центральной предельной теоремы , У г (правильно масштабировать и сдвигать) , следовательно , приблизительно нормально при достаточно больших  г .

Кроме того, если B s + r - случайная величина, следующая биномиальному распределению с параметрами s  +  r и 1 -  p , то

В этом смысле отрицательное биномиальное распределение является «обратным» биномиальному распределению.

Сумма независимых отрицательно-биномиально распределенных случайных величин r 1 и r 2 с одинаковым значением параметра p имеет отрицательно-биномиальное распределение с тем же p, но с r- значением  r 1  +  r 2 .

Отрицательное биномиальное распределение бесконечно делимо , то есть, если Y имеет биномиальное распределение отрицательное, то для любого натурального числа п , существуют независимые одинаково распределенные случайные величины Y 1 , ...,  Y п , сумма которых имеет такое же распределение , что Y имеет .

Представление в виде составного распределения Пуассона

Отрицательное биномиальное распределение NB ( r , p ) может быть представлено как составное распределение Пуассона : Пусть { Y n , n ∈ ℕ 0 обозначает последовательность независимых и одинаково распределенных случайных величин , каждая из которых имеет логарифмическое распределение Log ( p ), с функцией массы вероятности

Пусть N - случайная величина, не зависящая от последовательности, и предположим, что N имеет распределение Пуассона со средним λ = - r ln (1 - p ) . Тогда случайная сумма

является NB ( r , p ) -распределенным. Чтобы доказать это, мы вычисляем функцию G X, производящую вероятность для X , которая представляет собой композицию функций G N и G Y 1, производящих вероятность . С использованием

а также

мы получаем

которая является производящей функцией вероятности распределения NB ( r , p ).

В следующей таблице описаны четыре распределения, связанных с количеством успехов в последовательности розыгрышей:

С заменами Никаких замен
Учитывая количество розыгрышей биномиальное распределение гипергеометрическое распределение
Заданное количество отказов отрицательное биномиальное распределение отрицательное гипергеометрическое распределение

(a, b, 0) класс распределений

Отрицательное биномиальное распределение, наряду с распределением Пуассона и биномиальным распределением, является членом класса распределений (a, b, 0) . Все три из этих дистрибутивов являются частными случаями дистрибутива Panjer . Они также являются членами экспоненциальной семьи Natural .

Статистические выводы

Оценка параметров

МВУЭ для р

Предположим, что p неизвестно, и проводится эксперимент, в котором заранее решено, что выборка будет продолжаться до тех пор, пока не будет найдено r успешных результатов. Достаточная статистика для эксперимента к , число отказов.

При оценке р , то минимальная дисперсия несмещенной оценки является

Оценка максимального правдоподобия

Когда r известно, оценка максимального правдоподобия p равна

но это необъективная оценка . Однако его обратное ( r  +  k ) / r является несмещенной оценкой 1 / p .

Когда r неизвестно, оценка максимального правдоподобия для p и r вместе существует только для выборок, для которых выборочная дисперсия больше, чем выборочное среднее. Функция правдоподобия для N iid наблюдений ( k 1 , ...,  k N ) равна

из которого мы вычисляем функцию логарифмического правдоподобия

Чтобы найти максимум, мы берем частные производные по r и p и устанавливаем их равными нулю:

а также

куда

это функция дигаммы .

Решение первого уравнения относительно p дает:

Подставив это во второе уравнение, мы получим:

Это уравнение не может быть решено относительно r в замкнутой форме . Если требуется численное решение, можно использовать итерационный метод, такой как метод Ньютона . В качестве альтернативы можно использовать алгоритм максимизации ожидания .


Возникновение и приложения

Время ожидания в процессе Бернулли

Для особого случая, когда r - целое число, отрицательное биномиальное распределение известно как распределение Паскаля . Это распределение вероятностей определенного количества неудач и успехов в серии независимых и одинаково распределенных испытаний Бернулли. Для k  +  r испытаний Бернулли с вероятностью успеха p отрицательный бином дает вероятность k успехов и r неудач с неудачей в последнем испытании. Другими словами, отрицательное биномиальное распределение - это распределение вероятностей количества успехов до r- го отказа в процессе Бернулли с вероятностью p успехов в каждом испытании. Процесс Бернулли - это процесс с дискретным временем, поэтому количество попыток, неудач и успехов - целые числа.

Рассмотрим следующий пример. Предположим, мы несколько раз бросаем кубик и считаем 1 ошибкой. Вероятность успеха в каждом испытании - 5/6. Количество успехов до третьей неудачи принадлежит бесконечному множеству {0, 1, 2, 3, ...}. Это количество успехов является случайной величиной с отрицательным биномиальным распределением.

Когда r = 1, мы получаем распределение вероятностей количества успехов до первой неудачи (то есть вероятность того, что первая неудача произойдет в ( k  + 1) -м испытании), которое является геометрическим распределением :

Сверхдисперсный Пуассон

Отрицательное биномиальное распределение, особенно в его альтернативной параметризации, описанной выше, можно использовать в качестве альтернативы распределению Пуассона. Это особенно полезно для дискретных данных в неограниченном положительном диапазоне, дисперсия которого превышает выборочное среднее . В таких случаях наблюдения сверхдисперсны по отношению к распределению Пуассона, для которого среднее значение равно дисперсии. Следовательно, распределение Пуассона не является подходящей моделью. Поскольку отрицательное биномиальное распределение имеет на один параметр больше, чем Пуассон, второй параметр может использоваться для корректировки дисперсии независимо от среднего. См. Кумулянты некоторых дискретных распределений вероятностей .

Это применяется к годовому подсчету тропических циклонов в Северной Атлантике или к ежемесячному или шестимесячному подсчету зимних внетропических циклонов над Европой, для которых дисперсия больше среднего. В случае умеренной избыточной дисперсии это может дать результаты, по существу аналогичные сверхдисперсному распределению Пуассона.

Отрицательное биномиальное распределение также обычно используется для моделирования данных в виде счетчиков считывания дискретных последовательностей из высокопроизводительных экспериментов по секвенированию РНК и ДНК.

История

Это распределение было впервые изучено в 1713 году Монмортом как распределение количества испытаний, необходимых в эксперименте для достижения заданного количества успехов. Об этом ранее упоминал Паскаль .

Смотрите также

использованная литература