Сложное распределение вероятностей - Compound probability distribution

В вероятности и статистике , А распределение соединения вероятности (также известное как распределение смеси или контагиозное распределение ) является распределением вероятностей , что результаты при условии , что случайная величина распределена в соответствии с некоторым параметризованномом распределения, причем (некоторые) параметрами этого распределения сами являются случайными величинами. Если параметр является масштабным параметром , полученная смесь также называется масштабной смесью .

Составное распределение («безусловное распределение») является результатом маргинализации (интегрирования) по скрытой случайной величине (ам), представляющей параметр (ы) параметризованного распределения («условное распределение»).

Определение

Распределение вероятностей соединения является распределением вероятности того, что результаты при условии , что случайная величина распределена по некоторому параметризованному распределения с неизвестным параметром , который снова распределяется в соответствии с каким - либо другим распределением . Получившееся распределение называется распределением, полученным в результате сложения с . Распределение параметра также называется распределением смешивания или скрытым распределением . Технически, безусловные распределения результатов от маргинализации более , то есть, от интеграции из неизвестного параметра (ов) . Его функция плотности вероятности определяется как:

Та же формула применяется аналогично, если некоторые или все переменные являются векторами.

Из приведенных выше формул, можно увидеть , что распределение соединения по существу является частным случаем маргинального распределения : совместное распределение по и задается , и соединение его результаты , как маргинальное распределение: . Если область дискретна, то распределение снова является частным случаем смешанного распределения .

Характеристики

Составное распределение во многом напоминает исходное распределение, которое его сгенерировало, но обычно имеет большую дисперсию и часто также тяжелые хвосты . Поддержка из такой же , как поддержка со стороны , и часто форма во многом аналогична , как хорошо. Параметры включают любые параметры из или , которые не были исключены.

Первые два момента составного распределения даются

а также

( Закон полной дисперсии ).

Приложения

Тестирование

Распределения общей статистики теста получаются в виде составных распределений при их нулевой гипотезе, например, в t-критерии Стьюдента (где статистические результаты теста представлены как соотношение нормальной и случайной величины хи-квадрат ) или в F-тесте (где статистика теста - это отношение двух случайных величин хи-квадрат ).

Моделирование сверхдисперсии

Составные распределения полезны для моделирования результатов, демонстрирующих чрезмерную дисперсию , т. Е. Большую вариативность, чем можно было бы ожидать в рамках определенной модели. Например, данные подсчета обычно моделируются с использованием распределения Пуассона , дисперсия которого равна его среднему значению. Распределение можно обобщить, допустив вариативность его параметра скорости , реализованную через гамма-распределение , которое приводит к маргинальному отрицательному биномиальному распределению . Это распределение похоже по форме на распределение Пуассона, но допускает большие отклонения. Точно так же биномиальное распределение можно обобщить, чтобы учесть дополнительную изменчивость, добавив к нему бета-распределение для параметра вероятности успеха, что приводит к бета-биномиальному распределению .

Байесовский вывод

Помимо повсеместных маргинальных распределений, которые можно рассматривать как частные случаи составных распределений, в байесовском выводе составные распределения возникают, когда в приведенных выше обозначениях F представляет собой распределение будущих наблюдений, а G - апостериорное распределение параметров F с учетом информация в наборе наблюдаемых данных. Это дает апостериорное прогнозирующее распределение . Соответственно, для предварительного предиктивного распределения , F является распределением новой точки данных в то время как G является априорным распределением параметров.

Свертка

Свертка распределений вероятностей (для получения распределения вероятностей сумм случайных величин) также может рассматриваться как частный случай сложения; здесь распределение суммы по существу является результатом рассмотрения одного слагаемого как параметра случайного расположения для другого слагаемого.

Вычисление

Составные распределения, полученные из экспоненциальных семейных распределений, часто имеют замкнутую форму. Если аналитическое интегрирование невозможно, могут потребоваться численные методы.

Распределения соединений можно относительно легко исследовать с помощью методов Монте-Карло , т. Е. Путем генерации случайных выборок. Часто легко сгенерировать случайные числа из распределений, а затем использовать их для выполнения свернутой выборки Гиббса для генерации выборок .

Составное распределение обычно также может быть аппроксимировано в достаточной степени распределением смеси с использованием конечного числа компонентов смеси, что позволяет получить приблизительную плотность, функцию распределения и т. Д.

Оценка параметров ( оценка максимального правдоподобия или максимальная апостериорная оценка) в рамках модели составного распределения иногда может быть упрощена за счет использования EM-алгоритма .

Примеры

Похожие термины

Понятие «составное распределение», используемое, например, в определении составного распределения Пуассона или составного пуассоновского процесса , отличается от определения, найденного в этой статье. Смысл этой статьи соответствует тому, что используется, например, в байесовском иерархическом моделировании .

Смотрите также

Рекомендации

дальнейшее чтение

  • Линдси, Б.Г. (1995), Модели смесей: теория, геометрия и приложения , Серия региональных конференций NSF-CBMS по вероятности и статистике, 5 , Хейворд, Калифорния, США: Институт математической статистики, стр. I – 163, ISBN 978-0-940600-32-4, JSTOR  4153184
  • Зайдель, В. (2010), «Модели смесей», в Ловриче, М. (ред.), Международная энциклопедия статистических наук , Гейдельберг: Springer, стр. 827–829, DOI : 10.1007 / 978-3-642-04898 -2_368 , ISBN 978-3-642-04898-2
  • Настроение, AM; Graybill, FA; Boes, DC (1974), «III.4.3 Заражающие распределения и усеченные распределения », Введение в теорию статистики (3-е изд.), Нью-Йорк: McGraw-Hill, ISBN 978-0-07-042864-5
  • Джонсон, Нидерланды; Кемп, AW; Коц, С. (2005), «8 смесевых распределений », Одномерные дискретные распределения , Нью-Йорк: Wiley, ISBN. 978-0-471-27246-5