Распределение вероятностей
Распределение отношения (также известное как распределение фактора ) представляет собой распределение вероятностей строятся как распределение коэффициента от случайных величин , имеющих два других известных распределений. Учитывая две (обычно независимые ) случайные величины X и Y , распределение случайной величины Z , которое формируется как отношение Z = X / Y, является распределением отношения .
Примером может служить распределение Коши (также называемое распределением нормального отношения ), которое представляет собой отношение двух нормально распределенных переменных с нулевым средним. Два других распределения, часто используемых в тестовой статистике, также являются распределениями соотношений: t- распределение возникает из гауссовой случайной величины, деленной на независимую случайную величину с распределением хи , в то время как F- распределение происходит из отношения двух независимых распределенных хи-квадрат. случайные переменные. В литературе рассматривались более общие распределения соотношений.
Часто распределения соотношений имеют « тяжелый хвост» , и может быть трудно работать с такими распределениями и разработать соответствующий статистический тест . Метод, основанный на медиане , был предложен в качестве «временного решения».
Алгебра случайных величин
Отношение один типа алгебры для случайных величин: относящийся к распределению соотношений является распределением продукта , распределение суммы и распределение разности . В более общем смысле можно говорить о комбинациях сумм, разностей, произведений и соотношений. Многие из этих распределений описаны в книге Мелвина Д. Спрингера 1979 года «Алгебра случайных величин» .
Алгебраические правила, известные для обычных чисел, не применимы к алгебре случайных величин. Например, если продукт C = AB и соотношение D = C / A, это не обязательно означает, что распределения D и B одинаковы. Действительно, для распределения Коши наблюдается особый эффект : произведение и отношение двух независимых распределений Коши (с одним и тем же параметром масштаба и параметром местоположения, установленным на ноль) дадут одно и то же распределение. Это становится очевидным , когда в отношении распределения Коши как само по себе распределение отношение двух гауссовых распределений нулевых средств: Рассмотрим две случайные величины Коши, и каждый построен из двух гауссовых распределений и затем
где . Первый член - это отношение двух распределений Коши, а последний член - произведение двух таких распределений.
Вывод
Способ получения отношения распределения из совместного распределения двух других случайных величин X, Y с совместным pdf заключается в интегрировании следующей формы
Если две переменные независимы, тогда это становится
Это может быть непросто. В качестве примера возьмем классическую задачу о соотношении двух стандартных гауссовских отсчетов. Совместный PDF-файл
Определяя, у нас есть
Используя известный определенный интеграл, получаем
что распределение Коши, или Стьюдента т распределение с п = 1
,
Преобразование Меллина также было предложено для вывода распределений отношений.
В случае положительных независимых переменных действуйте следующим образом. На диаграмме показано разделимое двумерное распределение, которое имеет поддержку в положительном квадранте, и мы хотим найти pdf отношения . Заштрихованный объем над линией представляет совокупное распределение функции, умноженное на логическую функцию . Плотность сначала интегрируется в горизонтальные полосы; горизонтальная полоса на высоте y простирается от x = 0 до x = Ry и имеет возрастающую вероятность .
Во- вторых, интегрировать горизонтальные полосы вверх по всем у дает объем вероятности выше линии
Наконец, дифференцируйте, чтобы получить pdf .
Перенесем дифференцирование внутрь интеграла:
и с тех пор
тогда
В качестве примера найдите pdf отношения R, когда
Оценка совокупного распределения коэффициента
У нас есть
таким образом
Дифференциация относительно R дает pdf для R
Моменты случайных соотношений
Из Меллина теории, для распределения существующего только на положительной полуоси , мы имеем тождественный продукт при условии , являются независимыми. В случае отношения таких выборок , чтобы использовать это тождество, необходимо использовать моменты обратного распределения. Установите такой, что . Таким образом, если моменты и можно определить отдельно, то можно найти моменты . Моменты определяются из обратного PDF-файла , часто выполняемого упражнения. В простейшем случае .
Для иллюстрации позвольте взять образец из стандартного гамма-распределения.
-
чей момент .
выбирается из обратного гамма-распределения с параметром и имеет формат PDF . Моменты этого pdf
Умножение соответствующих моментов дает
Независимо, известно, что соотношение двух выборок гаммы соответствует распределению Beta Prime:
-
чьи моменты
Мы имеем замену ,
которая согласуется с результатом моментов выше.
Средние и дисперсии случайных соотношений
В разделе « Распределение продукта », выведенном из теории преобразования Меллина (см. Раздел выше), обнаружено, что среднее значение произведения независимых переменных равно произведению их средних значений. В случае отношений имеем
что в терминах вероятностных распределений эквивалентно
Обратите внимание, что
Дисперсия отношения независимых переменных равна
Распределения нормального отношения
Некоррелированное центральное нормальное соотношение
Когда X и Y независимы и имеют гауссово распределение с нулевым средним, форма их распределения отношения является распределением Коши . Это можно получить, установив, а затем показывая, что имеет круговую симметрию. Для двумерного некоррелированного гауссовского распределения имеем
Если является функцией только r, то равномерно распределена на, поэтому задача сводится к нахождению распределения вероятностей Z при отображении
По сохранению вероятности имеем
и с тех пор
и установив получаем
Здесь есть ложный коэффициент 2. Фактически, два значения карты совпадают с одним и тем же значением z , плотность удваивается, и конечный результат
Когда любое из двух нормальных распределений не является центральным, тогда результат распределения отношения намного сложнее и приводится ниже в сжатой форме, представленной Дэвидом Хинкли . Однако тригонометрический метод для отношения распространяется на радиальные распределения, такие как двумерные нормали или двумерное значение Стьюдента t, в котором плотность зависит только от радиуса . Он не распространяется на отношение двух независимых t- распределений Стьюдента, которые дают отношение Коши, показанное в разделе ниже для одной степени свободы.
Некоррелированное нецентральное нормальное соотношение
В отсутствие корреляции , то функция плотности вероятности двух нормальных величин Х = N ( μ X , σ Х 2 ) и Y = N ( μ Y , σ Y 2 ) соотношение Z = X / Y дается в точности следующих выражение, полученное из нескольких источников:
куда
и - нормальная кумулятивная функция распределения :
-
.
При определенных условиях возможно нормальное приближение с вариацией:
Коррелированное центральное нормальное соотношение
Вышеупомянутое выражение становится более сложным, когда переменные X и Y коррелируют. Если и получено более общее распределение Коши
где ρ - коэффициент корреляции между X и Y и
Сложное распределение также было выражено конфлюэнтной гипергеометрической функцией Куммера или функцией Эрмита .
Коррелированное нецентральное нормальное соотношение
Приближение к коррелированному нецентральному нормальному отношению
Преобразование в лог-домен было предложено Кацем (1978) (см. Биномиальный раздел ниже). Пусть отношение будет
-
.
Возьмите журналы, чтобы получить
-
.
С
тех пор асимптотически
-
.
В качестве альтернативы Гири (1930) предположил, что
имеет приблизительно стандартное гауссово распределение : это преобразование было названо преобразованием Гири – Хинкли ; аппроксимация хороша, если Y в принципе не принимает отрицательные значения .
Точное коррелированное нецентральное нормальное соотношение
Гири показал, как коррелированное отношение может быть преобразовано в форму, близкую к гауссовой, и разработал приближение для зависимости от вероятности того, что отрицательные значения знаменателя будут исчезающе малыми. Более поздний анализ коррелированных соотношений Филлера является точным, но при использовании с современными математическими пакетами необходимо соблюдать осторожность, и аналогичные проблемы могут возникнуть в некоторых уравнениях Марсальи. Фам-Гиа исчерпывающе обсудил эти методы. Коррелированные результаты Хинкли точны, но ниже показано, что условие коррелированного отношения может быть просто преобразовано в некоррелированное условие, поэтому требуются только упрощенные уравнения Хинкли, приведенные выше, а не полная версия коррелированного отношения.
Пусть соотношение будет:
в которых коррелированные нормальные переменные с нулевым средним и дисперсиями имеют такие средства
записи , которые становятся некоррелированными и имеют стандартное отклонение
Соотношение:
инвариантен относительно этого преобразования и сохраняет тот же PDF-файл. Член в числителе производится разъемным путем расширения:
получить
в котором и z теперь стало отношением некоррелированных нецентральных нормальных выборок с инвариантным z- смещением.
Наконец, чтобы быть точным, pdf отношения для коррелированных переменных находится путем ввода измененных параметров и в приведенное выше уравнение Хинкли, которое возвращает pdf для коррелированного отношения с постоянным смещением на .
Контуры коррелированного двумерного распределения Гаусса (не в масштабе), дающего отношение x / y
pdf отношения Гаусса
z и моделирование (точки) для
На приведенных выше рисунках показан пример положительно коррелированного отношения, в котором заштрихованные клинья представляют приращение площади, выбранной заданным соотношением, которое накапливает вероятность того, что они перекрывают распределение. Теоретическое распределение, полученное из обсуждаемых уравнений в сочетании с уравнениями Хинкли, хорошо согласуется с результатом моделирования с использованием 5000 выборок. На верхнем рисунке легко понять, что для отношения клин почти полностью обходит массу распределения, и это совпадает с областью, близкой к нулю, в теоретической PDF. И наоборот, чем меньше значение, тем выше вероятность того, что линия приближается к нулю.
Это преобразование будет признано тем же, что использовалось Гири (1932) в качестве частичного результата в его уравнении viii, но вывод и ограничения которого вряд ли были объяснены. Таким образом , первая часть преобразования Гири к приближенному гауссовости в предыдущем разделе , на самом деле точная и не зависит от положительности Y . Результат смещения также согласуется с коррелированным распределением гауссова отношения «Коши» с нулевым средним в первом разделе. Марсалья применил тот же результат, но использовал нелинейный метод для его достижения.
Комплексное нормальное соотношение
Отношение коррелированных циркулярно-симметричных комплексных нормально распределенных переменных с нулевым средним было определено Baxley et. al. Совместное распределение x, y равно
куда
является эрмитовым транспонированием и
PDF-файл оказался
В обычном случае мы получаем
Также приведены другие результаты в закрытой форме для CDF.
Распределение соотношения коррелированных комплексных переменных, rho = 0,7 exp (i pi / 4).
График показывает pdf отношения двух комплексных нормальных переменных с коэффициентом корреляции . Пик pdf возникает примерно при комплексном сопряжении уменьшенного значения .
Равномерное распределение соотношения
С двумя независимыми случайными величинами, которые следуют равномерному распределению , например,
соотношение распределения становится
Распределение отношения Коши
Если две независимые случайные величины, каждая из X и Y подчиняется распределению Коши с медианой, равной нулю, и коэффициентом формы.
тогда распределение отношения для случайной величины будет
Это распределение не зависит от Springer, и результат, указанный Springer (стр. 158, вопрос 4.6), неверен. Распределение соотношений похоже на распределение произведений случайной величины, но не то же самое :
В более общем плане, если каждая из двух независимых случайных величин X и Y подчиняется распределению Коши с медианой, равной нулю, и коэффициентом формы и соответственно, то:
1. Распределение отношения для случайной величины :
2. Распределение продукта для случайной величины :
Результат для распределения соотношений можно получить из распределения продуктов, заменив на
Соотношение стандартной нормальной формы к стандартной униформе
Если X имеет стандартное нормальное распределение, а Y имеет стандартное равномерное распределение, то Z = X / Y имеет распределение, известное как распределение косой черты , с функцией плотности вероятности
где φ ( z ) - функция плотности вероятности стандартного нормального распределения.
Хи-квадрат, гамма, бета-распределения
Пусть X - нормальное (0,1) распределение, Y и Z - распределения хи-квадрат с m и n степенями свободы соответственно, все независимые, с . потом
-
в распределении Стьюдента
-
т.е. распределение F-критерия Фишера
-
бета - распределение
-
бета простое распределение
Если , нецентральная хи-квадрат распределение , а и не зависит от то
-
, нецентральное F-распределение .
определяет , F-распределение плотности Фишера, PDF отношения двух хи-квадратов с m, n степенями свободы.
Функция CDF плотности Фишера, найденная в F- таблицах, определена в статье о простом бета-распределении . Если мы введем таблицу F- тестов с m = 3, n = 4 и вероятностью 5% в правом хвосте, критическое значение окажется равным 6,59. Это совпадает с интегралом
Если , где , то
Если тогда
Если , то, изменяя масштаб параметра до единицы, мы имеем
- таким образом
- т.е. если тогда
Более конкретно, поскольку
если
тогда
куда
Распределения Рэлея
Если X, Y являются независимыми выборками из распределения Рэлея , отношение Z = X / Y следует распределению
и имеет cdf
Единственным параметром распределения Рэлея является масштабирование. Распределение следующих
и имеет cdf
Дробное гамма-распределение (включая хи, хи-квадрат, экспоненциальное, Рэлея и Вейбулла)
Обобщенная гамма - распределение является
который включает в себя регулярную гамму, хи, хи-квадрат, экспоненциальное распределение, распределения Рэлея, Накагами и Вейбулла с использованием дробных степеней.
- Если
- тогда
- куда
Моделирование смеси различных масштабных коэффициентов
В приведенных выше соотношениях гамма-выборки, U , V могут иметь разные размеры выборки, но должны быть взяты из одного и того же распределения с одинаковым масштабированием .
В ситуациях, когда U и V масштабируются по-разному, преобразование переменных позволяет определить модифицированный pdf случайного отношения. Пусть где произвольно и, сверху .
Произвольно масштабируйте V , определяя
Имеем и подстановка в Y дает
Преобразование X в Y дает
Отмечая, что мы, наконец, имеем
Таким образом, если и затем распределяется как с
Распределение Y ограничено здесь интервалом [0,1]. Его можно обобщить путем масштабирования так, что если тогда
куда
-
тогда образец из
Взаимные образцы из бета-дистрибутивов
Хотя это и не соотношения двух переменных, полезны следующие тождества для одной переменной:
- Если тогда
- Если тогда
объединение последних двух уравнений дает
- Если тогда .
- Если тогда
поскольку
тогда
-
, распределение обратных отсчетов.
Если и
Дальнейшие результаты можно найти в статье об обратном распределении .
- Если являются независимыми экспоненциальными случайными величинами со средним значением μ , то X - Y - это двойная экспоненциальная случайная величина со средним значением 0 и масштабом μ .
Биномиальное распределение
Этот результат был впервые получен Кацем и др. В 1978 году.
Предположим, что X ~ Binomial ( n , p 1 ) и Y ~ Binomial ( m , p 2 ) и X , Y независимы. Пусть T = ( X / n ) / ( Y / m ).
Тогда log ( T ) приблизительно нормально распределен со средним логарифмом ( p 1 / p 2 ) и дисперсией ((1 / p 1 ) - 1) / n + ((1 / p 2 ) - 1) / m .
Распределение биномиального отношения имеет значение в клинических испытаниях: если распределение T известно, как указано выше, можно оценить вероятность того, что данное соотношение возникнет чисто случайно, то есть ложноположительное испытание. В ряде работ сравнивается надежность различных приближений для биномиального отношения.
Пуассоновские и усеченные распределения Пуассона.
В отношении переменных Пуассона R = X / Y существует проблема, заключающаяся в том, что Y равно нулю с конечной вероятностью, поэтому R не определено. Чтобы противостоять этому, мы рассматриваем усеченное, или цензурированное, отношение R '= X / Y', при котором нулевые выборки Y не учитываются. Более того, во многих медицинских обследованиях существуют систематические проблемы с надежностью нулевых выборок как X, так и Y, и может быть хорошей практикой в любом случае игнорировать нулевые выборки.
Вероятность того, что нулевой образец Пуассона является общим pdf усеченного слева распределения Пуассона, составляет
что в сумме равно единице. Следуя Коэну, для n независимых испытаний многомерный усеченный PDF равен
и вероятность журнала становится
При дифференцировании получаем
а установка в ноль дает оценку максимального правдоподобия
Обратите внимание, что таким образом усеченная оценка максимального правдоподобия , хотя и верна как для усеченного, так и для неусеченного распределений, дает усеченное среднее значение, которое сильно смещено по сравнению с неусеченным. Тем не менее , представляется , что является достаточной статистикой для так зависит от данных только через выборочное среднее в предыдущем уравнении , которое согласуется с методологией обычного распределения Пуассона .
При отсутствии каких-либо решений в закрытой форме следующая приблизительная реверсия для усеченного действительна во всем диапазоне .
который сравнивается с необрезанной версией, которая просто . Принятие соотношения является допустимой операцией, даже если может использоваться модель без усечения, а модель с усечением влево.
Асимптотика больших (и граница Крамера – Рао ) имеет вид
в котором замена L дает
Затем подставляя из приведенного выше уравнения, мы получаем оценку дисперсии Коэна
Дисперсия точечной оценки среднего , основанная на n попытках, асимптотически уменьшается до нуля при увеличении n до бесконечности. Для небольших он отличается от усеченной дисперсии PDF, например, в Спрингеле, который цитирует дисперсию
для n образцов в усеченном слева PDF-файле, показанном в верхней части этого раздела. Коэн показал, что дисперсия оценки относительно дисперсии pdf`` колеблется от 1 для больших (эффективность 100%) до 2, когда приближается к нулю (эффективность 50%).
Эти оценки среднего и дисперсионного параметров вместе с параллельными оценками для X могут применяться к нормальным или биномиальным приближениям для коэффициента Пуассона. Образцы из испытаний могут не подходить для процесса Пуассона; дальнейшее обсуждение усечения Пуассона проведено Дитцем и Бенингом, и есть запись в Википедии о распределении Пуассона с нулевым усечением .
Двойное распределение Lomax
Это распределение является соотношением двух распределений Лапласа . Пусть Х и Y быть стандартными Лапласа одинаково распределенные случайные величины , и пусть г = Х / Y . Тогда распределение вероятностей z равно
Пусть среднее значение X и Y равно a . Тогда стандартное двойное распределение Ломакса симметрично относительно a .
Это распределение имеет бесконечное среднее значение и дисперсию.
Если Z имеет стандартное двойное распределение Ломакса, то 1 / Z также имеет стандартное двойное распределение Ломакса.
Стандартное распределение Ломакса является унимодальным и имеет более тяжелые хвосты, чем распределение Лапласа.
При 0 < в <1, то й момент существует.
где Γ - гамма-функция .
Распределения соотношений в многомерном анализе
Распределения отношений также появляются в многомерном анализе . Если случайные матрицы X и Y подчиняются распределению Уишарта, то отношение детерминантов
пропорциональна произведению независимых F случайных величин. В случае, когда X и Y взяты из независимых стандартизованных распределений Уишарта, то отношение
имеет лямбда-распределение Уилкса .
Отношения квадратичных форм с матрицами Уишарта
Распределение вероятностей может быть получено из случайных квадратичных форм
где случайны. Если A является обратной по отношению к другой матрице B, то это в некотором смысле случайное отношение, часто возникающее в задачах оценки методом наименьших квадратов.
В гауссовском случае, если A - матрица, полученная из комплексного распределения Уишарта размерности pxp и k степеней свободы с произвольным комплексным вектором с эрмитовым (сопряженным) транспонированием , отношение
следует гамма-распределению
Результат возникает при использовании адаптивной винеровской фильтрации методом наименьших квадратов - см. Уравнение (A13) в. Обратите внимание, что в оригинальной статье утверждается, что распространение .
Аналогичным образом , для полного ранга ( с нулевым средним вещественного Уишартом образцов матричных
и V случайного вектором независимо от W , отношение
Этот результат обычно приписывают Muirhead (1982).
Учитывая комплексную матрицу Уишарта , отношение
следует бета-распределению (см. уравнение (47))
Результат возникает при анализе производительности ограниченной фильтрации методом наименьших квадратов и выводится из более сложного, но в конечном итоге эквивалентного отношения, которое, если тогда
В своей простейшей форме, если и тогда отношение квадрата обратного элемента (1,1) к сумме квадратов модулей всех элементов верхней строки имеет распределение
Смотрите также
использованная литература
внешние ссылки