Непрерывное равномерное распределение - Continuous uniform distribution

Униформа
Функция плотности вероятности
PDF равномерного распределения вероятностей с использованием соглашения о максимуме в точках перехода.
Используя максимальное соглашение
Кумулятивная функция распределения
CDF равномерного распределения вероятностей.
Обозначение
Параметры
Служба поддержки
PDF
CDF
Иметь в виду
Медиана
Режим любое значение в
Дисперсия
Асимметрия 0
Бывший. эксцесс
Энтропия
MGF
CF

В теории вероятностей и статистике , то непрерывное равномерное распределение или прямоугольное распределение представляет собой семейство симметричных распределений вероятностей . Распределение описывает эксперимент, в котором возможен произвольный результат, находящийся в определенных пределах. Границы определяются параметрами a и b , которые являются минимальным и максимальным значениями. Интервал может быть закрытым (например, [a, b]) или открытым (например, (a, b)). Поэтому распределение часто обозначают аббревиатурой U ( a , b ), где U означает равномерное распределение. Разница между границами определяет длину интервала; все интервалы одинаковой длины на опоре распределения равновероятны. Это максимальное распределение вероятностей энтропии для случайной величины X без каких-либо ограничений, кроме тех, которые содержатся в носителе распределения.

Определения

Функция плотности вероятности

Функция плотности вероятности непрерывного равномерного распределения:

Значения f ( x ) на двух границах a и b обычно не важны, потому что они не изменяют значения интегралов f ( xdx на любом интервале, а также x  f ( xdx или любой более высокий момент. Иногда их выбирают равными нулю, а иногда - 1/б  -  а. Последнее уместно в контексте оценки методом максимального правдоподобия . В контексте анализа Фурье можно принять значение f ( a ) или f ( b ) как1/2 ( б  -  а ), с тех пор обратное преобразование многих интегральных преобразований этой равномерной функции вернет саму функцию, а не функцию, которая равна « почти всюду », то есть кроме набора точек с нулевой мерой . Кроме того, это согласуется со знаковой функцией, в которой нет такой двусмысленности.

Графически функция плотности вероятности изображается в виде прямоугольника, где - основание, а - высота. По мере увеличения расстояния между a и b плотность при любом конкретном значении в границах распределения уменьшается. Поскольку функция плотности вероятности интегрируется до 1, высота функции плотности вероятности уменьшается с увеличением длины основания.

В терминах среднего μ и дисперсии σ 2 плотность вероятности может быть записана как:

Кумулятивная функция распределения

Кумулятивная функция распределения является:

Его обратное:

В обозначениях среднего и дисперсии кумулятивная функция распределения имеет вид:

и обратное:

Пример 1. Использование равномерной кумулятивной функции распределения.

Для случайной величины X

Найдите :

.

В графическом представлении функции равномерного распределения [f (x) vs x] область под кривой в указанных границах отображает вероятность (заштрихованная область отображается в виде прямоугольника). В этом конкретном примере, приведенном выше, будет основание, а высота - .

Пример 2. Использование функции равномерного кумулятивного распределения (условное)

Для случайной величины X

Найдите :

.

Приведенный выше пример относится к случаю условной вероятности для равномерного распределения: задано верно, какова вероятность того, что . Условная вероятность изменяет пространство выборки, поэтому необходимо вычислить новую длину интервала , где b равно 23, а a равно 8. Графическое представление все равно будет соответствовать примеру 1, где область под кривой в указанных границах отображает вероятность и базу. прямоугольника будет и высотой .

Производящие функции

Момент-генерирующая функция

Функция создания момента :

из которых мы можем вычислить исходные моменты m k

Для частного случая a  = - b , т. Е. Для

функции, производящие момент, сводятся к простому виду

Для случайной величины ниже этого распределения, то ожидаемое значение затем т 1 = (  +  б ) / 2 , а дисперсия является м 2  -  м 1 2 = ( б  -  ) 2 /12.

Кумулянт-производящая функция

Для п  ≥ 2 , на п - й кумулянта распределения равномерной на интервале [-1/2, 1/2] является В п / п , где Б п является п - го числа Бернулли .

Стандартная униформа

Ограничивая и , полученное распределение U (0,1) называется стандартным равномерным распределением .

Одно интересное свойство стандартного равномерного распределения состоит в том, что если u 1 имеет стандартное равномерное распределение, то также и 1- u 1 . Это свойство можно использовать , среди прочего, для генерации противоположных переменных . Другими словами, это свойство известно как метод инверсии, при котором непрерывное стандартное равномерное распределение может использоваться для генерации случайных чисел для любого другого непрерывного распределения. Если у является равномерным случайное число с помощью стандартного равномерного распределения (0,1), а затем генерирует случайное число х из любого непрерывного распределения с заданной функцией распределения F .

Связь с другими функциями

Пока те же соглашения соблюдаются в точках перехода, функция плотности вероятности также может быть выражена в терминах ступенчатой ​​функции Хевисайда :

или в терминах функции прямоугольника

В точке перехода знаковой функции нет двусмысленности . Используя соглашение о половине максимума в точках перехода, равномерное распределение можно выразить через знаковую функцию как:

Характеристики

Моменты

Среднее значение (первый момент ) распределения:

Второй момент раздачи:

В общем, n-й момент равномерного распределения равен:

Дисперсия (второй центральный момент ) составляет:

Статистика заказов

Пусть X 1 , ..., X n - образец идентификатора из U (0,1). Пусть X ( k ) будет статистикой k- го порядка из этой выборки. Тогда распределение вероятностей X ( k ) является бета-распределением с параметрами k и n - k + 1 . Ожидаемое значение

Этот факт полезен при принятии Q-Q участков .

Расхождения

См. Также: Статистика заказов § Распределения вероятностей статистики заказов.

Единообразие

Вероятность того, что равномерно распределенная случайная величина попадает в любой интервал фиксированной длины, не зависит от местоположения самого интервала (но зависит от размера интервала), пока интервал содержится в опоре распределения.

Чтобы убедиться в этом, если X ~ U ( a , b ) и [ x , x + d ] - подынтервал в [ a , b ] с фиксированным d > 0, то

которое не зависит от x . Этот факт мотивирует название дистрибутива.

Обобщение на борелевские множества.

Это распределение можно обобщить на более сложные наборы, чем интервалы. Если S является борелевское множество положительной, конечной мерой, то равномерное распределение вероятностей на S может быть определено путем определения PDF равным нулю вне S и постоянно равна 1 / K на S , где K является мерой Лебега на S .

Связанные дистрибутивы

Статистические выводы

Оценка параметров

Оценка максимума

Несмещенная оценка минимальной дисперсии

Учитывая равномерное распределение на [0,  Ь ] с неизвестным б, минимальной дисперсии несмещенной оценкой (UMVUE) для максимума задается

где m - максимум выборки, а k - размер выборки, выборка без замены (хотя это различие почти наверняка не имеет значения для непрерывного распределения). Это следует по тем же причинам, что и оценка дискретного распределения , и может рассматриваться как очень простой случай оценки максимального разнесения . Эта проблема широко известна как проблема немецких танков из-за применения максимальной оценки к оценке производства немецких танков во время Второй мировой войны .

Оценщик максимального правдоподобия

Оценка максимального правдоподобия определяется по формуле:

где m - максимум выборки , также обозначаемый как статистика максимального порядка выборки.

Метод оценки момента

Метод моментов оценки определяется по формуле:

где - выборочное среднее.

Оценка середины

Середина распределения ( a  +  b ) / 2 является как средним, так и медианным значением равномерного распределения. Хотя и среднее значение выборки, и медиана выборки являются несмещенными оценками средней точки, ни один из них не является таким же эффективным, как средний диапазон выборки , то есть среднее арифметическое максимума выборки и минимум выборки, который является UMVU- оценкой средней точки (и также оценка максимального правдоподобия ).

Доверительный интервал

По максимуму

Пусть X 1 , X 2 , X 3 , ..., X n будет выборкой, из которой L - максимум совокупности. Тогда X ( n ) = max ( X 1 , X 2 , X 3 , ..., X n ) имеет плотность Лебега-Бореля

Приведенный ранее доверительный интервал математически неверен, так как не может быть решен без знания . Однако можно решить

 for   for any unknown but valid ,

затем выбирается наименьшее возможное, удовлетворяющее вышеуказанному условию. Обратите внимание, что длина интервала зависит от случайной величины .

Возникновение и приложения

Вероятности для функции равномерного распределения легко вычислить из-за простоты формы функции. Следовательно, существуют различные приложения, для которых это распределение может использоваться, как показано ниже: ситуации проверки гипотез, случаи случайной выборки, финансы и т. Д. Кроме того, в целом эксперименты физического происхождения следуют равномерному распределению (например, выброс радиоактивных частиц ). Однако важно отметить, что в любом приложении есть неизменное предположение, что вероятность попадания в интервал фиксированной длины постоянна.

Пример экономики для равномерного распределения

В области экономики обычно спрос и пополнение могут не соответствовать ожидаемому нормальному распределению. В результате для лучшего прогнозирования вероятностей и тенденций используются другие модели распределения, такие как процесс Бернулли . Но согласно Ванке (2008), в частном случае исследования времени выполнения заказа для управления запасами в начале жизненного цикла, когда анализируется совершенно новый продукт, равномерное распределение оказывается более полезным. В этой ситуации другое распределение может оказаться нежизнеспособным, поскольку нет существующих данных о новом продукте или что история спроса недоступна, поэтому на самом деле нет подходящего или известного распределения. Равномерное распределение было бы идеальным в этой ситуации, поскольку случайная переменная времени выполнения заказа (связанная со спросом) для нового продукта неизвестна, но результаты, вероятно, будут находиться в диапазоне между правдоподобным диапазоном двух значений. Свинцово-время , таким образом , представляет собой случайную величину. На основе модели равномерного распределения можно было рассчитать другие факторы, связанные со временем выполнения заказа, такие как уровень обслуживания цикла и дефицит за цикл . Также было отмечено, что равномерное распределение также использовалось из-за простоты расчетов.

Выборка из произвольного распределения

Равномерное распределение полезно для выборки из произвольных распределений. Общий метод - это метод выборки с обратным преобразованием, который использует кумулятивную функцию распределения (CDF) целевой случайной величины. Этот метод очень полезен в теоретической работе. Поскольку моделирование с использованием этого метода требует инвертирования CDF целевой переменной, были разработаны альтернативные методы для случаев, когда cdf неизвестен в закрытой форме. Один из таких методов - отбраковочная выборка .

Нормальное распределение является важным примером , где обратное преобразование метод не является эффективным. Однако существует точный метод, преобразование Бокса – Мюллера , которое использует обратное преобразование для преобразования двух независимых однородных случайных величин в две независимые нормально распределенные случайные величины.

Ошибка квантования

При аналого-цифровом преобразовании возникает ошибка квантования. Эта ошибка возникает из-за округления или усечения. Когда исходный сигнал намного больше, чем один младший значащий бит (LSB) , ошибка квантования существенно не коррелирует с сигналом и имеет приблизительно равномерное распределение. Следовательно, среднеквадратичная ошибка следует из дисперсии этого распределения.

Вычислительные методы

Выборка из равномерного распределения

Есть много приложений, в которых полезно проводить имитационные эксперименты. Многие языки программирования поставляются с реализациями для генерации псевдослучайных чисел, которые эффективно распределяются в соответствии со стандартным равномерным распределением.

Если u является значением, выбранным из стандартного равномерного распределения, тогда значение a + ( b - a ) u следует за равномерным распределением, параметризованным a и b , как описано выше.

История

Хотя исторические истоки концепции равномерного распределения неубедительны, предполагается, что термин «равномерный» возник из концепции равновероятности в играх в кости (обратите внимание, что игры в кости будут иметь дискретное, а не непрерывное однородное пространство выборки). Равновероятность была упомянута в Liber de Ludo Aleae Джероламо Кардано , руководстве, написанном в 16 веке и подробно описывающем продвинутое исчисление вероятностей применительно к играм в кости.

Смотрите также

использованная литература

дальнейшее чтение

внешние ссылки