Характеристическая функция (теория вероятностей) - Characteristic function (probability theory)

Характеристическая функция однородной случайной величины U (–1,1). Эта функция является действительной, потому что она соответствует случайной величине, симметричной относительно начала координат; однако характеристические функции обычно могут быть комплексными.

В теории вероятностей и статистике , то характеристическая функция любой вещественной случайной величины полностью определяет ее распределение вероятностей . Если случайная величина допускает функцию плотности вероятности , то характеристическая функция является преобразованием Фурье функции плотности вероятности. Таким образом, он обеспечивает альтернативный путь к аналитическим результатам по сравнению с работой напрямую с функциями плотности вероятности или кумулятивными функциями распределения.. Есть особенно простые результаты для характеристических функций распределений, определяемых взвешенными суммами случайных величин.

Помимо одномерных распределений , характеристические функции могут быть определены для векторных или матричных случайных величин, а также могут быть расширены на более общие случаи.

Характеристическая функция всегда существует, когда рассматривается как функция действительного аргумента, в отличие от функции, производящей момент . Существуют связи между поведением характеристической функции распределения и свойствами распределения, такими как наличие моментов и существование функции плотности.

Вступление

Характеристическая функция предоставляет альтернативный способ описания случайной величины . Подобно кумулятивной функции распределения ,

(где 1 { Х ≤ х } является функцией индикатора - он равен 1 , когда X ≤ х , и ноль в противном случае), который полностью определяет поведение и свойства распределения вероятностей случайной величины X . Характеристической функции ,

Также полностью определяет поведение и свойства распределения вероятностей случайной величины X . Эти два подхода эквивалентны в том смысле, что, зная одну из функций, всегда можно найти другую, но они дают разные идеи для понимания свойств случайной величины. Более того, в отдельных случаях могут быть различия в том, могут ли эти функции быть представлены в виде выражений, включающих простые стандартные функции.

Если случайная величина допускает функцию плотности , то характеристическая функция является ее двойственной в том смысле, что каждая из них является преобразованием Фурье другого. Если случайная величина имеет функцию , генерирующую момент , то область определения характеристической функции может быть расширена до комплексной плоскости, и

Однако обратите внимание, что характеристическая функция распределения всегда существует, даже если функции плотности вероятности или функции, производящей момент , нет.

Подход характеристических функций особенно полезен при анализе линейных комбинаций независимых случайных величин: классическое доказательство центральной предельной теоремы использует характеристические функции и теорему Леви о непрерывности . Другое важное приложение - теория разложимости случайных величин.

Определение

Для скалярного случайной величины X характеристической функция определяются как ожидаемое значение из электронной ITX , где я являюсь мнимой единицей , и тR является аргументом характеристической функции:

Здесь F X является кумулятивной функцией распределения по X , а интеграл от Римана-Стилтьеса рода. Если случайная величина X имеет функцию плотности вероятности f X , то характеристической функцией является ее преобразование Фурье с изменением знака в комплексной экспоненте, и последняя формула в скобках действительна. Вопрос Х ( р ) является обратной кумулятивной функция распределения X также называется функцией квантиля из X . Это соглашение для констант, фигурирующих в определении характеристической функции, отличается от обычного соглашения для преобразования Фурье. Например, некоторые авторы определяют φ X ( t ) = E e −2 πitX , что по сути является заменой параметра. В литературе можно встретить и другие обозначения: как характеристическую функцию для вероятностной меры p или как характеристическую функцию, соответствующую плотности f .

Обобщения

Понятие характеристических функций обобщается на многомерные случайные величины и более сложные случайные элементы . Аргумент характеристической функции всегда будет принадлежать непрерывному двойственному пространству, в котором случайная величина X принимает свои значения. Для общих случаев такие определения перечислены ниже:

где это транспонирование вектора   ,
где - оператор следа ,
где является комплексно сопряженным из  и является действительной частью комплексного числа ,
где - сопряженное транспонирование вектора   ,
  • Если X ( s ) - случайный процесс , то для всех функций t ( s ) таких, что интеграл сходится почти для всех реализаций X

Примеры

Распределение Характеристическая функция φ ( t )
Вырождаются δ a
Бернулли Берн ( р )
Бином B ( n, p )
Отрицательный бином NB ( r, p )
Пуассон Пуа (λ)
Равномерный (непрерывный) U ( a, b )
Равномерные (дискретные) ДУ ( а, б )
Лаплас L ( μ, b )
Нормальный N ( μ, σ 2 )
Хи-квадрат χ 2 k
Коши C ( μ, θ )
Гамма Γ ( k, θ )
Экспоненциальный Exp ( λ )
Геометрический Gf ( p )
(количество отказов)
Geometric Gt ( p )
(количество испытаний)
Многомерный нормальный N ( μ , Σ )
Многомерные Коши MultiCauchy ( μ , Σ )

Оберхеттингер (1973) предоставляет обширные таблицы характеристических функций.

Характеристики

  • Характеристическая функция вещественнозначной случайной величины всегда существует, поскольку она является интегралом ограниченной непрерывной функции над пространством, мера которого конечна.
  • Характеристическая функция равномерно непрерывна на всем пространстве
  • Он не обращается в нуль в области около нуля: φ (0) = 1.
  • Он ограничен: | φ ( t ) | ≤ 1.
  • Оно эрмитово : φ (- t ) = φ ( t ) . В частности, характеристическая функция симметричной (относительно начала координат) случайной величины является действительной и четной .
  • Существует взаимное соответствие между распределениями вероятностей и характеристическими функциями. То есть для любых двух случайных величин X 1 , X 2 обе имеют одинаковое распределение вероятностей тогда и только тогда, когда .
  • Если случайная величина Х имеет моменты до K -го порядка, то характеристическая функция φ X является K раз непрерывно дифференцируемых на всей прямой. В этом случае
  • Если характеристическая функция φ X имеет k -ю производную в нуле, то случайная величина X имеет все моменты до k, если k четное, но только до k - 1, если k нечетное.
  • Если X 1 , ..., X n - независимые случайные величины, а a 1 , ..., a n - некоторые константы, то характеристическая функция линейной комбинации X i равна
Один конкретный случай - это сумма двух независимых случайных величин X 1 и X 2, и в этом случае мы имеем
  • Хвостовое поведение характеристической функции определяет гладкость соответствующей функции плотности.
  • Пусть случайная величина является линейным преобразованием случайной величины . Характеристическая функция является . Для случайных векторов и (где A - постоянная матрица, а B - постоянный вектор) имеем .

Непрерывность

Установленное выше взаимное соответствие между распределениями вероятностей и характеристическими функциями последовательно непрерывно . То есть всякий раз, когда последовательность функций распределения F j ( x ) сходится (слабо) к некоторому распределению F ( x ), соответствующая последовательность характеристических функций φ j ( t ) также будет сходиться, и предел φ ( t ) будет соответствовать к характеристической функции закона F . Более формально это формулируется как

Теорема непрерывности Леви : Последовательность Х J из п -мерных случайных величин сходятся по распределению к случайной величине X тогда и только тогдакогда последовательность φ Х J поточечно сходится к функции фкоторая непрерывна в начале координат. Тамгде φ является характеристической функцией X .

Эту теорему можно использовать для доказательства закона больших чисел и центральной предельной теоремы .

Формулы обращения

Между кумулятивными функциями распределения и характеристическими функциями существует взаимно однозначное соответствие , поэтому можно найти одну из этих функций, если мы знаем другую. Формула в определении характеристической функции позволяет нам вычислить φ, когда мы знаем функцию распределения F (или плотность f ). Если, с другой стороны, мы знаем характеристическую функцию φ и хотим найти соответствующую функцию распределения, то можно использовать одну из следующих теорем обращения .

Теорема . Если характеристическая функция ф Х случайной величины X является интегрируемой , то Р Х абсолютно непрерывно, и , следовательно , Х имеет функцию плотности вероятности . В одномерном случае (т. Е. Когда X имеет скалярное значение) функция плотности определяется выражением

В многомерном случае это

где скалярное произведение.

PDF - это производная Радона – Никодима распределения μ X по мере Лебега λ :

Теорема (Леви) . Если φ X - характеристическая функция функции распределения F X , две точки a  <  b таковы, что { x | < х < Ь } является множеством непрерывности из ц X (в одномерном случае это условие эквивалентно непрерывности F X в точках через и б ), а затем

  • Если X скаляр:
Эту формулу можно переформулировать в форме, более удобной для численных расчетов, как
Для случайной величины, ограниченной снизу, можно получить , взяв такую, что В противном случае, если случайная величина не ограничена снизу, предел для дает , но численно непрактичен.
  • Если X - векторная случайная величина:

Теорема . Если a (возможно) является атомом X (в одномерном случае это означает точку разрыва F X ), то

  • Если X скаляр:
  • Если X - векторная случайная величина:

Теорема (Гиль-Пелаез) . Для однофакторного случайной величины X , если х является точкой непрерывности из F X , то

где мнимая часть комплексного числа равна .

Интеграл может быть неинтегрируемым по Лебегу ; например, когда X - дискретная случайная величина, которая всегда равна 0, она становится интегралом Дирихле .

Доступны формулы обращения для многомерных распределений.

Критерии для характеристических функций

Множество всех характеристических функций замыкается при выполнении определенных операций:

  • Выпуклой линейной комбинации (с ) из конечного или счетного числа характеристических функций также является характеристической функцией.
  • Произведение конечного числа характеристических функций также является характеристической функцией. То же самое верно и для бесконечного произведения, если оно сходится к функции, непрерывной в нуле.
  • Если φ характеристическая функция, а α действительное число, то Re ( φ ), | φ | 2 , и φ ( αt ) также являются характеристическими функциями.

Хорошо известно, что любая неубывающая càdlàg функция F с пределами F (−∞) = 0, F (+ ∞) = 1 соответствует кумулятивной функции распределения некоторой случайной величины. Также есть интерес найти аналогичные простые критерии, когда заданная функция φ может быть характеристической функцией некоторой случайной величины. Центральным результатом здесь является теорема Бохнера , хотя ее полезность ограничена, поскольку главное условие теоремы - неотрицательная определенность - очень трудно проверить. Существуют и другие теоремы, такие как теоремы Хинчина, Матиаса или Крамера, хотя их применение столь же сложно. С другой стороны, теорема Полиа дает очень простое условие выпуклости, которое является достаточным, но не необходимым. Характеристические функции, удовлетворяющие этому условию, называются типом Полиа.

Теорема Бохнера . Произвольная функция φ  : R п С является характеристической функцией некоторой случайной величиныесли и только если φ является положительно определен , непрерывен в нуле, и если φ (0) = 1.

Критерий Хинчина . Комплекснозначная абсолютно непрерывная функция φ с φ (0) = 1 является характеристической функцией тогда и только тогда, когда она допускает представление

Теорема Матиаса . Вещественнозначная четная непрерывная абсолютно интегрируемая функция φ с φ (0) = 1 является характеристической функцией тогда и только тогда, когда

для n = 0,1,2, ... и всех p > 0. Здесь H 2 n обозначает многочлен Эрмита степени 2 n .

Теорема Поли может быть использована для построения примера двух случайных величин, характеристические функции которых совпадают на конечном интервале, но различны в другом месте.

Теорема Поли . Если - вещественная, четная, непрерывная функция, удовлетворяющая условиям

  • ,
  • является выпуклым для ,
  • ,

тогда φ ( t ) - характеристическая функция абсолютно непрерывного распределения, симметричного относительно 0.

Использует

Из-за теоремы о непрерывности характеристические функции используются в наиболее часто встречающемся доказательстве центральной предельной теоремы . Основной метод, используемый при выполнении вычислений с характеристической функцией, - это распознавание функции как характеристической функции конкретного распределения.

Основные манипуляции с распределениями

Характеристические функции особенно полезны при работе с линейными функциями независимых случайных величин. Например, если X 1 , X 2 , ..., X n представляет собой последовательность независимых (и не обязательно одинаково распределенных) случайных величин, и

где a i - константы, то характеристическая функция для S n определяется выражением

В частности, φ X + Y ( t ) = φ X ( t ) φ Y ( t ) . Чтобы в этом убедиться, выпишите определение характеристической функции:

Независимость X и Y требуется для установления равенства третьего и четвертого выражений.

Другой особый случай, представляющий интерес для одинаково распределенных случайных величин, - это когда a i = 1 / n, а затем S n является выборочным средним. В этом случае, написав X для среднего,

Моменты

Характеристические функции также могут использоваться для поиска моментов случайной величины. При наличии n- го момента характеристическая функция может быть дифференцирована n раз и

Например, предположим, что X имеет стандартное распределение Коши . Тогда φ X ( t ) = e - | т | . Это не дифференцируемо при t = 0, показывая, что распределение Коши не имеет никаких ожиданий . Кроме того , характеристическая функция выборочного среднего X из п независимых наблюдений имеет характеристическую функцию φ Х ( т ) = ( е - | т | / п ) п = е - | т | , используя результат из предыдущего раздела. Это характерная функция стандартного распределения Коши: таким образом, выборочное среднее имеет то же распределение, что и сама генеральная совокупность.

В качестве другого примера, предположим , что X следует гауссово распределение ИЭ . Тогда и

Подобный расчет показывает, и его легче выполнить, чем применить определение ожидания и использовать интегрирование по частям для оценки .

Логарифм характеристической функции - это производящая функция кумулянта , которая полезна для поиска кумулянтов ; некоторые вместо этого определяют кумулянтную производящую функцию как логарифм генерирующей момент функции и называют логарифм характеристической функции второй кумулянтной производящей функцией.

Анализ данных

Характеристические функции могут использоваться как часть процедур для подгонки распределений вероятностей к выборкам данных. Случаи, когда это обеспечивает практически осуществимый вариант по сравнению с другими возможностями, включают подгонку устойчивого распределения, поскольку выражения для плотности в закрытой форме недоступны, что затрудняет реализацию оценки максимального правдоподобия . Доступны процедуры оценки, которые сопоставляют теоретическую характеристическую функцию с эмпирической характеристической функцией , рассчитанной на основе данных. Полсон и др. (1975) и Heathcote (1977) предоставляют некоторые теоретические основы для такой процедуры оценки. Кроме того, Yu (2004) описывает приложения эмпирических характеристических функций для соответствия моделям временных рядов, где процедуры правдоподобия непрактичны. Эмпирические характеристические функции также использовались Ansari et al. (2020) и Ли и др. (2020) для обучения генеративных состязательных сетей .

Пример

Гамма - распределение с параметром масштаба и & thetas параметра формы к имеет характеристическую функцию

Теперь предположим, что у нас есть

с X и Y независимо друг от друга, и мы хотим знать , что распределение X + Y есть. Характеристические функции:

что в силу независимости и основных свойств характеристической функции приводит к

Это характеристическая функция параметра масштаба гамма-распределения θ и параметра формы k 1 + k 2 , поэтому мы заключаем

Результат может быть расширен до n независимых случайных величин с гамма-распределением с одинаковым масштабным параметром, и мы получим

Целые характеристические функции

Как определено выше, аргумент характеристической функции рассматривается как действительное число: однако некоторые аспекты теории характеристических функций расширяются за счет расширения определения на комплексную плоскость путем аналитического продолжения в тех случаях, когда это возможно.

Связанные понятия

Связанные понятия включают функцию создания момента и функцию создания вероятности . Характеристическая функция существует для всех распределений вероятностей. Это не так для функции создания момента.

Характеристическая функция тесно связана с преобразованием Фурье : характеристическая функция функции плотности вероятности р ( х ) является комплексно сопряженной из непрерывного преобразования Фурье из р ( х ) ( в соответствии с обычным соглашением, см непрерывного преобразования Фурье - другое условности ).

где P ( t ) обозначает непрерывное преобразование Фурье функции плотности вероятности p ( x ). Точно так же p ( x ) может быть восстановлено из φ X ( t ) с помощью обратного преобразования Фурье:

Действительно, даже когда случайная величина не имеет плотности, характеристическую функцию можно рассматривать как преобразование Фурье меры, соответствующей случайной величине.

Другая связанная с этим концепция - представление распределений вероятностей как элементов гильбертова пространства воспроизводящего ядра через вложение распределений в ядро . Эта структура может рассматриваться как обобщение характеристической функции при конкретном выборе функции ядра .

Смотрите также

  • Субзависимость , более слабое условие, чем независимость, которое определяется в терминах характеристических функций.
  • Кумулянт , член производящих функций кумулянта , которые являются журналами характеристических функций.

Примечания

использованная литература

Цитаты

Источники

внешние ссылки