Кумулянт - Cumulant

В теории вероятностей и статистике , то кумулянты .йГа п о распределении вероятностей представляют собой набор величин , которые обеспечивают альтернативу моментов распределения. Моменты определяют кумулянты в том смысле, что любые два распределения вероятностей, моменты которых идентичны, также будут иметь одинаковые кумулянты, и аналогично кумулянты определяют моменты.

Первый кумулянт - это среднее значение , второй кумулянт - это дисперсия , а третий кумулянт - это то же самое, что и третий центральный момент . Но кумулянты четвертого и более высокого порядка не равны центральным моментам. В некоторых случаях теоретическое рассмотрение проблем в терминах кумулянтов проще, чем использование моментов. В частности, когда две или более случайных величин статистически независимы , кумулянт n- го порядка их суммы равен сумме их кумулянтов n- го порядка. Кроме того, кумулянты третьего и более высокого порядка нормального распределения равны нулю, и это единственное распределение с этим свойством.

Как и для моментов, когда совместные моменты используются для наборов случайных величин, можно определить совместные кумулянты .

Определение

Кумулянты случайной величины X определяется с помощью кумулянт-производящей функция К ( т ) , которая является натуральным логарифмом от функции момента , генерирующим :

Кумулянты κ n получаются разложением производящей функции кумулянта в ряд по степеням:

Это разложение является рядом Маклорена , поэтому n -й кумулянт может быть получен путем дифференцирования вышеуказанного разложения n раз и оценки результата равным нулю:

Если функция, генерирующая момент, не существует, кумулянты могут быть определены в терминах взаимосвязи между кумулянтами и моментами, обсуждаемыми позже.

Альтернативное определение кумулянтной производящей функции

Некоторые авторы предпочитают определять кумулянт-производящую функцию как натуральный логарифм характеристической функции , которую иногда также называют второй характеристической функцией,

Преимущество H ( t ) - в некотором смысле функция K ( t ), вычисляемая для чисто мнимых аргументов - состоит в том, что E [ e itX ] хорошо определено для всех действительных значений t, даже если E [ e tX ] не определено должным образом. для всех реальных значений t , например, когда существует «слишком большая» вероятность того, что X имеет большую величину. Хотя функция H ( t ) будет хорошо определена, она, тем не менее, будет имитировать K ( t ) с точки зрения длины своего ряда Маклорена , который не может выходить за пределы (или, в редких случаях, даже) линейного порядка в аргументе  t , и, в частности, количество четко определенных кумулянтов не изменится. Тем не менее, даже когда H ( t ) не имеет длинного ряда Маклорена, его можно использовать непосредственно при анализе и, в частности, добавлении случайных величин. Как распределение Коши (также называемое лоренцевым), так и в более общем плане устойчивые распределения (связанные с распределением Леви) являются примерами распределений, для которых разложения производящих функций в степенной ряд имеют только конечное число четко определенных членов.

Использование в статистике

Работа с кумулянтами может иметь преимущество по сравнению с использованием моментов , потому что для статистически независимых случайных величин X и Y ,

так что каждый кумулянт суммы независимых случайных величин является суммой соответствующих кумулянтов слагаемых . То есть, когда слагаемые статистически независимы, среднее значение суммы - это сумма средних, дисперсия суммы - это сумма дисперсий, третий кумулянт (который оказывается третьим центральным моментом) суммы является суммой третьих кумулянтов и так далее для каждого порядка кумулянтов.

Распределение с заданными кумулянтами κ n может быть аппроксимировано рядом Эджворта .

Кумулянты некоторых дискретных распределений вероятностей

  • Постоянные случайные величины X = μ . Кумулянтная производящая функция K ( t ) = μt . Первый кумулянт равен κ 1 = K  '(0) = μ, а остальные кумулянты равны нулю, κ 2 = κ 3 = κ 4 = ... = 0 .
  • Распределения Бернулли (количество успехов в одном испытании с вероятностью успеха p ). Кумулянтная производящая функция K ( t ) = log (1 -  p  +  p e t ) . Первые кумулянты: κ 1 = K  '(0) = p и κ 2 = K ′ ′ (0) = p · (1 -  p ) . Кумулянты удовлетворяют формуле рекурсии
  • В геометрическое распределение , (число отказов до одного успеха с вероятностью р успеха на каждом испытании). Кумулянтная производящая функция K ( t ) = log ( p / (1 + ( p  - 1) e t )) . Первые кумулянты равны κ 1 = K ′ (0) = p −1 - 1 и κ 2 = K ′ ′ (0) = κ 1 p −1 . Подстановка p = ( μ + 1) −1 дает K ( t ) = −log (1 + μ (1 − e t )) и κ 1 = μ .
  • Распределения Пуассона . Кумулянтная производящая функция K ( t ) = μ (e t  - 1) . Все кумулянты равны параметру: κ 1 = κ 2 = κ 3 = ... = μ .
  • В биномиального распределения , (число успехов в п независимых испытаниях с вероятностью р успеха на каждом испытании). Частный случай n = 1 - это распределение Бернулли. Каждый кумулянт просто в n раз больше соответствующего кумулянта соответствующего распределения Бернулли. Кумулянтная производящая функция K ( t ) = n  log (1 -  p  +  p e t ) . Первые кумулянты: κ 1 = K ′ (0) = np и κ 2 = K ′ ′ (0) = κ 1 (1 - p ) . Подстановка p = μ · n −1 дает K  '( t ) = ((μ −1 - n −1 ) · e - t + n −1 ) −1 и κ 1 = μ . Предельный случай n −1 = 0 является распределением Пуассона.
  • В отрицательных биномиальных распределений , (число неудач , прежде чем г успехов с вероятностью р успеха на каждом испытании). Частный случай r = 1 - геометрическое распределение. Каждый кумулянт просто в r раз больше соответствующего кумулянта соответствующего геометрического распределения. Производная кумулянтной производящей функции равна K  '( t ) =  r · ((1 -  p ) −1 · e - t −1) −1 . Первые кумулянты равны κ 1  =  K  '(0) =  r · ( p −1 −1) и κ 2  =  K  ' '(0) = κ 1 · p −1 . Подстановка p  = (μ · r −1 +1) −1 дает K ′ ( t ) = (( μ −1 + r −1 ) e - t - r −1 ) −1 и κ 1 = μ . Сравнение этих формул с формулами биномиального распределения объясняет название «отрицательное биномиальное распределение». Предельный случай г -1 = 0 является распределением Пуассона.

Представляем отношение дисперсии к среднему

приведенные выше распределения вероятностей получают единую формулу для производной кумулянтной производящей функции:

Вторая производная

подтверждая, что первый кумулянт равен κ 1 = K ′ (0) = μ, а второй кумулянт равен κ 2 = K ′ ′ (0) = με . Постоянные случайные величины X = μ имеют ε = 0 . Биномиальные распределения имеют ε = 1 - p, так что 0 < ε <1 . Распределения Пуассона имеют ε = 1 . Отрицательные биномиальные распределения имеют ε = p − 1, так что ε > 1 . Обратите внимание на аналогию с классификацией конических сечений по эксцентриситету : окружности ε = 0 , эллипсы 0 < ε <1 , параболы ε = 1 , гиперболы ε > 1 .

Кумулянты некоторых непрерывных распределений вероятностей

Некоторые свойства кумулянтной производящей функции

Кумулянт производящая функция К ( т ), если она существует, является бесконечно дифференцируемой и выпуклой , и проходит через начало координат. Его первая производная монотонно изменяется в открытом интервале от нижней грани до верхней грани носителя распределения вероятностей, а вторая производная строго положительна везде, где она определена, за исключением вырожденного распределения единственной точечной массы. Кумулянт-производящая функция существует тогда и только тогда, когда хвосты распределения мажорируются экспоненциальным убыванием , то есть ( см. Обозначение Big O )

где - кумулятивная функция распределения . Кумулянт-производящая функция будет иметь вертикальную асимптоту (-ы) в нижней нижней грани такого c , если такая нижняя грань существует, и в верхней грани такого d , если такая верхняя грань существует, в противном случае она будет определена для всех действительных чисел.

Если носитель случайной величины X имеет конечную верхнюю или нижнюю границу, то ее кумулянт-производящая функция y  =  K ( t ), если она существует, приближается к асимптоте (ам), наклон которой равен супремуму и / или нижнему пределу служба поддержки,

соответственно, лежащие повсюду над обеими этими линиями. ( Интегралы

дают y- интерцепты этих асимптот, поскольку  K (0) = 0.)

Для сдвига распределения по C , Для вырожденного точечной массы на C , то CGF представляет собой прямую линию , а в более общем случае , если и только если X и Y являются независимыми и существуют их CGFS; ( Субзависимость и наличие вторых моментов, достаточных, чтобы подразумевать независимость.)

Естественно экспоненциальное семейство из распределения может быть реализовано путем сдвига или перевода K ( т ), и корректировок ее вертикально таким образом , чтобы она всегда проходит через начало координат: если е является PDF с CGF и является ее естественным экспоненциальным семейство, то и

Если K ( t ) конечно для диапазона t 1  <Re ( t ) <  t 2, то если t 1  <0 <  t 2, то K ( t ) аналитична и бесконечно дифференцируема при t 1  <Re ( t ) <  t 2. . Более того, при t вещественных и t 1  <  t  <  t 2 K ( t ) строго выпукло, а K '( t ) строго возрастает.

Некоторые свойства кумулянтов

Инвариантность и эквивариантность

Первый кумулянт сдвиг- эквивариантен ; все остальные инвариантны относительно сдвига . Это означает, что если обозначить через κ n ( X ) n-й кумулянт распределения вероятностей случайной величины X , то для любой константы c :

Другими словами, сдвиг случайной величины (добавление c ) сдвигает первый кумулянт (среднее значение) и не влияет ни на один из остальных.

Однородность

П -й кумулянт однородна степени п , то есть , если с какой - либо постоянной, то

Аддитивность

Если X и Y - независимые случайные величины, то κ n ( X  +  Y ) =  κ n ( X ) +  κ n ( Y ) .

Отрицательный результат

Учитывая результаты для кумулянтов нормального распределения , можно надеяться найти семейства распределений, для которых κ m  =  κ m +1  = ⋯ = 0 для некоторого m  > 3 , с кумулянтами более низкого порядка (от 3 до m  - 1 ) отличное от нуля. Таких раздач нет. Основной результат здесь состоит в том, что кумулянтная производящая функция не может быть многочленом конечного порядка степени выше 2.

Кумулянты и моменты

Производящая функция момент определяется по формуле:

Таким образом, кумулянтная производящая функция - это логарифм производящей функции момента

Первый кумулянт - это ожидаемое значение ; второй и третий кумулянты являются соответственно вторым и третьим центральными моментами (второй центральный момент - это дисперсия ); но старшие кумулянты не являются ни моментами, ни центральными моментами, а скорее более сложными полиномиальными функциями моментов.

Моменты могут быть восстановлены в терминах кумулянтов, оценивая n-ю производную at ,

Точно так же кумулянты могут быть восстановлены с точки зрения моментов, оценивая n-ю производную at ,

Явное выражение для n -го момента через первые n кумулянтов и наоборот можно получить, используя формулу Фаа ди Бруно для высших производных сложных функций. В общем, у нас есть

где - неполные (или частичные) полиномы Белла .

Аналогичным образом, если среднее значение равно , производящая функция центрального момента равна

а n-й центральный момент получается в терминах кумулянтов как

Кроме того, при n  > 1 n-й кумулянт по центральным моментам равен

Пмомент μ ' п является п - й степени многочлен в первых п кумулянтами. Первые несколько выражений:

«Штрих» отличает моменты μn от центральных моментов μ n . Чтобы выразить центральные моменты как функции кумулянтов, просто исключите из этих многочленов все члены, в которых κ 1 выступает в качестве множителя:

Точно так же n -й кумулянт κ n является многочленом n -й степени от первых n нецентральных моментов. Первые несколько выражений:

Чтобы выразить кумулянты κ n для n > 1 как функции центральных моментов, исключите из этих многочленов все члены, в которых μ ' 1 появляется как множитель:

Чтобы выразить кумулянты κ n для n > 2 как функции стандартизованных центральных моментов , также установите μ ' 2 = 1 в полиномах:

Кумулянты могут быть связаны с моментами, дифференцируя соотношение log M ( t ) = K ( t ) по t , давая M ′ ( t ) = K ′ ( t ) M ( t ) , которое обычно не содержит возведения в степень или логарифмы. Приравнивая коэффициент при t n −1 в левой и правой частях, используя μ ′ 0 = 1 и переставляя, получаем следующую формулу рекурсии для n ≥ 1 :

Кумулянты и множества-перегородки

Эти многочлены имеют замечательную комбинаторную интерпретацию: коэффициенты подсчитывают определенные разбиения множеств . Общий вид этих многочленов таков:

куда

  • π пробегает список всех разбиений множества размера n ;
  • « Bπ » означает, что B - один из «блоков», на которые разбивается множество; а также
  • | B | это размер множества B .

Таким образом, каждый моном представляет собой произведение кумулянтов, умноженное на константу, в которой сумма индексов равна n (например, в члене κ 3 κ 2 2 κ 1 сумма индексов равна 3 + 2 + 2 + 1 = 8; это появляется в полиноме, который выражает 8-й момент как функцию первых восьми кумулянтов). Каждому члену соответствует раздел целого числа n . Коэффициент в каждом члене есть число разбиений множества из п элементов , которые коллапс на этот раздел целого числа п , когда члены набора становятся неразличимыми.

Кумулянты и комбинаторика

Дальнейшую связь между кумулянтами и комбинаторикой можно найти в работе Джан-Карло Рота , где связи с теорией инвариантов , симметричными функциями и биномиальными последовательностями изучаются с помощью умбрального исчисления .

Совместные кумулянты

Совместное кумулянт нескольких случайных величин X 1 , ...,  X п определяется аналогичной функции , генерирующей кумулянт

Следствием этого является то, что

где π пробегает список всех разбиений {1, ...,  n  }, B  пробегает список всех блоков разбиения  π , и | π | - количество частей в разделе. Например,

Если какие-либо из этих случайных величин идентичны, например, если X  =  Y , то применяются те же формулы, например

хотя для таких повторяющихся переменных существуют более лаконичные формулы. Для случайных векторов с нулевым средним

Совокупный кумулянт только одной случайной величины - это ее математическое ожидание, а двух случайных величин - их ковариация . Если некоторые из случайных величин независимы от всех других, то любой кумулянт, включающий две (или более) независимых случайных величины, равен нулю. Если все n случайных величин одинаковы, то объединенный кумулянт является n -м обыкновенным кумулянтом.

Комбинаторный смысл выражения моментов через кумулянты легче понять, чем кумулянтов через моменты:

Например:

Еще одно важное свойство совместных кумулянтов - полилинейность:

Подобно тому, как второй кумулянт - это дисперсия, совместный кумулянт всего двух случайных величин является ковариацией . Знакомая личность

обобщает на кумулянты:

Условные кумулянты и закон суммарной кумулянты

Закон полного математического ожидания и закон общей дисперсии обобщать естественно условные кумулянт. Случай n = 3, выраженный на языке (центральных) моментов, а не на языке кумулянтов, говорит:

В основном,

куда

  • сумма ведется по всем разбиениям  π множества  индексов {1, ...,  n }, и
  • π 1 , ...,  π b - все «блоки» разбиения π ; выражение κ ( X π m ) указывает, что совокупный кумулянт случайных величин, индексы которых находятся в этом блоке разбиения.

Отношение к статистической физике

В статистической физике многие обширные величины, то есть величины, пропорциональные объему или размеру данной системы, связаны с кумулянтами случайных величин. Глубокая связь заключается в том, что в большой системе такая обширная величина, как энергия или количество частиц, может рассматриваться как сумма (скажем) энергии, связанной с рядом почти независимых областей. Тот факт, что кумулянты этих почти независимых случайных величин будут (почти) складываться, делает разумным предположение, что большие количества должны быть связаны с кумулянтами.

Система, находящаяся в равновесии с термостатом при температуре T, имеет флуктуирующую внутреннюю энергию E, которую можно рассматривать как случайную величину, взятую из распределения . Статсумма системы является

где β = 1 / ( кТ ) и к является постоянной Больцмана , и обозначение было использовано , а не для значения ожидания , чтобы избежать путаницы с энергией, Е . Следовательно, первый и второй кумулянты для энергии E дают среднюю энергию и теплоемкость.

Свободная энергия Гельмгольца выражается через

далее связывает термодинамические величины с кумулянтной производящей функцией для энергии. Термодинамические свойства, являющиеся производными от свободной энергии, такие как ее внутренняя энергия , энтропия и удельная теплоемкость , все можно легко выразить через эти кумулянты. Другая свободная энергия может быть функцией других переменных, таких как магнитное поле или химический потенциал , например

где N - количество частиц, а - большой потенциал. Опять же тесная взаимосвязь между определением свободной энергии и кумулянтной производящей функцией означает , что различные производные этой свободной энергии можно записать в терминах совместных кумулянтов E и N .

История

Историю кумулянтов обсуждает Андерс Халд .

Кумулянты были впервые введены Торвальдом Н. Тиле в 1889 году, который назвал их полуинвариантами . Впервые они были названы кумулянтами в статье 1932 года Рональда Фишера и Джона Уишарта . Фишеру публично напомнил о работе Тиле Нейман, который также отмечает ранее опубликованные цитаты Тиле, доведенные до сведения Фишера. Стивен Стиглер сказал, что название кумулянт было предложено Фишеру в письме от Гарольда Хотеллинга . В статье, опубликованной в 1929 году, Фишер назвал их функциями кумулятивного момента . Статистическая сумма в статистической физике была введена Джозайей Уиллардом Гиббсом в 1901 году. Свободную энергию часто называют свободной энергией Гиббса. В статистической механике кумулянты также известны как функции Урселла, относящиеся к публикации 1927 года.

Кумулянты в обобщенных настройках

Формальные кумулянты

В более общем смысле, кумулянты последовательности { m n  : n = 1, 2, 3, ...}, не обязательно моменты любого распределения вероятностей, по определению, являются

где значения κ n для n = 1, 2, 3, ... находятся формально, т. е. только с помощью алгебры, не обращая внимания на вопрос, сходится ли какой-либо ряд. При формальной работе отсутствуют все трудности «проблемы кумулянтов». Самый простой пример - второй кумулянт распределения вероятностей всегда должен быть неотрицательным и равен нулю только в том случае, если все старшие кумулянты равны нулю. Формальные кумулянты не подчиняются таким ограничениям.

Номера звонков

В комбинаторике , то п -го числа Bell является число разбиений множества размера п . Все кумулянты последовательности чисел Белла равны 1 . Числа Белла - это моменты распределения Пуассона с математическим ожиданием 1 .

Кумулянты полиномиальной последовательности биномиального типа

Для любой последовательности {κ n  : n = 1, 2, 3, ...} скаляров в поле нулевой характеристики, считающейся формальными кумулянтами, существует соответствующая последовательность {μ ′: n = 1, 2, 3, ...} формальных моментов, заданных полиномами выше. Для этих многочленов постройте полиномиальную последовательность следующим образом. Из полинома

создайте новый многочлен в них плюс одну дополнительную переменную x :

а затем обобщите образец. Шаблон состоит в том, что количество блоков в вышеупомянутых разделах является показателем x . Каждый коэффициент является полиномом от кумулянтов; это полиномы Белла , названные в честь Эрика Темпл Белла .

Эта последовательность многочленов биномиального типа . Фактически, никаких других последовательностей биномиального типа не существует; каждая полиномиальная последовательность биномиального типа полностью определяется своей последовательностью формальных кумулянтов.

Бесплатные кумулянты

В приведенной выше формуле моментного кумулянта

для совместных кумулянтов - одна сумма по всем разбиениям множества {1, ..., n }. Если вместо этого суммировать только по непересекающимся разделам , то, решая эти формулы для моментов, можно получить свободные кумулянты, а не обычные кумулянты, рассмотренные выше. Эти свободные кумулянты были введены Роландом Спайхером и играют центральную роль в теории свободных вероятностей . В этой теории, а не рассматривать независимость от случайных величин , определенных в терминах тензорных произведений алгебр случайных величин, одна считает , вместо того, чтобы бесплатно независимость случайных величин, определенных в терминах свободных произведений алгебр.

Обычные кумулянты степени выше 2 нормального распределения равны нулю. В свободных кумулянты степени выше 2 из Вигнера полукруга распределения равны нулю. В этом отношении роль распределения Вигнера в свободной теории вероятностей аналогична роли нормального распределения в традиционной теории вероятностей.

Смотрите также

использованная литература

внешние ссылки