Кумулянт - Cumulant

В теории вероятностей и статистике , то кумулянты $.йГа п$ о распределении вероятностей представляют собой набор величин , которые обеспечивают альтернативу моментов распределения. Моменты определяют кумулянты в том смысле, что любые два распределения вероятностей, моменты которых идентичны, также будут иметь одинаковые кумулянты, и аналогично кумулянты определяют моменты.

Первый кумулянт - это среднее значение , второй кумулянт - это дисперсия , а третий кумулянт - это то же самое, что и третий центральный момент . Но кумулянты четвертого и более высокого порядка не равны центральным моментам. В некоторых случаях теоретическое рассмотрение проблем в терминах кумулянтов проще, чем использование моментов. В частности, когда две или более случайных величин статистически независимы , кумулянт n- ^го порядка их суммы равен сумме их кумулянтов n- ^го порядка. Кроме того, кумулянты третьего и более высокого порядка нормального распределения равны нулю, и это единственное распределение с этим свойством.

Как и для моментов, когда совместные моменты используются для наборов случайных величин, можно определить совместные кумулянты .

Определение

Кумулянты случайной величины $X$ определяется с помощью кумулянт-производящей функция $К (т)$ , которая является натуральным логарифмом от функции момента , генерирующим :

{\ displaystyle K (t) = \ log \ operatorname {E} \ left [e ^ {tX} \ right].}

Кумулянты $κ n$ получаются разложением производящей функции кумулянта в ряд по степеням:

{\ displaystyle K (t) = \ sum _ {n = 1} ^ {\ infty} \ kappa _ {n} {\ frac {t ^ {n}} {n!}} = \ kappa _ {1} { \ frac {t} {1!}} + \ kappa _ {2} {\ frac {t ^ {2}} {2!}} + \ kappa _ {3} {\ frac {t ^ {3}} { 3!}} + \ Cdots = \ mu t + \ sigma ^ {2} {\ frac {t ^ {2}} {2}} + \ cdots.}

Это разложение является рядом Маклорена , поэтому $n$ -й кумулянт может быть получен путем дифференцирования вышеуказанного разложения $n$ раз и оценки результата равным нулю:

{\ displaystyle \ kappa _ {n} = K ^ {(n)} (0).}

Если функция, генерирующая момент, не существует, кумулянты могут быть определены в терминах взаимосвязи между кумулянтами и моментами, обсуждаемыми позже.

Альтернативное определение кумулянтной производящей функции

Некоторые авторы предпочитают определять кумулянт-производящую функцию как натуральный логарифм характеристической функции , которую иногда также называют второй характеристической функцией,

{\ Displaystyle H (t) = \ log \ OperatorName {E} \ left [e ^ {itX} \ right] = \ sum _ {n = 1} ^ {\ infty} \ kappa _ {n} {\ frac { (оно) ^ {n}} {n!}} = \ mu it- \ sigma ^ {2} {\ frac {t ^ {2}} {2}} + \ cdots}

Преимущество $H (t)$ - в некотором смысле функция $K (t),$ вычисляемая для чисто мнимых аргументов - состоит в том, что $E [e itX]$ хорошо определено для всех действительных значений $t,$ даже если $E [e tX]$ не определено $должным$ образом. для всех реальных значений $t$ , например, когда существует «слишком большая» вероятность того, что $X$ имеет большую величину. Хотя функция $H (t)$ будет хорошо определена, она, тем не менее, будет имитировать $K (t)$ с точки зрения длины своего ряда Маклорена , который не может выходить за пределы (или, в редких случаях, даже) линейного порядка в аргументе $t$ , и, в частности, количество четко определенных кумулянтов не изменится. Тем не менее, даже когда $H (t)$ не имеет длинного ряда Маклорена, его можно использовать непосредственно при анализе и, в частности, добавлении случайных величин. Как распределение Коши (также называемое лоренцевым), так и в более общем плане устойчивые распределения (связанные с распределением Леви) являются примерами распределений, для которых разложения производящих функций в степенной ряд имеют только конечное число четко определенных членов.

Использование в статистике

Работа с кумулянтами может иметь преимущество по сравнению с использованием моментов , потому что для статистически независимых случайных величин $X$ и $Y$ ,

{\ Displaystyle {\ begin {выровнено} K_ {X + Y} (t) & = \ log \ OperatorName {E} \ left [e ^ {t (X + Y)} \ right] \\ [5pt] & = \ log \ left (\ operatorname {E} \ left [e ^ {tX} \ right] \ operatorname {E} \ left [e ^ {tY} \ right] \ right) \\ [5pt] & = \ log \ имя оператора {E} \ left [e ^ {tX} \ right] + \ log \ имя оператора {E} \ left [e ^ {tY} \ right] \\ [5pt] & = K_ {X} (t) + K_ {Y} (t), \ end {align}}}

так что каждый кумулянт суммы независимых случайных величин является суммой соответствующих кумулянтов слагаемых . То есть, когда слагаемые статистически независимы, среднее значение суммы - это сумма средних, дисперсия суммы - это сумма дисперсий, третий кумулянт (который оказывается третьим центральным моментом) суммы является суммой третьих кумулянтов и так далее для каждого порядка кумулянтов.

Распределение с заданными кумулянтами $κ n$ может быть аппроксимировано рядом Эджворта .

Кумулянты некоторых дискретных распределений вероятностей

Постоянные случайные величины $X = μ$ . Кумулянтная производящая функция $K (t) = μt$ . Первый кумулянт равен $κ 1 = K'(0) = μ,$ а остальные кумулянты равны нулю, $κ 2 = κ 3 = κ 4 = ... = 0$ .
Распределения Бернулли (количество успехов в одном испытании с вероятностью успеха $p$ ). Кумулянтная производящая функция $K (t) = log (1 - p + p e t)$ . Первые кумулянты: $κ 1 = K'(0) = p$ и $κ 2 = K ' ' (0) = p \cdot (1 - p)$ . Кумулянты удовлетворяют формуле рекурсии

{\ displaystyle \ kappa _ {n + 1} = p (1-p) {\ frac {d \ kappa _ {n}} {dp}}.}

В геометрическое распределение , (число отказов до одного успеха с вероятностью $р$ успеха на каждом испытании). Кумулянтная производящая функция $K (t) = log (p / (1 + (p - 1) e t))$ . Первые кумулянты равны $κ 1 = K ' (0) = p -1 - 1$ и $κ 2 = K ' ' (0) = κ 1 p -1$ . Подстановка $p = (μ + 1) -1$ дает $K (t) = -log (1 + μ (1 - e t))$ и $κ 1 = μ$ .
Распределения Пуассона . Кумулянтная производящая функция $K (t) = μ (e t - 1)$ . Все кумулянты равны параметру: $κ 1 = κ 2 = κ 3 = ... = μ$ .
В биномиального распределения , (число успехов в $п$ независимых испытаниях с вероятностью $р$ успеха на каждом испытании). Частный случай $n = 1$ - это распределение Бернулли. Каждый кумулянт просто в $n$ раз больше соответствующего кумулянта соответствующего распределения Бернулли. Кумулянтная производящая функция $K (t) = n log (1 - p + p e t)$ . Первые кумулянты: $κ 1 = K ' (0) = np$ и $κ 2 = K ' ' (0) = κ 1 (1 - p)$ . Подстановка $p = μ \cdot n -1$ дает $K'(t) = ((μ -1 - n -1) \cdot e - t + n -1) -1$ и $κ 1 = μ$ . Предельный случай $n -1 = 0$ является распределением Пуассона.
В отрицательных биномиальных распределений , (число неудач , прежде чем г успехов с вероятностью р успеха на каждом испытании). Частный случай $r = 1$ - геометрическое распределение. Каждый кумулянт просто в r раз больше соответствующего кумулянта соответствующего геометрического распределения. Производная кумулянтной производящей функции равна K '( t ) = r · ((1 - p ) ⁻¹ · e ^{- t} −1) ⁻¹ . Первые кумулянты равны κ ₁ = K '(0) = r · ( p ⁻¹ −1) и κ ₂ = K ' '(0) = κ ₁ · p ⁻¹ . Подстановка p = (μ · r ⁻¹ +1) ⁻¹ дает $K ' (t) = ((μ -1 + r -1) e - t - r -1) -1$ и $κ 1 = μ$ . Сравнение этих формул с формулами биномиального распределения объясняет название «отрицательное биномиальное распределение». Предельный случай $г -1 = 0$ является распределением Пуассона.

Представляем отношение дисперсии к среднему

{\ Displaystyle \ varepsilon = \ mu ^ {- 1} \ sigma ^ {2} = \ kappa _ {1} ^ {- 1} \ kappa _ {2},}

приведенные выше распределения вероятностей получают единую формулу для производной кумулянтной производящей функции:

{\ displaystyle K '(t) = \ mu \ cdot (1+ \ varepsilon \ cdot (e ^ {- t} -1)) ^ {- 1}.}

Вторая производная

{\ Displaystyle К '' (т) = г '(т) \ cdot (1 + е ^ {т} \ cdot (\ varepsilon ^ {- 1} -1)) ^ {- 1}}

подтверждая, что первый кумулянт равен $κ 1 = K ' (0) = μ,$ а второй кумулянт равен $κ 2 = K ' ' (0) = με$ . Постоянные случайные величины $X = μ$ имеют $ε = 0$ . Биномиальные распределения имеют $ε = 1 - p,$ так что $0 < ε <1$ . Распределения Пуассона имеют $ε = 1$ . Отрицательные биномиальные распределения имеют $ε = p - 1,$ так что $ε > 1$ . Обратите внимание на аналогию с классификацией конических сечений по эксцентриситету : окружности $ε = 0$ , эллипсы $0 < ε <1$ , параболы $ε = 1$ , гиперболы $ε > 1$ .

Кумулянты некоторых непрерывных распределений вероятностей

Для нормального распределения с ожидаемым значением $ц$ и дисперсией $сг 2$ , кумулянт производящая функция $К (т) = мкТл + σ 2 т 2 /2$ . Первая и вторая производные кумулянтной производящей функции равны $K'(t) = μ + σ 2 \cdot t$ и $K "(t) = σ 2.$ Кумулянты равны $κ 1 = μ$ , $κ 2 = σ 2$ и $κ 3. = κ 4 = ... = 0.$ Частным случаем $σ 2 = 0$ является постоянная случайная величина $X = μ$ .
Кумулянты равномерного распределения на интервале $[-1, 0]$ равны $κ n = B n / n$ , где $B n$ - $n-$ ^е число Бернулли .
Кумулянты экспоненциального распределения с параметром $λ$ равны $κ n = λ - n (n - 1)!$ .

Некоторые свойства кумулянтной производящей функции

Кумулянт производящая функция К ( т ), если она существует, является бесконечно дифференцируемой и выпуклой , и проходит через начало координат. Его первая производная монотонно изменяется в открытом интервале от нижней грани до верхней грани носителя распределения вероятностей, а вторая производная строго положительна везде, где она определена, за исключением вырожденного распределения единственной точечной массы. Кумулянт-производящая функция существует тогда и только тогда, когда хвосты распределения мажорируются экспоненциальным убыванием , то есть ( см. Обозначение Big O )

{\ displaystyle {\ begin {align} & \ exists c> 0, \, \, F (x) = O (e ^ {- cx}), x \ to - \ infty; {\ text {and}} \ \ [4pt] & \ существует d> 0, \, \, 1-F (x) = O (e ^ {- dx}), x \ to + \ infty; \ end {align}}}

где - кумулятивная функция распределения . Кумулянт-производящая функция будет иметь вертикальную асимптоту (-ы) в нижней нижней грани такого c , если такая нижняя грань существует, и в верхней грани такого d , если такая верхняя грань существует, в противном случае она будет определена для всех действительных чисел. ${\ displaystyle F}$

Если носитель случайной величины X имеет конечную верхнюю или нижнюю границу, то ее кумулянт-производящая функция y = K ( t ), если она существует, приближается к асимптоте (ам), наклон которой равен супремуму и / или нижнему пределу служба поддержки,

{\ displaystyle {\ begin {align} y & = (t + 1) \ inf \ operatorname {supp} X- \ mu (X), {\ text {and}} \\ [5pt] y & = (t-1) \ sup \ operatorname {supp} X + \ mu (X), \ end {align}}}

соответственно, лежащие повсюду над обеими этими линиями. ( Интегралы

{\ displaystyle \ int _ {- \ infty} ^ {0} \ left [t \ inf \ operatorname {supp} X-K '(t) \ right] \, dt, \ qquad \ int _ {\ infty} ^ {0} \ left [t \ inf \ operatorname {supp} X-K '(t) \ right] \, dt}

дают y- интерцепты этих асимптот, поскольку K (0) = 0.)

Для сдвига распределения по C , Для вырожденного точечной массы на C , то CGF представляет собой прямую линию , а в более общем случае , если и только если X и Y являются независимыми и существуют их CGFS; ( Субзависимость и наличие вторых моментов, достаточных, чтобы подразумевать независимость.) ${\ Displaystyle K_ {X + c} (t) = K_ {X} (t) + ct.}$ ${\ displaystyle K_ {c} (t) = ct}$ ${\ Displaystyle K_ {X + Y} = K_ {X} + K_ {Y}}$

Естественно экспоненциальное семейство из распределения может быть реализовано путем сдвига или перевода K ( т ), и корректировок ее вертикально таким образом , чтобы она всегда проходит через начало координат: если е является PDF с CGF и является ее естественным экспоненциальным семейство, то и ${\ Displaystyle К (т) = \ журнал М (т),}$ ${\ displaystyle f | \ theta}$ ${\ Displaystyle е (х \ середина \ тета) = {\ гидроразрыва {1} {М (\ тета)}} е ^ {\ тета х} е (х),}$ ${\ Displaystyle К (т \ середина \ тета) = К (т + \ тета) -К (\ тета).}$

Если K ( t ) конечно для диапазона t ₁ <Re ( t ) < t _2, то если t ₁ <0 < t _2, то K ( t ) аналитична и бесконечно дифференцируема при t ₁ <Re ( t ) < t _2. . Более того, при t вещественных и t ₁ < t < t ₂ K ( t ) строго выпукло, а K '( t ) строго возрастает.

Некоторые свойства кумулянтов

Инвариантность и эквивариантность

Первый кумулянт сдвиг- эквивариантен ; все остальные инвариантны относительно сдвига . Это означает, что если обозначить через κ _n ( X ) n-й кумулянт распределения вероятностей случайной величины X , то для любой константы c :

${\ Displaystyle \ каппа _ {1} (Х + с) = \ каппа _ {1} (Х) + с ~ {\ текст {и}}}$
${\ displaystyle \ kappa _ {n} (X + c) = \ kappa _ {n} (X) ~ {\ text {for}} ~ n \ geq 2.}$

Другими словами, сдвиг случайной величины (добавление c ) сдвигает первый кумулянт (среднее значение) и не влияет ни на один из остальных.

Однородность

П -й кумулянт однородна степени п , то есть , если с какой - либо постоянной, то

{\ displaystyle \ kappa _ {n} (cX) = c ^ {n} \ kappa _ {n} (X).}

Аддитивность

Если X и Y - независимые случайные величины, то $κ n (X + Y) = κ n (X) + κ n (Y)$ .

Отрицательный результат

Учитывая результаты для кумулянтов нормального распределения , можно надеяться найти семейства распределений, для которых $κ m = κ m +1 = \dots = 0$ для некоторого $m > 3$ , с кумулянтами более низкого порядка (от 3 до $m - 1$ ) отличное от нуля. Таких раздач нет. Основной результат здесь состоит в том, что кумулянтная производящая функция не может быть многочленом конечного порядка степени выше 2.

Кумулянты и моменты

Производящая функция момент определяется по формуле:

{\ displaystyle M (t) = 1 + \ sum _ {n = 1} ^ {\ infty} {\ frac {\ mu '_ {n} t ^ {n}} {n!}} = \ exp \ left (\ sum _ {n = 1} ^ {\ infty} {\ frac {\ kappa _ {n} t ^ {n}} {n!}} \ right) = \ exp (K (t)).}

Таким образом, кумулянтная производящая функция - это логарифм производящей функции момента

{\ Displaystyle К (т) = \ журнал М (т).}

Первый кумулянт - это ожидаемое значение ; второй и третий кумулянты являются соответственно вторым и третьим центральными моментами (второй центральный момент - это дисперсия ); но старшие кумулянты не являются ни моментами, ни центральными моментами, а скорее более сложными полиномиальными функциями моментов.

Моменты могут быть восстановлены в терминах кумулянтов, оценивая n-ю производную at , ${\ Displaystyle \ ехр (К (т))}$ ${\ displaystyle t = 0}$

{\ displaystyle \ mu '_ {n} = M ^ {(n)} (0) = \ left. {\ frac {\ mathrm {d} ^ {n} \ exp (K (t))} {\ mathrm {d} t ^ {n}}} \ right | _ {t = 0}.}

Точно так же кумулянты могут быть восстановлены с точки зрения моментов, оценивая n-ю производную at , ${\ Displaystyle \ журнал М (т)}$ ${\ displaystyle t = 0}$

{\ displaystyle \ kappa _ {n} = K ^ {(n)} (0) = \ left. {\ frac {\ mathrm {d} ^ {n} \ log M (t)} {\ mathrm {d} t ^ {n}}} \ right | _ {t = 0}.}

Явное выражение для n -го момента через первые n кумулянтов и наоборот можно получить, используя формулу Фаа ди Бруно для высших производных сложных функций. В общем, у нас есть

{\ displaystyle \ mu '_ {n} = \ sum _ {k = 1} ^ {n} B_ {n, k} (\ kappa _ {1}, \ ldots, \ kappa _ {n-k + 1} )}

{\ displaystyle \ kappa _ {n} = \ sum _ {k = 1} ^ {n} (- 1) ^ {k-1} (k-1)! B_ {n, k} (\ mu '_ { 1}, \ ldots, \ mu '_ {n-k + 1}),}

где - неполные (или частичные) полиномы Белла . ${\ displaystyle B_ {n, k}}$

Аналогичным образом, если среднее значение равно , производящая функция центрального момента равна ${\ displaystyle \ mu}$

{\ Displaystyle C (t) = \ OperatorName {E} [e ^ {t (x- \ mu)}] = e ^ {- \ mu t} M (t) = \ exp (K (t) - \ mu t),}

а n-й центральный момент получается в терминах кумулянтов как

{\ displaystyle \ mu _ {n} = C ^ {(n)} (0) = \ left. {\ frac {\ mathrm {d} ^ {n}} {\ mathrm {d} t ^ {n}} } \ exp (K (t) - \ mu t) \ right | _ {t = 0} = \ sum _ {k = 1} ^ {n} B_ {n, k} (0, \ kappa _ {2} , \ ldots, \ kappa _ {n-k + 1}).}

Кроме того, при n > 1 n-й кумулянт по центральным моментам равен

{\ Displaystyle {\ begin {align} \ kappa _ {n} & = K ^ {(n)} (0) = \ left. {\ frac {\ mathrm {d} ^ {n}} {\ mathrm {d } t ^ {n}}} (\ log C (t) + \ mu t) \ right | _ {t = 0} \\ [4pt] & = \ sum _ {k = 1} ^ {n} (- 1) ^ {k-1} (k-1)! B_ {n, k} (0, \ mu _ {2}, \ ldots, \ mu _ {n-k + 1}). \ End {выравнивается} }}

П -й момент μ ' _п является п - й степени многочлен в первых п кумулянтами. Первые несколько выражений:

{\ displaystyle {\ begin {align} \ mu '_ {1} = {} & \ kappa _ {1} \\ [5pt] \ mu' _ {2} = {} & \ kappa _ {2} + \ каппа _ {1} ^ {2} \\ [5pt] \ mu '_ {3} = {} & \ kappa _ {3} +3 \ kappa _ {2} \ kappa _ {1} + \ kappa _ { 1} ^ {3} \\ [5pt] \ mu '_ {4} = {} & \ kappa _ {4} +4 \ kappa _ {3} \ kappa _ {1} +3 \ kappa _ {2} ^ {2} +6 \ kappa _ {2} \ kappa _ {1} ^ {2} + \ kappa _ {1} ^ {4} \\ [5pt] \ mu '_ {5} = {} & \ каппа _ {5} +5 \ каппа _ {4} \ каппа _ {1} +10 \ каппа _ {3} \ каппа _ {2} +10 \ каппа _ {3} \ каппа _ {1} ^ {2 } +15 \ каппа _ {2} ^ {2} \ каппа _ {1} +10 \ каппа _ {2} \ каппа _ {1} ^ {3} + \ каппа _ {1} ^ {5} \\ [5pt] \ mu '_ {6} = {} & \ kappa _ {6} +6 \ kappa _ {5} \ kappa _ {1} +15 \ kappa _ {4} \ kappa _ {2} +15 \ каппа _ {4} \ каппа _ {1} ^ {2} +10 \ каппа _ {3} ^ {2} +60 \ каппа _ {3} \ каппа _ {2} \ каппа _ {1} +20 \ каппа _ {3} \ каппа _ {1} ^ {3} \\ & {} + 15 \ каппа _ {2} ^ {3} +45 \ каппа _ {2} ^ {2} \ каппа _ {1 } ^ {2} +15 \ kappa _ {2} \ kappa _ {1} ^ {4} + \ kappa _ {1} ^ {6}. \ End {align}}}

«Штрих» отличает моменты μ ′ _n от центральных моментов μ _n . Чтобы выразить центральные моменты как функции кумулянтов, просто исключите из этих многочленов все члены, в которых κ ₁ выступает в качестве множителя:

{\ Displaystyle {\ begin {align} \ mu _ {1} & = 0 \\ [4pt] \ mu _ {2} & = \ kappa _ {2} \\ [4pt] \ mu _ {3} & = \ kappa _ {3} \\ [4pt] \ mu _ {4} & = \ kappa _ {4} +3 \ kappa _ {2} ^ {2} \\ [4pt] \ mu _ {5} & = \ kappa _ {5} +10 \ kappa _ {3} \ kappa _ {2} \\ [4pt] \ mu _ {6} & = \ kappa _ {6} +15 \ kappa _ {4} \ kappa _ {2} +10 \ каппа _ {3} ^ {2} +15 \ каппа _ {2} ^ {3}. \ End {align}}}

Точно так же n -й кумулянт κ _n является многочленом n -й степени от первых n нецентральных моментов. Первые несколько выражений:

{\ displaystyle {\ begin {align} \ kappa _ {1} = {} & \ mu '_ {1} \\ [4pt] \ kappa _ {2} = {} & \ mu' _ {2} - { \ mu '_ {1}} ^ {2} \\ [4pt] \ kappa _ {3} = {} & \ mu' _ {3} -3 \ mu '_ {2} \ mu' _ {1} +2 {\ mu '_ {1}} ^ {3} \\ [4pt] \ kappa _ {4} = {} & \ mu' _ {4} -4 \ mu '_ {3} \ mu' _ {1} -3 {\ mu '_ {2}} ^ {2} +12 \ mu' _ {2} {\ mu '_ {1}} ^ {2} -6 {\ mu' _ {1} } ^ {4} \\ [4pt] \ kappa _ {5} = {} & \ mu '_ {5} -5 \ mu' _ {4} \ mu '_ {1} -10 \ mu' _ { 3} \ mu '_ {2} +20 \ mu' _ {3} {\ mu '_ {1}} ^ {2} +30 {\ mu' _ {2}} ^ {2} \ mu '_ {1} -60 \ mu '_ {2} {\ mu' _ {1}} ^ {3} +24 {\ mu '_ {1}} ^ {5} \\ [4pt] \ kappa _ {6 } = {} & \ mu '_ {6} -6 \ mu' _ {5} \ mu '_ {1} -15 \ mu' _ {4} \ mu '_ {2} +30 \ mu' _ {4} {\ mu '_ {1}} ^ {2} -10 {\ mu' _ {3}} ^ {2} +120 \ mu '_ {3} \ mu' _ {2} \ mu ' _ {1} \\ & {} - 120 \ mu '_ {3} {\ mu' _ {1}} ^ {3} +30 {\ mu '_ {2}} ^ {3} -270 {\ mu '_ {2}} ^ {2} {\ mu' _ {1}} ^ {2} +360 \ mu '_ {2} {\ mu' _ {1}} ^ {4} -120 {\ му '_ {1}} ^ {6} \ end {выровнено}}}

Чтобы выразить кумулянты $κ n$ для $n > 1$ как функции центральных моментов, исключите из этих многочленов все члены, в которых μ ' ₁ появляется как множитель:

{\ Displaystyle \ каппа _ {2} = \ му _ {2} \,}

{\ Displaystyle \ каппа _ {3} = \ му _ {3} \,}

{\ displaystyle \ kappa _ {4} = \ mu _ {4} -3 {\ mu _ {2}} ^ {2} \,}

{\ displaystyle \ kappa _ {5} = \ mu _ {5} -10 \ mu _ {3} \ mu _ {2} \,}

{\ displaystyle \ kappa _ {6} = \ mu _ {6} -15 \ mu _ {4} \ mu _ {2} -10 {\ mu _ {3}} ^ {2} +30 {\ mu _ {2}} ^ {3} \ ,.}

Чтобы выразить кумулянты $κ n$ для $n > 2$ как функции стандартизованных центральных моментов , также установите $μ ' 2 = 1$ в полиномах:

{\ Displaystyle \ каппа _ {3} = \ му _ {3} \,}

{\ displaystyle \ kappa _ {4} = \ mu _ {4} -3 \,}

{\ displaystyle \ kappa _ {5} = \ mu _ {5} -10 \ mu _ {3} \,}

{\ displaystyle \ kappa _ {6} = \ mu _ {6} -15 \ mu _ {4} -10 {\ mu _ {3}} ^ {2} +30 \ ,.}

Кумулянты могут быть связаны с моментами, дифференцируя соотношение $log M (t) = K (t)$ по $t$ , давая $M ' (t) = K ' (t) M (t)$ , которое обычно не содержит возведения в степень или логарифмы. Приравнивая коэффициент при $t n -1$ в левой и правой частях, используя $μ ' 0 = 1$ и переставляя, получаем следующую формулу рекурсии для $n \geq 1$ :

{\ displaystyle \ kappa _ {n} = \ mu '_ {n} - \ sum _ {m = 1} ^ {n-1} {n-1 \ select m-1} \ kappa _ {m} \ mu _ {нм} '.}

Кумулянты и множества-перегородки

Эти многочлены имеют замечательную комбинаторную интерпретацию: коэффициенты подсчитывают определенные разбиения множеств . Общий вид этих многочленов таков:

{\ displaystyle \ mu '_ {n} = \ sum _ {\ pi \, \ in \, \ Pi} \ prod _ {B \, \ in \, \ pi} \ kappa _ {| B |}}

куда

$π$ пробегает список всех разбиений множества размера $n$ ;
« $B \in π$ » означает, что $B$ - один из «блоков», на которые разбивается множество; а также
$| B |$ это размер множества $B$ .

Таким образом, каждый моном представляет собой произведение кумулянтов, умноженное на константу, в которой сумма индексов равна $n$ (например, в члене $κ 3 κ 22 κ 1$ сумма индексов равна 3 + 2 + 2 + 1 = 8; это появляется в полиноме, который выражает 8-й момент как функцию первых восьми кумулянтов). Каждому члену соответствует раздел целого числа $n$ . Коэффициент в каждом члене есть число разбиений множества из $п$ элементов , которые коллапс на этот раздел целого числа $п$ , когда члены набора становятся неразличимыми.

Кумулянты и комбинаторика

Дальнейшую связь между кумулянтами и комбинаторикой можно найти в работе Джан-Карло Рота , где связи с теорией инвариантов , симметричными функциями и биномиальными последовательностями изучаются с помощью умбрального исчисления .

Совместные кумулянты

Совместное кумулянт нескольких случайных величин X ₁ , ..., X _п определяется аналогичной функции , генерирующей кумулянт

{\ Displaystyle К (t_ {1}, t_ {2}, \ точки, t_ {n}) = \ журнал E (\ mathrm {e} ^ {\ sum _ {j = 1} ^ {n} t_ {j } X_ {j}}).}

Следствием этого является то, что

{\ displaystyle \ kappa (X_ {1}, \ dots, X_ {n}) = \ sum _ {\ pi} (| \ pi | -1)! (- 1) ^ {| \ pi | -1} \ prod _ {B \ in \ pi} E \ left (\ prod _ {i \ in B} X_ {i} \ right)}

где $π$ пробегает список всех разбиений {1, ..., n }, B пробегает список всех блоков разбиения $π$ , и | $π$ | - количество частей в разделе. Например,

{\ displaystyle \ kappa (X, Y, Z) = \ operatorname {E} (XYZ) - \ operatorname {E} (XY) \ operatorname {E} (Z) - \ operatorname {E} (XZ) \ operatorname { E} (Y) - \ operatorname {E} (YZ) \ operatorname {E} (X) +2 \ operatorname {E} (X) \ operatorname {E} (Y) \ operatorname {E} (Z). \ ,}

Если какие-либо из этих случайных величин идентичны, например, если X = Y , то применяются те же формулы, например

{\ displaystyle \ kappa (X, X, Z) = \ operatorname {E} (X ^ {2} Z) -2 \ operatorname {E} (XZ) \ operatorname {E} (X) - \ operatorname {E} (X ^ {2}) \ operatorname {E} (Z) +2 \ operatorname {E} (X) ^ {2} \ operatorname {E} (Z), \,}

хотя для таких повторяющихся переменных существуют более лаконичные формулы. Для случайных векторов с нулевым средним

{\ Displaystyle \ каппа (X, Y, Z) = \ OperatorName {E} (XYZ). \,}

{\ displaystyle \ kappa (X, Y, Z, W) = \ operatorname {E} (XYZW) - \ operatorname {E} (XY) \ operatorname {E} (ZW) - \ operatorname {E} (XZ) \ OperatorName {E} (YW) - \ operatorname {E} (XW) \ operatorname {E} (YZ). \,}

Совокупный кумулянт только одной случайной величины - это ее математическое ожидание, а двух случайных величин - их ковариация . Если некоторые из случайных величин независимы от всех других, то любой кумулянт, включающий две (или более) независимых случайных величины, равен нулю. Если все n случайных величин одинаковы, то объединенный кумулянт является n -м обыкновенным кумулянтом.

Комбинаторный смысл выражения моментов через кумулянты легче понять, чем кумулянтов через моменты:

{\ displaystyle \ operatorname {E} (X_ {1} \ cdots X_ {n}) = \ sum _ {\ pi} \ prod _ {B \ in \ pi} \ kappa (X_ {i}: i \ in B ).}

Например:

{\ Displaystyle \ OperatorName {E} (XYZ) = \ каппа (X, Y, Z) + \ каппа (X, Y) \ каппа (Z) + \ каппа (X, Z) \ каппа (Y) + \ каппа (Y, Z) \ kappa (X) + \ kappa (X) \ kappa (Y) \ kappa (Z). \,}

Еще одно важное свойство совместных кумулянтов - полилинейность:

{\ displaystyle \ kappa (X + Y, Z_ {1}, Z_ {2}, \ dots) = \ kappa (X, Z_ {1}, Z_ {2}, \ ldots) + \ kappa (Y, Z_ { 1}, Z_ {2}, \ ldots). \,}

Подобно тому, как второй кумулянт - это дисперсия, совместный кумулянт всего двух случайных величин является ковариацией . Знакомая личность

{\ displaystyle \ operatorname {var} (X + Y) = \ operatorname {var} (X) +2 \ operatorname {cov} (X, Y) + \ operatorname {var} (Y) \,}

обобщает на кумулянты:

{\ displaystyle \ kappa _ {n} (X + Y) = \ sum _ {j = 0} ^ {n} {n \ select j} \ kappa (\, \ underbrace {X, \ dots, X} _ { j}, \ underbrace {Y, \ dots, Y} _ {nj} \,). \,}

Условные кумулянты и закон суммарной кумулянты

Закон полного математического ожидания и закон общей дисперсии обобщать естественно условные кумулянт. Случай n = 3, выраженный на языке (центральных) моментов, а не на языке кумулянтов, говорит:

{\ displaystyle \ mu _ {3} (X) = \ operatorname {E} (\ mu _ {3} (X \ mid Y)) + \ mu _ {3} (\ operatorname {E} (X \ mid Y) )) + 3 \ operatorname {cov} (\ operatorname {E} (X \ mid Y), \ operatorname {var} (X \ mid Y)).}

В основном,

{\ displaystyle \ kappa (X_ {1}, \ dots, X_ {n}) = \ sum _ {\ pi} \ kappa (\ kappa (X _ {\ pi _ {1}} \ mid Y), \ dots, \ kappa (X _ {\ pi _ {b}} \ mid Y))}

куда

сумма ведется по всем разбиениям $π$ множества индексов {1, ..., n }, и
$π$ ₁ , ..., $π$ _b - все «блоки» разбиения $π$ ; выражение κ ( X _{$π$ _m} ) указывает, что совокупный кумулянт случайных величин, индексы которых находятся в этом блоке разбиения.

Отношение к статистической физике

В статистической физике многие обширные величины, то есть величины, пропорциональные объему или размеру данной системы, связаны с кумулянтами случайных величин. Глубокая связь заключается в том, что в большой системе такая обширная величина, как энергия или количество частиц, может рассматриваться как сумма (скажем) энергии, связанной с рядом почти независимых областей. Тот факт, что кумулянты этих почти независимых случайных величин будут (почти) складываться, делает разумным предположение, что большие количества должны быть связаны с кумулянтами.

Система, находящаяся в равновесии с термостатом при температуре T, имеет флуктуирующую внутреннюю энергию E, которую можно рассматривать как случайную величину, взятую из распределения . Статсумма системы является ${\ Displaystyle E \ sim p (E)}$

{\ Displaystyle Z (\ бета) = \ langle \ ехр (- \ бета E) \ rangle, \,}

где β = 1 / ( кТ ) и к является постоянной Больцмана , и обозначение было использовано , а не для значения ожидания , чтобы избежать путаницы с энергией, Е . Следовательно, первый и второй кумулянты для энергии E дают среднюю энергию и теплоемкость. ${\ displaystyle \ langle A \ rangle}$ ${\ displaystyle \ operatorname {E} [A]}$

{\ displaystyle \ langle E \ rangle _ {c} = {\ frac {\ partial \ log Z} {\ partial (- \ beta)}} = \ langle E \ rangle}

{\ displaystyle \ langle E ^ {2} \ rangle _ {c} = {\ frac {\ partial \ langle E \ rangle _ {c}} {\ partial (- \ beta)}} = kT ^ {2} { \ frac {\ partial \ langle E \ rangle} {\ partial T}} = kT ^ {2} C}

Свободная энергия Гельмгольца выражается через

{\ Displaystyle F (\ бета) = - \ бета ^ {- 1} \ журнал Z (\ бета) \,}

далее связывает термодинамические величины с кумулянтной производящей функцией для энергии. Термодинамические свойства, являющиеся производными от свободной энергии, такие как ее внутренняя энергия , энтропия и удельная теплоемкость , все можно легко выразить через эти кумулянты. Другая свободная энергия может быть функцией других переменных, таких как магнитное поле или химический потенциал , например ${\ displaystyle \ mu}$

{\ Displaystyle \ Omega = - \ beta ^ {- 1} \ log (\ langle \ exp (- \ beta E- \ beta \ mu N) \ rangle), \,}

где N - количество частиц, а - большой потенциал. Опять же тесная взаимосвязь между определением свободной энергии и кумулянтной производящей функцией означает , что различные производные этой свободной энергии можно записать в терминах совместных кумулянтов E и N . ${\ displaystyle \ Omega}$

История

Историю кумулянтов обсуждает Андерс Халд .

Кумулянты были впервые введены Торвальдом Н. Тиле в 1889 году, который назвал их полуинвариантами . Впервые они были названы кумулянтами в статье 1932 года Рональда Фишера и Джона Уишарта . Фишеру публично напомнил о работе Тиле Нейман, который также отмечает ранее опубликованные цитаты Тиле, доведенные до сведения Фишера. Стивен Стиглер сказал, что название кумулянт было предложено Фишеру в письме от Гарольда Хотеллинга . В статье, опубликованной в 1929 году, Фишер назвал их функциями кумулятивного момента . Статистическая сумма в статистической физике была введена Джозайей Уиллардом Гиббсом в 1901 году. Свободную энергию часто называют свободной энергией Гиббса. В статистической механике кумулянты также известны как функции Урселла, относящиеся к публикации 1927 года.

Кумулянты в обобщенных настройках

Формальные кумулянты

В более общем смысле, кумулянты последовательности { m _n : n = 1, 2, 3, ...}, не обязательно моменты любого распределения вероятностей, по определению, являются

{\ displaystyle 1+ \ sum _ {n = 1} ^ {\ infty} {\ frac {m_ {n} t ^ {n}} {n!}} = \ exp \ left (\ sum _ {n = 1 } ^ {\ infty} {\ frac {\ kappa _ {n} t ^ {n}} {n!}} \ right),}

где значения κ _n для n = 1, 2, 3, ... находятся формально, т. е. только с помощью алгебры, не обращая внимания на вопрос, сходится ли какой-либо ряд. При формальной работе отсутствуют все трудности «проблемы кумулянтов». Самый простой пример - второй кумулянт распределения вероятностей всегда должен быть неотрицательным и равен нулю только в том случае, если все старшие кумулянты равны нулю. Формальные кумулянты не подчиняются таким ограничениям.

Номера звонков

В комбинаторике , то п -го числа Bell является число разбиений множества размера п . Все кумулянты последовательности чисел Белла равны 1 . Числа Белла - это моменты распределения Пуассона с математическим ожиданием 1 .

Кумулянты полиномиальной последовательности биномиального типа

Для любой последовательности {κ _n : n = 1, 2, 3, ...} скаляров в поле нулевой характеристики, считающейся формальными кумулянтами, существует соответствующая последовательность {μ ′: n = 1, 2, 3, ...} формальных моментов, заданных полиномами выше. Для этих многочленов постройте полиномиальную последовательность следующим образом. Из полинома

{\ displaystyle {\ begin {align} \ mu '_ {6} = {} & \ kappa _ {6} +6 \ kappa _ {5} \ kappa _ {1} +15 \ kappa _ {4} \ kappa _ {2} +15 \ каппа _ {4} \ каппа _ {1} ^ {2} +10 \ каппа _ {3} ^ {2} +60 \ каппа _ {3} \ каппа _ {2} \ каппа _ {1} +20 \ каппа _ {3} \ каппа _ {1} ^ {3} \\ & {} + 15 \ каппа _ {2} ^ {3} +45 \ каппа _ {2} ^ {2 } \ каппа _ {1} ^ {2} +15 \ каппа _ {2} \ каппа _ {1} ^ {4} + \ каппа _ {1} ^ {6} \ конец {выровнено}}}

создайте новый многочлен в них плюс одну дополнительную переменную x :

{\ displaystyle {\ begin {align} p_ {6} (x) = {} & \ kappa _ {6} \, x + (6 \ kappa _ {5} \ kappa _ {1} +15 \ kappa _ {4 } \ kappa _ {2} +10 \ kappa _ {3} ^ {2}) \, x ^ {2} + (15 \ kappa _ {4} \ kappa _ {1} ^ {2} +60 \ kappa _ {3} \ kappa _ {2} \ kappa _ {1} +15 \ kappa _ {2} ^ {3}) \, x ^ {3} \\ & {} + (45 \ kappa _ {2} ^ {2} \ kappa _ {1} ^ {2}) \, x ^ {4} + (15 \ kappa _ {2} \ kappa _ {1} ^ {4}) \, x ^ {5} + (\ каппа _ {1} ^ {6}) \, x ^ {6}, \ конец {выровнено}}}

а затем обобщите образец. Шаблон состоит в том, что количество блоков в вышеупомянутых разделах является показателем x . Каждый коэффициент является полиномом от кумулянтов; это полиномы Белла , названные в честь Эрика Темпл Белла .

Эта последовательность многочленов биномиального типа . Фактически, никаких других последовательностей биномиального типа не существует; каждая полиномиальная последовательность биномиального типа полностью определяется своей последовательностью формальных кумулянтов.

Бесплатные кумулянты

В приведенной выше формуле моментного кумулянта

{\ Displaystyle E (X_ {1} \ cdots X_ {n}) = \ sum _ {\ pi} \ prod _ {B \, \ in \, \ pi} \ kappa (X_ {i}: i \ in B )}

для совместных кумулянтов - одна сумма по всем разбиениям множества {1, ..., n }. Если вместо этого суммировать только по непересекающимся разделам , то, решая эти формулы для моментов, можно получить свободные кумулянты, а не обычные кумулянты, рассмотренные выше. Эти свободные кумулянты были введены Роландом Спайхером и играют центральную роль в теории свободных вероятностей . В этой теории, а не рассматривать независимость от случайных величин , определенных в терминах тензорных произведений алгебр случайных величин, одна считает , вместо того, чтобы бесплатно независимость случайных величин, определенных в терминах свободных произведений алгебр. ${\ displaystyle \ kappa}$

Обычные кумулянты степени выше 2 нормального распределения равны нулю. В свободных кумулянты степени выше 2 из Вигнера полукруга распределения равны нулю. В этом отношении роль распределения Вигнера в свободной теории вероятностей аналогична роли нормального распределения в традиционной теории вероятностей.

Смотрите также

Энтропийная ценность под угрозой
Кумулянтная производящая функция из мультимножества
Расширение Корниш – Фишера
Расширение Эджворта
Поликай
k-статистика , несмещенная оценка кумулянта с минимальной дисперсией
Функция урселла
Тензор полного разброса положения как приложение кумулянтов для анализа электронной волновой функции в квантовой химии .

Languages

In other projects