Кумулянт - Cumulant
В теории вероятностей и статистике , то кумулянты .йГа п о распределении вероятностей представляют собой набор величин , которые обеспечивают альтернативу моментов распределения. Моменты определяют кумулянты в том смысле, что любые два распределения вероятностей, моменты которых идентичны, также будут иметь одинаковые кумулянты, и аналогично кумулянты определяют моменты.
Первый кумулянт - это среднее значение , второй кумулянт - это дисперсия , а третий кумулянт - это то же самое, что и третий центральный момент . Но кумулянты четвертого и более высокого порядка не равны центральным моментам. В некоторых случаях теоретическое рассмотрение проблем в терминах кумулянтов проще, чем использование моментов. В частности, когда две или более случайных величин статистически независимы , кумулянт n- го порядка их суммы равен сумме их кумулянтов n- го порядка. Кроме того, кумулянты третьего и более высокого порядка нормального распределения равны нулю, и это единственное распределение с этим свойством.
Как и для моментов, когда совместные моменты используются для наборов случайных величин, можно определить совместные кумулянты .
Определение
Кумулянты случайной величины X определяется с помощью кумулянт-производящей функция К ( т ) , которая является натуральным логарифмом от функции момента , генерирующим :
Кумулянты κ n получаются разложением производящей функции кумулянта в ряд по степеням:
Это разложение является рядом Маклорена , поэтому n -й кумулянт может быть получен путем дифференцирования вышеуказанного разложения n раз и оценки результата равным нулю:
Если функция, генерирующая момент, не существует, кумулянты могут быть определены в терминах взаимосвязи между кумулянтами и моментами, обсуждаемыми позже.
Альтернативное определение кумулянтной производящей функции
Некоторые авторы предпочитают определять кумулянт-производящую функцию как натуральный логарифм характеристической функции , которую иногда также называют второй характеристической функцией,
Преимущество H ( t ) - в некотором смысле функция K ( t ), вычисляемая для чисто мнимых аргументов - состоит в том, что E [ e itX ] хорошо определено для всех действительных значений t, даже если E [ e tX ] не определено должным образом. для всех реальных значений t , например, когда существует «слишком большая» вероятность того, что X имеет большую величину. Хотя функция H ( t ) будет хорошо определена, она, тем не менее, будет имитировать K ( t ) с точки зрения длины своего ряда Маклорена , который не может выходить за пределы (или, в редких случаях, даже) линейного порядка в аргументе t , и, в частности, количество четко определенных кумулянтов не изменится. Тем не менее, даже когда H ( t ) не имеет длинного ряда Маклорена, его можно использовать непосредственно при анализе и, в частности, добавлении случайных величин. Как распределение Коши (также называемое лоренцевым), так и в более общем плане устойчивые распределения (связанные с распределением Леви) являются примерами распределений, для которых разложения производящих функций в степенной ряд имеют только конечное число четко определенных членов.
Использование в статистике
Работа с кумулянтами может иметь преимущество по сравнению с использованием моментов , потому что для статистически независимых случайных величин X и Y ,
так что каждый кумулянт суммы независимых случайных величин является суммой соответствующих кумулянтов слагаемых . То есть, когда слагаемые статистически независимы, среднее значение суммы - это сумма средних, дисперсия суммы - это сумма дисперсий, третий кумулянт (который оказывается третьим центральным моментом) суммы является суммой третьих кумулянтов и так далее для каждого порядка кумулянтов.
Распределение с заданными кумулянтами κ n может быть аппроксимировано рядом Эджворта .
Кумулянты некоторых дискретных распределений вероятностей
- Постоянные случайные величины X = μ . Кумулянтная производящая функция K ( t ) = μt . Первый кумулянт равен κ 1 = K '(0) = μ, а остальные кумулянты равны нулю, κ 2 = κ 3 = κ 4 = ... = 0 .
- Распределения Бернулли (количество успехов в одном испытании с вероятностью успеха p ). Кумулянтная производящая функция K ( t ) = log (1 - p + p e t ) . Первые кумулянты: κ 1 = K '(0) = p и κ 2 = K ′ ′ (0) = p · (1 - p ) . Кумулянты удовлетворяют формуле рекурсии
- В геометрическое распределение , (число отказов до одного успеха с вероятностью р успеха на каждом испытании). Кумулянтная производящая функция K ( t ) = log ( p / (1 + ( p - 1) e t )) . Первые кумулянты равны κ 1 = K ′ (0) = p −1 - 1 и κ 2 = K ′ ′ (0) = κ 1 p −1 . Подстановка p = ( μ + 1) −1 дает K ( t ) = −log (1 + μ (1 − e t )) и κ 1 = μ .
- Распределения Пуассона . Кумулянтная производящая функция K ( t ) = μ (e t - 1) . Все кумулянты равны параметру: κ 1 = κ 2 = κ 3 = ... = μ .
- В биномиального распределения , (число успехов в п независимых испытаниях с вероятностью р успеха на каждом испытании). Частный случай n = 1 - это распределение Бернулли. Каждый кумулянт просто в n раз больше соответствующего кумулянта соответствующего распределения Бернулли. Кумулянтная производящая функция K ( t ) = n log (1 - p + p e t ) . Первые кумулянты: κ 1 = K ′ (0) = np и κ 2 = K ′ ′ (0) = κ 1 (1 - p ) . Подстановка p = μ · n −1 дает K '( t ) = ((μ −1 - n −1 ) · e - t + n −1 ) −1 и κ 1 = μ . Предельный случай n −1 = 0 является распределением Пуассона.
- В отрицательных биномиальных распределений , (число неудач , прежде чем г успехов с вероятностью р успеха на каждом испытании). Частный случай r = 1 - геометрическое распределение. Каждый кумулянт просто в r раз больше соответствующего кумулянта соответствующего геометрического распределения. Производная кумулянтной производящей функции равна K '( t ) = r · ((1 - p ) −1 · e - t −1) −1 . Первые кумулянты равны κ 1 = K '(0) = r · ( p −1 −1) и κ 2 = K ' '(0) = κ 1 · p −1 . Подстановка p = (μ · r −1 +1) −1 дает K ′ ( t ) = (( μ −1 + r −1 ) e - t - r −1 ) −1 и κ 1 = μ . Сравнение этих формул с формулами биномиального распределения объясняет название «отрицательное биномиальное распределение». Предельный случай г -1 = 0 является распределением Пуассона.
Представляем отношение дисперсии к среднему
приведенные выше распределения вероятностей получают единую формулу для производной кумулянтной производящей функции:
Вторая производная
подтверждая, что первый кумулянт равен κ 1 = K ′ (0) = μ, а второй кумулянт равен κ 2 = K ′ ′ (0) = με . Постоянные случайные величины X = μ имеют ε = 0 . Биномиальные распределения имеют ε = 1 - p, так что 0 < ε <1 . Распределения Пуассона имеют ε = 1 . Отрицательные биномиальные распределения имеют ε = p − 1, так что ε > 1 . Обратите внимание на аналогию с классификацией конических сечений по эксцентриситету : окружности ε = 0 , эллипсы 0 < ε <1 , параболы ε = 1 , гиперболы ε > 1 .
Кумулянты некоторых непрерывных распределений вероятностей
- Для нормального распределения с ожидаемым значением ц и дисперсией сг 2 , кумулянт производящая функция К ( т ) = мкТл + σ 2 т 2 /2 . Первая и вторая производные кумулянтной производящей функции равны K '( t ) = μ + σ 2 · t и K "( t ) = σ 2. Кумулянты равны κ 1 = μ , κ 2 = σ 2 и κ 3. = κ 4 = ... = 0. Частным случаем σ 2 = 0 является постоянная случайная величина X = μ .
- Кумулянты равномерного распределения на интервале [−1, 0] равны κ n = B n / n , где B n - n- е число Бернулли .
- Кумулянты экспоненциального распределения с параметром λ равны κ n = λ - n ( n - 1)! .
Некоторые свойства кумулянтной производящей функции
Кумулянт производящая функция К ( т ), если она существует, является бесконечно дифференцируемой и выпуклой , и проходит через начало координат. Его первая производная монотонно изменяется в открытом интервале от нижней грани до верхней грани носителя распределения вероятностей, а вторая производная строго положительна везде, где она определена, за исключением вырожденного распределения единственной точечной массы. Кумулянт-производящая функция существует тогда и только тогда, когда хвосты распределения мажорируются экспоненциальным убыванием , то есть ( см. Обозначение Big O )
где - кумулятивная функция распределения . Кумулянт-производящая функция будет иметь вертикальную асимптоту (-ы) в нижней нижней грани такого c , если такая нижняя грань существует, и в верхней грани такого d , если такая верхняя грань существует, в противном случае она будет определена для всех действительных чисел.
Если носитель случайной величины X имеет конечную верхнюю или нижнюю границу, то ее кумулянт-производящая функция y = K ( t ), если она существует, приближается к асимптоте (ам), наклон которой равен супремуму и / или нижнему пределу служба поддержки,
соответственно, лежащие повсюду над обеими этими линиями. ( Интегралы
дают y- интерцепты этих асимптот, поскольку K (0) = 0.)
Для сдвига распределения по C , Для вырожденного точечной массы на C , то CGF представляет собой прямую линию , а в более общем случае , если и только если X и Y являются независимыми и существуют их CGFS; ( Субзависимость и наличие вторых моментов, достаточных, чтобы подразумевать независимость.)
Естественно экспоненциальное семейство из распределения может быть реализовано путем сдвига или перевода K ( т ), и корректировок ее вертикально таким образом , чтобы она всегда проходит через начало координат: если е является PDF с CGF и является ее естественным экспоненциальным семейство, то и
Если K ( t ) конечно для диапазона t 1 <Re ( t ) < t 2, то если t 1 <0 < t 2, то K ( t ) аналитична и бесконечно дифференцируема при t 1 <Re ( t ) < t 2. . Более того, при t вещественных и t 1 < t < t 2 K ( t ) строго выпукло, а K '( t ) строго возрастает.
Некоторые свойства кумулянтов
Инвариантность и эквивариантность
Первый кумулянт сдвиг- эквивариантен ; все остальные инвариантны относительно сдвига . Это означает, что если обозначить через κ n ( X ) n-й кумулянт распределения вероятностей случайной величины X , то для любой константы c :
Другими словами, сдвиг случайной величины (добавление c ) сдвигает первый кумулянт (среднее значение) и не влияет ни на один из остальных.
Однородность
П -й кумулянт однородна степени п , то есть , если с какой - либо постоянной, то
Аддитивность
Если X и Y - независимые случайные величины, то κ n ( X + Y ) = κ n ( X ) + κ n ( Y ) .
Отрицательный результат
Учитывая результаты для кумулянтов нормального распределения , можно надеяться найти семейства распределений, для которых κ m = κ m +1 = ⋯ = 0 для некоторого m > 3 , с кумулянтами более низкого порядка (от 3 до m - 1 ) отличное от нуля. Таких раздач нет. Основной результат здесь состоит в том, что кумулянтная производящая функция не может быть многочленом конечного порядка степени выше 2.
Кумулянты и моменты
Производящая функция момент определяется по формуле:
Таким образом, кумулянтная производящая функция - это логарифм производящей функции момента
Первый кумулянт - это ожидаемое значение ; второй и третий кумулянты являются соответственно вторым и третьим центральными моментами (второй центральный момент - это дисперсия ); но старшие кумулянты не являются ни моментами, ни центральными моментами, а скорее более сложными полиномиальными функциями моментов.
Моменты могут быть восстановлены в терминах кумулянтов, оценивая n-ю производную at ,
Точно так же кумулянты могут быть восстановлены с точки зрения моментов, оценивая n-ю производную at ,
Явное выражение для n -го момента через первые n кумулянтов и наоборот можно получить, используя формулу Фаа ди Бруно для высших производных сложных функций. В общем, у нас есть
где - неполные (или частичные) полиномы Белла .
Аналогичным образом, если среднее значение равно , производящая функция центрального момента равна
а n-й центральный момент получается в терминах кумулянтов как
Кроме того, при n > 1 n-й кумулянт по центральным моментам равен
П -й момент μ ' п является п - й степени многочлен в первых п кумулянтами. Первые несколько выражений:
«Штрих» отличает моменты μ ′ n от центральных моментов μ n . Чтобы выразить центральные моменты как функции кумулянтов, просто исключите из этих многочленов все члены, в которых κ 1 выступает в качестве множителя:
Точно так же n -й кумулянт κ n является многочленом n -й степени от первых n нецентральных моментов. Первые несколько выражений:
Чтобы выразить кумулянты κ n для n > 1 как функции центральных моментов, исключите из этих многочленов все члены, в которых μ ' 1 появляется как множитель:
Чтобы выразить кумулянты κ n для n > 2 как функции стандартизованных центральных моментов , также установите μ ' 2 = 1 в полиномах:
Кумулянты могут быть связаны с моментами, дифференцируя соотношение log M ( t ) = K ( t ) по t , давая M ′ ( t ) = K ′ ( t ) M ( t ) , которое обычно не содержит возведения в степень или логарифмы. Приравнивая коэффициент при t n −1 в левой и правой частях, используя μ ′ 0 = 1 и переставляя, получаем следующую формулу рекурсии для n ≥ 1 :
Кумулянты и множества-перегородки
Эти многочлены имеют замечательную комбинаторную интерпретацию: коэффициенты подсчитывают определенные разбиения множеств . Общий вид этих многочленов таков:
куда
- π пробегает список всех разбиений множества размера n ;
- « B ∈ π » означает, что B - один из «блоков», на которые разбивается множество; а также
- | B | это размер множества B .
Таким образом, каждый моном представляет собой произведение кумулянтов, умноженное на константу, в которой сумма индексов равна n (например, в члене κ 3 κ 2 2 κ 1 сумма индексов равна 3 + 2 + 2 + 1 = 8; это появляется в полиноме, который выражает 8-й момент как функцию первых восьми кумулянтов). Каждому члену соответствует раздел целого числа n . Коэффициент в каждом члене есть число разбиений множества из п элементов , которые коллапс на этот раздел целого числа п , когда члены набора становятся неразличимыми.
Кумулянты и комбинаторика
Дальнейшую связь между кумулянтами и комбинаторикой можно найти в работе Джан-Карло Рота , где связи с теорией инвариантов , симметричными функциями и биномиальными последовательностями изучаются с помощью умбрального исчисления .
Совместные кумулянты
Совместное кумулянт нескольких случайных величин X 1 , ..., X п определяется аналогичной функции , генерирующей кумулянт
Следствием этого является то, что
где π пробегает список всех разбиений {1, ..., n }, B пробегает список всех блоков разбиения π , и | π | - количество частей в разделе. Например,
Если какие-либо из этих случайных величин идентичны, например, если X = Y , то применяются те же формулы, например
хотя для таких повторяющихся переменных существуют более лаконичные формулы. Для случайных векторов с нулевым средним
Совокупный кумулянт только одной случайной величины - это ее математическое ожидание, а двух случайных величин - их ковариация . Если некоторые из случайных величин независимы от всех других, то любой кумулянт, включающий две (или более) независимых случайных величины, равен нулю. Если все n случайных величин одинаковы, то объединенный кумулянт является n -м обыкновенным кумулянтом.
Комбинаторный смысл выражения моментов через кумулянты легче понять, чем кумулянтов через моменты:
Например:
Еще одно важное свойство совместных кумулянтов - полилинейность:
Подобно тому, как второй кумулянт - это дисперсия, совместный кумулянт всего двух случайных величин является ковариацией . Знакомая личность
обобщает на кумулянты:
Условные кумулянты и закон суммарной кумулянты
Закон полного математического ожидания и закон общей дисперсии обобщать естественно условные кумулянт. Случай n = 3, выраженный на языке (центральных) моментов, а не на языке кумулянтов, говорит:
В основном,
куда
- сумма ведется по всем разбиениям π множества индексов {1, ..., n }, и
- π 1 , ..., π b - все «блоки» разбиения π ; выражение κ ( X π m ) указывает, что совокупный кумулянт случайных величин, индексы которых находятся в этом блоке разбиения.
Отношение к статистической физике
В статистической физике многие обширные величины, то есть величины, пропорциональные объему или размеру данной системы, связаны с кумулянтами случайных величин. Глубокая связь заключается в том, что в большой системе такая обширная величина, как энергия или количество частиц, может рассматриваться как сумма (скажем) энергии, связанной с рядом почти независимых областей. Тот факт, что кумулянты этих почти независимых случайных величин будут (почти) складываться, делает разумным предположение, что большие количества должны быть связаны с кумулянтами.
Система, находящаяся в равновесии с термостатом при температуре T, имеет флуктуирующую внутреннюю энергию E, которую можно рассматривать как случайную величину, взятую из распределения . Статсумма системы является
где β = 1 / ( кТ ) и к является постоянной Больцмана , и обозначение было использовано , а не для значения ожидания , чтобы избежать путаницы с энергией, Е . Следовательно, первый и второй кумулянты для энергии E дают среднюю энергию и теплоемкость.
Свободная энергия Гельмгольца выражается через
далее связывает термодинамические величины с кумулянтной производящей функцией для энергии. Термодинамические свойства, являющиеся производными от свободной энергии, такие как ее внутренняя энергия , энтропия и удельная теплоемкость , все можно легко выразить через эти кумулянты. Другая свободная энергия может быть функцией других переменных, таких как магнитное поле или химический потенциал , например
где N - количество частиц, а - большой потенциал. Опять же тесная взаимосвязь между определением свободной энергии и кумулянтной производящей функцией означает , что различные производные этой свободной энергии можно записать в терминах совместных кумулянтов E и N .
История
Историю кумулянтов обсуждает Андерс Халд .
Кумулянты были впервые введены Торвальдом Н. Тиле в 1889 году, который назвал их полуинвариантами . Впервые они были названы кумулянтами в статье 1932 года Рональда Фишера и Джона Уишарта . Фишеру публично напомнил о работе Тиле Нейман, который также отмечает ранее опубликованные цитаты Тиле, доведенные до сведения Фишера. Стивен Стиглер сказал, что название кумулянт было предложено Фишеру в письме от Гарольда Хотеллинга . В статье, опубликованной в 1929 году, Фишер назвал их функциями кумулятивного момента . Статистическая сумма в статистической физике была введена Джозайей Уиллардом Гиббсом в 1901 году. Свободную энергию часто называют свободной энергией Гиббса. В статистической механике кумулянты также известны как функции Урселла, относящиеся к публикации 1927 года.
Кумулянты в обобщенных настройках
Формальные кумулянты
В более общем смысле, кумулянты последовательности { m n : n = 1, 2, 3, ...}, не обязательно моменты любого распределения вероятностей, по определению, являются
где значения κ n для n = 1, 2, 3, ... находятся формально, т. е. только с помощью алгебры, не обращая внимания на вопрос, сходится ли какой-либо ряд. При формальной работе отсутствуют все трудности «проблемы кумулянтов». Самый простой пример - второй кумулянт распределения вероятностей всегда должен быть неотрицательным и равен нулю только в том случае, если все старшие кумулянты равны нулю. Формальные кумулянты не подчиняются таким ограничениям.
Номера звонков
В комбинаторике , то п -го числа Bell является число разбиений множества размера п . Все кумулянты последовательности чисел Белла равны 1 . Числа Белла - это моменты распределения Пуассона с математическим ожиданием 1 .
Кумулянты полиномиальной последовательности биномиального типа
Для любой последовательности {κ n : n = 1, 2, 3, ...} скаляров в поле нулевой характеристики, считающейся формальными кумулянтами, существует соответствующая последовательность {μ ′: n = 1, 2, 3, ...} формальных моментов, заданных полиномами выше. Для этих многочленов постройте полиномиальную последовательность следующим образом. Из полинома
создайте новый многочлен в них плюс одну дополнительную переменную x :
а затем обобщите образец. Шаблон состоит в том, что количество блоков в вышеупомянутых разделах является показателем x . Каждый коэффициент является полиномом от кумулянтов; это полиномы Белла , названные в честь Эрика Темпл Белла .
Эта последовательность многочленов биномиального типа . Фактически, никаких других последовательностей биномиального типа не существует; каждая полиномиальная последовательность биномиального типа полностью определяется своей последовательностью формальных кумулянтов.
Бесплатные кумулянты
В приведенной выше формуле моментного кумулянта
для совместных кумулянтов - одна сумма по всем разбиениям множества {1, ..., n }. Если вместо этого суммировать только по непересекающимся разделам , то, решая эти формулы для моментов, можно получить свободные кумулянты, а не обычные кумулянты, рассмотренные выше. Эти свободные кумулянты были введены Роландом Спайхером и играют центральную роль в теории свободных вероятностей . В этой теории, а не рассматривать независимость от случайных величин , определенных в терминах тензорных произведений алгебр случайных величин, одна считает , вместо того, чтобы бесплатно независимость случайных величин, определенных в терминах свободных произведений алгебр.
Обычные кумулянты степени выше 2 нормального распределения равны нулю. В свободных кумулянты степени выше 2 из Вигнера полукруга распределения равны нулю. В этом отношении роль распределения Вигнера в свободной теории вероятностей аналогична роли нормального распределения в традиционной теории вероятностей.
Смотрите также
- Энтропийная ценность под угрозой
- Кумулянтная производящая функция из мультимножества
- Расширение Корниш – Фишера
- Расширение Эджворта
- Поликай
- k-статистика , несмещенная оценка кумулянта с минимальной дисперсией
- Функция урселла
- Тензор полного разброса положения как приложение кумулянтов для анализа электронной волновой функции в квантовой химии .