Предельная плотность дискретных точек - Limiting density of discrete points

В теории информации , то предельная плотность дискретных точек является корректировка формулы Клода Шеннона для дифференциальной энтропии .

Он был сформулирован Эдвином Томпсоном Джейнсом для устранения недостатков в первоначальном определении дифференциальной энтропии.

Определение

Первоначально Шеннон записал следующую формулу для энтропии непрерывного распределения, известную как дифференциальная энтропия :

Однако, в отличие от формулы Шеннона для дискретной энтропии, это не результат какого-либо вывода (Шеннон просто заменил символ суммирования в дискретной версии на интеграл), но в нем отсутствуют многие свойства, которые делают дискретную энтропию полезной мерой неуверенность. В частности, он не инвариантен при замене переменных и может стать отрицательным. Кроме того, это даже неверно по размерам. Поскольку будет безразмерным, должен иметь единицы измерения , что означает, что аргумент логарифма не является безразмерным, как требуется.

Джейнс утверждал, что формулу для непрерывной энтропии следует выводить, взяв предел все более плотных дискретных распределений. Предположим, что у нас есть набор дискретных точек , таких, что в пределе их плотность приближается к функции, называемой «инвариантной мерой».

Джейнс вывел из этого следующую формулу для непрерывной энтропии, которую, как он утверждал, следует принимать как правильную:

Обычно, когда это написано, термин опускается, так как он обычно не является конечным. Итак, фактическое общее определение:

Если неясно, следует ли опускать термин, можно написать

Обратите внимание, что в формуле Джейнса - это плотность вероятности. Для любого конечного, которое является равномерной плотностью по квантованию непрерывного пространства, которое используется в сумме Римана. В пределе - это непрерывная предельная плотность точек квантования, используемая для представления непрерывной переменной .

Предположим, у кого-то есть числовой формат, который принимает возможные значения, распределенные согласно . Тогда (если достаточно велико, чтобы непрерывное приближение действовало) дискретная энтропия переменной в этой кодировке. Это равно среднему количеству битов, необходимых для передачи этой информации, и не превышает . Следовательно, это можно рассматривать как количество информации, полученное, зная, что переменная следует распределению , а не равномерно распределена по возможным квантованным значениям, как это было бы в случае, если бы она следовала . на самом деле (отрицательное) расхождение Кульбака – Лейблера от до , которое считается информацией, полученной путем изучения того, что переменная, ранее считавшаяся распределенной, как на самом деле распределяется как .

Формула непрерывной энтропии Джейнса обладает свойством быть инвариантной относительно замены переменных при условии, что и преобразуются таким же образом. (Это мотивирует название «инвариантная мера» для m .) Это решает многие трудности, возникающие при применении формулы непрерывной энтропии Шеннона. Сам Джейнс отказался от этого термина, поскольку он не имел отношения к его работе (максимальное распределение энтропии), и несколько неудобно иметь в расчетах бесконечный член. К сожалению, с этим ничего не поделать, если квантование выполняется произвольно точно, как это было бы в случае непрерывного предела. Обратите внимание, что, как здесь определено (без термина), всегда будет неположительным, потому что расхождение KL всегда будет неотрицательным.

Если это тот случай, который является постоянным на некотором интервале размера и по существу равен нулю за пределами этого интервала, то предельная плотность дискретных точек (LDDP) тесно связана с дифференциальной энтропией

использованная литература

дальнейшее чтение

  • Джейнс, ET (2003). Теория вероятностей: логика науки . Издательство Кембриджского университета. ISBN   978-0521592710 .