LogSumExp - LogSumExp

LogSumExp (LSE) (также называемый RealSoftMax или многофакторная Softplus ) функция является гладким максимум - это гладкое приближение к максимальной функции, в основном используется машинным обучение алгоритмов. Он определяется как логарифм суммы экспонент аргументов:

Характеристики

Функция LogSumExp домена является , то реальная координатного пространства , и его кообласть это , то реальная линия . Это приближение к максимуму со следующими оценками

Первое неравенство строгое за исключением . Второе неравенство является строгим, если все аргументы не равны. (Доказательство: Пусть . Тогда . Применение логарифма к неравенству дает результат.)

Кроме того, мы можем масштабировать функцию, чтобы сделать границы более жесткими. Рассмотрим функцию . потом

(Доказательство: Заменить каждый с для некоторых в приведенных выше неравенств, чтобы дать

и с тех пор

наконец, деление на дает результат.)

Кроме того, если мы вместо этого умножим на отрицательное число, мы, конечно, найдем сравнение с функцией:

Функция LogSumExp является выпуклой и строго возрастает всюду в своей области определения (но не строго выпуклой везде).

Запись в частные производные являются:

что означает, что градиент LogSumExp является функцией softmax .

Выпуклые сопряженная из LogSumExp является отрицательной энтропией .

трюк log-sum-exp для вычислений в лог-области

Функция LSE часто встречается, когда обычные арифметические вычисления выполняются в логарифмическом масштабе , например, в логарифмической вероятности .

Подобно тому, как операции умножения в линейном масштабе становятся простыми сложениями в логарифмическом масштабе, операция сложения в линейном масштабе становится LSE в логарифмическом масштабе:

Общей целью использования вычислений в лог-области является повышение точности и избежание проблем с переполнением и переполнением, когда очень маленькие или очень большие числа представляются напрямую (т. Е. В линейной области) с использованием чисел с плавающей запятой ограниченной точности.

К сожалению, использование LSE напрямую в этом случае может снова вызвать проблемы переполнения / потери значимости. Следовательно, вместо этого должен использоваться следующий эквивалент (особенно, когда точность приведенного выше приближения «max» недостаточна). Поэтому многие математические библиотеки, такие как IT ++, предоставляют подпрограмму LSE по умолчанию и используют эту формулу для внутренних целей.

куда

Строго выпуклая функция типа log-sum-exp

LSE выпуклый, но не строго выпуклый. Мы можем определить строго выпуклую функцию типа log-sum-exp, добавив дополнительный аргумент, равный нулю:

Эта функция является собственным генератором Брегмана (строго выпуклой и дифференцируемой ). Он встречается в машинном обучении, например, как кумулянт полиномиального / биномиального семейства.

В тропическом анализе это сумма в лог-полукольце .

Смотрите также

использованная литература