LogSumExp (LSE) (также называемый RealSoftMax или многофакторная Softplus ) функция является гладким максимум - это гладкое приближение к максимальной функции, в основном используется машинным обучение алгоритмов. Он определяется как логарифм суммы экспонент аргументов:
Характеристики
Функция LogSumExp домена является , то реальная координатного пространства , и его кообласть это , то реальная линия . Это приближение к максимуму со следующими оценками
Первое неравенство строгое за исключением . Второе неравенство является строгим, если все аргументы не равны. (Доказательство: Пусть . Тогда . Применение логарифма к неравенству дает результат.)
Кроме того, мы можем масштабировать функцию, чтобы сделать границы более жесткими. Рассмотрим функцию . потом
(Доказательство: Заменить каждый с для некоторых в приведенных выше неравенств, чтобы дать
и с тех пор
наконец, деление на дает результат.)
Кроме того, если мы вместо этого умножим на отрицательное число, мы, конечно, найдем сравнение с функцией:
Функция LogSumExp является выпуклой и строго возрастает всюду в своей области определения (но не строго выпуклой везде).
Запись в частные производные являются:
что означает, что градиент LogSumExp является функцией softmax .
Выпуклые сопряженная из LogSumExp является отрицательной энтропией .
трюк log-sum-exp для вычислений в лог-области
Функция LSE часто встречается, когда обычные арифметические вычисления выполняются в логарифмическом масштабе , например, в логарифмической вероятности .
Подобно тому, как операции умножения в линейном масштабе становятся простыми сложениями в логарифмическом масштабе, операция сложения в линейном масштабе становится LSE в логарифмическом масштабе:
Общей целью использования вычислений в лог-области является повышение точности и избежание проблем с переполнением и переполнением, когда очень маленькие или очень большие числа представляются напрямую (т. Е. В линейной области) с использованием чисел с плавающей запятой ограниченной точности.
К сожалению, использование LSE напрямую в этом случае может снова вызвать проблемы переполнения / потери значимости. Следовательно, вместо этого должен использоваться следующий эквивалент (особенно, когда точность приведенного выше приближения «max» недостаточна). Поэтому многие математические библиотеки, такие как IT ++, предоставляют подпрограмму LSE по умолчанию и используют эту формулу для внутренних целей.
куда
Строго выпуклая функция типа log-sum-exp
LSE выпуклый, но не строго выпуклый. Мы можем определить строго выпуклую функцию типа log-sum-exp, добавив дополнительный аргумент, равный нулю:
Эта функция является собственным генератором Брегмана (строго выпуклой и дифференцируемой ). Он встречается в машинном обучении, например, как кумулянт полиномиального / биномиального семейства.
В тропическом анализе это сумма в лог-полукольце .
Смотрите также
использованная литература