Потеря Хубера - Huber loss

В статистике , то потеря Huber является функция потерь используются в прочной регрессии , который менее чувствителен к выбросам в данных , чем квадрате потеря ошибок . Иногда используется вариант классификации.

Определение

Потери Хьюбера (зеленый ) и квадратичные потери ошибок (синий) в зависимости от

Функция потерь Хьюбера описывает штраф, понесенный процедурой оценки f . Хубер (1964) определяет функцию потерь кусочно следующим образом:

Эта функция является квадратичной для малых значений a и линейной для больших значений с равными значениями и наклонами различных участков в двух точках, где . Переменная a часто относится к остаткам, то есть к разнице между наблюдаемыми и прогнозируемыми значениями , поэтому первое может быть расширено до

Мотивация

Два очень часто используемые функции потерь являются квадратом потери , и абсолютная потеря , . Квадраты результатов функции потерь в качестве арифметического среднего - несмещенной оценки , и результаты функции потерь абсолютного значения в срединной -unbiased оценки (в одномерном случае, и геометрическая средний -unbiased оценка для многомерного случая). Квадрат потерь имеет недостаток, заключающийся в том, что в нем преобладают выбросы - при суммировании по набору 's (как в ) на выборочное среднее слишком сильно влияют несколько особенно больших значений, когда распределение имеет тяжелые хвосты. : с точки зрения теории оценивания , асимптотическая относительная эффективность среднего для распределений с тяжелыми хвостами плохая.

Как определено выше, функция потерь Хьюбера сильно выпукла в равномерной окрестности своего минимума ; на границе этой равномерной окрестности функция потерь Хубера имеет дифференцируемое продолжение до аффинной функции в точках и . Эти свойства позволяют сочетать большую часть чувствительности несмещенной по среднему и минимальной дисперсии оценки среднего (с использованием квадратичной функции потерь) и устойчивости несмещенной по медиане оценки (с использованием функции абсолютного значения).

Функция потерь псевдогубера

Функция потерь псевдохубера может использоваться в качестве гладкой аппроксимации функции потерь Хубера. Он сочетает в себе лучшие свойства квадрата потерь L2 и абсолютных потерь L1 , будучи сильно выпуклым при приближении к целевому / минимуму и менее крутым для экстремальных значений. Масштаб, при котором функция потерь псевдохубера переходит от потерь L2 для значений, близких к минимальным, к потерям L1 для экстремальных значений, а крутизна при экстремальных значениях может контролироваться значением. Функция потерь псевдохубера обеспечивает непрерывность производных для всех степеней. Он определяется как

Таким образом, эта функция аппроксимирует для малых значений и аппроксимирует прямую линию с наклоном для больших значений .

Хотя приведенная выше форма является наиболее распространенной, существуют и другие гладкие аппроксимации функции потерь Хубера.

Вариант классификации

В целях классификации иногда используется вариант потери Хубера, называемый модифицированным Хубером . Учитывая прогноз (реальный классификатор) и истинную метку двоичного класса , модифицированная потеря Хубера определяется как

Этот термин представляет собой потерю шарнира, используемую машинами опорных векторов ; квадратично сглажены потери шарнира представляет собой обобщение .

Приложения

Функция потерь Хубера используется в надежной статистике , М-оценке и аддитивном моделировании .

Смотрите также

Рекомендации