Маржа (машинное обучение) - Margin (machine learning)

H 1 не разделяет классы.
H 2 делает, но только с небольшим запасом.
H 3 разделяет их с максимальным запасом.

В машине обучения в запас одной точки данных определяется как расстояние от точки данных на границе решения . Обратите внимание, что существует множество расстояний и границ принятия решений, которые могут подходить для определенных наборов данных и целей. Маржа классификатор представляет собой классификатор , который явно использует запас каждого примера во время обучения в классификаторе. Существуют теоретические обоснования (основанные на измерении VC ) того, почему максимизация маржи (при некоторых подходящих ограничениях) может быть полезной для алгоритмов машинного обучения и статистических выводов.

Есть много гиперплоскостей, которые могут классифицировать данные. Один разумный выбор в качестве лучшей гиперплоскости - это та, которая представляет наибольшее разделение или разницу между двумя классами. Поэтому мы выбираем гиперплоскость так, чтобы расстояние от нее до ближайшей точки данных с каждой стороны было максимальным. Если такая гиперплоскость существует, она называется гиперплоскостью с максимальным запасом, а линейный классификатор, который она определяет, известен как классификатор с максимальным запасом ; или, что то же самое, перцептрон оптимальной устойчивости.