Бинарная регрессия - Binary regression

В статистике , особенно в регрессионном анализе , двоичная регрессия оценивает взаимосвязь между одной или несколькими независимыми переменными и одной выходной двоичной переменной . Обычно моделируется вероятность двух альтернатив вместо простого вывода одного значения, как при линейной регрессии .

Бинарная регрессия обычно анализируется как частный случай биномиальной регрессии с одним исходом ( ) и одной из двух альтернатив, рассматриваемых как «успех» и кодируемых как 1: значение представляет собой количество успехов в 1 испытании, либо 0, либо 1. Наиболее распространенными моделями бинарной регрессии являются логит-модель ( логистическая регрессия ) и пробит-модель ( пробит-регрессия ).

Приложения

Двоичная регрессия в основном применяется либо для прогнозирования ( двоичная классификация ), либо для оценки связи между независимыми переменными и выходными данными. В экономике бинарные регрессии используются для моделирования бинарного выбора .

Интерпретации

Модели двоичной регрессии можно интерпретировать как модели со скрытыми переменными вместе с моделью измерения; или как вероятностные модели, непосредственно моделирующие вероятность.

Скрытая переменная модель

Интерпретация скрытых переменных традиционно использовалась в биотестах , что привело к пробит-модели , в которой предполагаются нормальная дисперсия и пороговое значение. Интерпретация скрытых переменных также используется в теории ответа на вопросы (IRT).

Формально интерпретация скрытой переменной утверждает, что результат y связан с вектором независимых переменных x соотношением

где и , β - вектор параметров, а G - распределение вероятностей .

Эта модель может применяться во многих экономических контекстах. Например, результатом может быть решение менеджера, инвестировать ли в программу, - это ожидаемый чистый дисконтированный денежный поток, а x - вектор переменных, которые могут повлиять на денежный поток этой программы. Тогда менеджер будет инвестировать только тогда, когда ожидает, что чистый дисконтированный денежный поток будет положительным.

Часто предполагается , что член ошибки следует нормальному распределению, обусловленному независимыми переменными x . Это генерирует стандартную пробит-модель .

Вероятностная модель

Простейшей прямой вероятностной моделью является логит-модель , которая моделирует логарифмические шансы как линейную функцию объясняющей переменной или переменных. Логит-модель является «самой простой» в смысле обобщенных линейных моделей (GLIM): логарифмические шансы являются естественным параметром для экспоненциального семейства распределения Бернулли, и, следовательно, ее проще всего использовать для вычислений.

Другая прямая вероятностная модель - это линейная вероятностная модель , которая моделирует саму вероятность как линейную функцию объясняющих переменных. Недостатком линейной вероятностной модели является то, что для некоторых значений независимых переменных модель будет предсказывать вероятности меньше нуля или больше единицы.

Смотрите также

Рекомендации

  • Лонг, Дж. Скотт; Фриз, Джереми (2006). «4. Модели для бинарных исходов: 4.1 Статистическая модель» . Модели регрессии для категориальных зависимых переменных с использованием Stata, второе издание . Stata Press. С. 131–136. ISBN   978-1-59718011-5 .