Дискретный выбор - Discrete choice

В экономике , дискретные выбор моделях или качественные моделях выбора , описать, объяснить и предсказать выбор между двумя или более дискретными альтернативами, такими как ввод или не входя в рынке труда , или выбора между режимами транспорта . Такой выбор контрастирует со стандартными моделями потребления, в которых предполагается, что количество каждого потребляемого товара является непрерывной переменной . В непрерывном случае методы исчисления (например, условия первого порядка) могут использоваться для определения оптимальной выбранной суммы, а спрос может быть смоделирован эмпирически с использованием регрессионного анализа . С другой стороны, анализ дискретного выбора исследует ситуации, в которых потенциальные результаты дискретны, так что оптимум не характеризуется стандартными условиями первого порядка. Таким образом, вместо изучения «сколько», как в задачах с переменными непрерывного выбора, анализ дискретного выбора исследует «какую именно». Тем не менее, анализ дискретного выбора также может использоваться для проверки выбранного количества, когда необходимо выбрать только несколько отдельных количеств, таких как количество транспортных средств, которое семья выбирает для владения, и количество минут телекоммуникационных услуг, которые клиент решает приобрести. Такие методы, как логистическая регрессия и пробит-регрессия, могут использоваться для эмпирического анализа дискретного выбора.

Модели дискретного выбора теоретически или эмпирически моделируют выбор, сделанный людьми из конечного набора альтернатив. Модели использовались для проверки, например, выбора автомобиля для покупки, места для учебы в колледже, вида транспорта (автомобиль, автобус, поезд) для работы среди множества других приложений. Модели дискретного выбора также используются для изучения выбора организаций, таких как фирмы или правительственные учреждения. В нижеследующем обсуждении предполагается, что единицей, принимающей решения, является человек, хотя эти концепции применимы в более общем плане. Дэниел Макфадден получил Нобелевскую премию в 2000 году за новаторскую работу по разработке теоретических основ дискретного выбора.

Модели дискретного выбора статистически связывают выбор, сделанный каждым человеком, с атрибутами человека и атрибутами альтернатив, доступных этому человеку. Например, выбор автомобиля, который человек покупает, статистически связан с его доходом и возрастом, а также с ценой, топливной экономичностью, размером и другими характеристиками каждого доступного автомобиля. Модели оценивают вероятность того, что человек выберет конкретную альтернативу. Модели часто используются для прогнозирования того, как выбор людей изменится в зависимости от демографических изменений и / или характеристик альтернатив.

Модели дискретного выбора определяют вероятность того, что человек выберет вариант из набора альтернатив. Вероятностное описание дискретного поведения выбора используется не для того, чтобы отражать индивидуальное поведение, которое рассматривается как внутренне вероятностное. Скорее, это недостаток информации, который заставляет нас описывать выбор вероятностным образом. На практике мы не можем знать все факторы, влияющие на индивидуальные решения о выборе, поскольку их детерминанты частично наблюдаются или не полностью измеряются. Таким образом, модели дискретного выбора полагаются на стохастические допущения и спецификации для учета ненаблюдаемых факторов, связанных с: а) альтернативами выбора, б) вариациями вкусов у людей (межличностная неоднородность) и во времени (внутриличностная динамика выбора) и в) неоднородными наборами выбора. . Различные составы обобщены и разделены на группы моделей.

Приложения

  • Маркетологи используют модели дискретного выбора для изучения потребительского спроса и прогнозирования реакции бизнеса со стороны конкурентов, что позволяет разработчикам моделей выбора решать ряд бизнес-задач, таких как ценообразование , разработка продуктов и задачи оценки спроса . В маркетинговых исследованиях это обычно называется совместным анализом .
  • Специалисты по планированию перевозок используют модели дискретного выбора для прогнозирования спроса на запланированные транспортные системы, например, по маршруту, по которому будет следовать водитель и будет ли кто-то пользоваться системами скоростного транспорта . Первые применения моделей дискретного выбора были в планировании перевозок, и большая часть наиболее продвинутых исследований моделей дискретного выбора проводится исследователями транспорта.
  • Специалисты по прогнозам в области энергетики и лица, определяющие политику, используют модели дискретного выбора для выбора домохозяйствами и фирмами системы отопления, уровней эффективности бытовых приборов и уровня топливной эффективности транспортных средств.
  • В экологических исследованиях используются модели дискретного выбора, чтобы изучить выбор рекреаторов, например, места для рыбалки или катания на лыжах, и сделать вывод о ценности удобств, таких как кемпинги, рыбные запасы и утепленные хижины, а также для оценки ценности улучшения качества воды.
  • Экономисты по труду используют модели дискретного выбора для изучения участия в рабочей силе, выбора профессии, а также выбора колледжа и программ обучения.
  • В экологических исследованиях используются модели дискретного выбора для изучения параметров, определяющих выбор среды обитания у животных.

Общие черты моделей дискретного выбора

Модели дискретного выбора имеют множество форм, в том числе: двоичный логит, двоичный пробит, полиномиальный логит, условный логит, полиномиальный пробит, вложенный логит, обобщенные модели экстремальных значений, смешанный логит и разнесенный логит. Все эти модели имеют общие характеристики, описанные ниже.

Набор выбора

Набор выбора - это набор альтернатив, доступных человеку. Для модели дискретного выбора набор выбора должен отвечать трем требованиям:

  1. Набор альтернатив должен быть исчерпывающим , что означает, что набор включает все возможные альтернативы. Это требование подразумевает, что человек обязательно выбирает альтернативу из набора.
  2. Альтернативы должны быть взаимоисключающими , что означает, что выбор одной альтернативы означает отказ от выбора других альтернатив. Это требование подразумевает, что человек выбирает только одну альтернативу из набора.
  3. Набор должен содержать конечное количество альтернатив. Это третье требование отличает анализ дискретного выбора от форм регрессионного анализа, в которых зависимая переменная может (теоретически) принимать бесконечное количество значений.

Например, выбор для человека, решающего, какой вид транспорта выбрать на работу, включает в себя вождение в одиночку, совместное использование автомобилей, поездку на автобусе и т. Д. Набор выбора усложняется тем фактом, что человек может использовать несколько режимов для данной поездки, например, поездка на машине на вокзал, а затем поезд на работу. В этом случае набор выбора может включать каждую возможную комбинацию режимов. В качестве альтернативы выбор может быть определен как выбор «основного» режима с набором, состоящим из автомобиля, автобуса, железной дороги и прочего (например, прогулки, велосипеды и т.д.). Обратите внимание, что альтернатива «другое» включена, чтобы сделать набор выбора исчерпывающим.

У разных людей могут быть разные наборы вариантов, в зависимости от их обстоятельств. Например, автомобиль Scion не продавался в Канаде с 2009 года, поэтому покупатели новых автомобилей в Канаде сталкивались с другими наборами выбора, чем американские потребители. Такие соображения учитываются при формулировании моделей дискретного выбора.

Определение вероятностей выбора

Модель дискретного выбора определяет вероятность того, что человек выберет конкретную альтернативу, с вероятностью, выраженной как функция наблюдаемых переменных, которые относятся к альтернативам и человеку. В общем виде вероятность того, что человек n выберет альтернативу i , выражается как:

где

- вектор атрибутов альтернативы i, с которой столкнулся человек n ,
- вектор атрибутов других альтернатив (кроме i ), с которыми сталкивается человек n ,
- вектор характеристик человека n , а
представляет собой набор параметров, определяющих влияние переменных на вероятности, которые оцениваются статистически.

В приведенном выше примере вида транспорта атрибуты видов транспорта ( x ni ), такие как время в пути и стоимость, и характеристики потребителя ( s n ), такие как годовой доход, возраст и пол, могут использоваться для расчета выбора. вероятности. Атрибуты альтернатив могут различаться у разных людей; например, стоимость и время поездки на работу на машине, автобусе или поезде различны для каждого человека в зависимости от местоположения дома и работы этого человека.

Характеристики:

  • P ni находится между 0 и 1
  • где J - общее количество альтернатив.
  • (Ожидаемая доля людей, выбравших i ), где N - количество людей, сделавших выбор.

Различные модели (т. Е. Модели, использующие другую функцию G) имеют разные свойства. Известные модели представлены ниже.

Потребительская полезность

Модели дискретного выбора могут быть выведены из теории полезности . Этот вывод полезен по трем причинам:

  1. Это придает точный смысл вероятностям P ni
  2. Это мотивирует и отличает альтернативные спецификации модели, например, выбор функциональной формы для G .
  3. Он обеспечивает теоретическую основу для расчета изменений потребительского излишка (компенсирующего отклонения) от изменений атрибутов альтернатив.

U ni - это полезность (или чистая выгода, или благосостояние), которую человек n получает от выбора альтернативы i . Поведение человека направлено на максимизацию полезности: человек n выбирает альтернативу, которая обеспечивает наивысшую полезность. Выбор человека обозначается фиктивными переменными y ni для каждой альтернативы:

Рассмотрим теперь исследователя, исследующего выбор. Выбор человека зависит от многих факторов, некоторые из которых наблюдаются исследователем, а некоторые нет. Полезность, которую человек получает от выбора альтернативы, раскладывается на часть, которая зависит от переменных, которые наблюдает исследователь, и на часть, которая зависит от переменных, которые исследователь не наблюдает. В линейной форме это разложение выражается как

где

  • - вектор наблюдаемых переменных, относящихся к альтернативе i для человека n, который зависит от атрибутов альтернативы x ni , возможно, взаимодействующих с атрибутами человека s n , так что его можно выразить как некоторую числовую функцию z ,
  • - соответствующий вектор коэффициентов наблюдаемых переменных, а
  • фиксирует влияние всех ненаблюдаемых факторов, влияющих на выбор человека.

Тогда вероятность выбора равна

При заданном β вероятность выбора - это вероятность того, что случайные члены ε nj - ε ni (которые случайны с точки зрения исследователя, поскольку исследователь их не наблюдает) ниже соответствующих величин. Различные модели выбора (т. Е. Разные спецификации G ) возникают из-за разных распределений ε ni для всех i и разных трактовок β .

Свойства моделей дискретного выбора, вытекающие из теории полезности

Только различия имеют значение

Вероятность того, что человек выберет конкретную альтернативу, определяется путем сравнения полезности выбора этой альтернативы с полезностью выбора других альтернатив:

Как показывает последний член, вероятность выбора зависит только от разницы в полезности между альтернативами, а не от абсолютного уровня полезности. Точно так же добавление константы к полезностям всех альтернатив не меняет вероятностей выбора.

Масштаб должен быть нормализован

Поскольку у коммунального предприятия нет единиц, необходимо нормализовать масштаб коммунальных услуг. Масштаб полезности часто определяется дисперсией члена ошибки в моделях дискретного выбора. Это расхождение может отличаться в зависимости от характеристик набора данных, например, когда и где данные собираются. Таким образом, нормализация дисперсии влияет на интерпретацию параметров, оцененных в различных наборах данных.

Выдающиеся типы моделей дискретного выбора

Модели с дискретным выбором можно сначала классифицировать по количеству доступных альтернатив.

* Модели биномиального выбора (дихотомические): 2 доступных альтернативы
* Полиномиальные модели выбора ( политомические ): 3 или более доступных альтернатив

Модели полиномиального выбора можно дополнительно классифицировать в соответствии со спецификацией модели:

* Модели, такие как стандартный логит, которые не предполагают корреляции между ненаблюдаемыми факторами и альтернативами.
* Модели, допускающие корреляцию между ненаблюдаемыми факторами среди альтернатив

Кроме того, доступны особые формы моделей для изучения рейтингов альтернатив (например, первый выбор, второй выбор, третий выбор и т. Д.) И данных рейтингов.

Подробная информация о каждой модели представлена ​​в следующих разделах.

Двоичный выбор

A. Логит с атрибутами человека, но без атрибутов альтернатив

U n - это полезность (или чистая выгода), которую человек n получает от совершения действия (в отличие от бездействия). Польза, которую человек получает от совершения действия, зависит от характеристик человека, некоторые из которых наблюдаются исследователем, а некоторые нет. Человек выполняет действие y n = 1 , если U n > 0. Предполагается, что ненаблюдаемый член ε n имеет логистическое распределение . Спецификация кратко написана как:

Б. Пробит с атрибутами человека, но без атрибутов альтернатив

Описание модели такое же, как и у модели A , за исключением того, что ненаблюдаемые термины распределяются стандартным нормальным образом, а не логистическим .

где - кумулятивная функция распределения стандартной нормали .

C. Логит с переменными, которые варьируются в зависимости от альтернативы

U ni - полезность, которую n получает человек от выбора альтернативы i . Полезность каждой альтернативы зависит от атрибутов альтернатив, которые, возможно, взаимодействуют с атрибутами человека. Предполагается, что ненаблюдаемые члены имеют распределение экстремальных значений .

Мы можем связать эту спецификацию с моделью A выше, которая также является двоичным логитом. В частности, P n 1 можно также выразить как

Обратите внимание , что если два термина об ошибках IID экстремального значения , их разность распределяются логистическим , которая является основой для эквивалентности два спецификаций.

D. Пробит с переменными, которые изменяются по альтернативам

Описание модели такое же, как и у модели C , за исключением того, что разница между двумя ненаблюдаемыми терминами распределяется стандартным нормальным, а не логистическим методом .

Тогда вероятность совершения действия равна

где Φ - кумулятивная функция распределения стандартной нормали .

Мультиномиальный выбор без корреляции между альтернативами

E. Логит с атрибутами человека, но без атрибутов альтернатив

Полезность для всех альтернатив зависит от одних и тех же переменных s n , но коэффициенты для разных альтернатив различны:

  • U ni = β i s n + ε ni ,
  • Поскольку имеют значение только различия в полезности, необходимо нормализовать для одной альтернативы. Предполагая ,
  • ε ni - iid крайнее значение

Вероятность выбора принимает вид

где J - общее количество альтернатив.

F. Логит с переменными, которые изменяются в зависимости от альтернативы (также называемый условным логитом)

Полезность для каждой альтернативы зависит от атрибутов этой альтернативы, возможно, взаимодействующих с атрибутами человека:

где J - общее количество альтернатив.

Обратите внимание, что модель E может быть выражена в той же форме, что и модель F, путем соответствующей повторной спецификации переменных. Определить , где это Кронекера и ев п взяты из модели E . Тогда модель F получается с использованием

где J - общее количество альтернатив.

Мультиномиальный выбор с корреляцией между альтернативами

Стандартная логит-модель не всегда подходит, поскольку предполагает отсутствие корреляции между ненаблюдаемыми факторами и альтернативами. Это отсутствие корреляции приводит к особой схеме замещения альтернатив, которая не всегда может быть реалистичной в данной ситуации. Этот образец подстановки часто называют свойством независимости нерелевантных альтернатив (IIA) стандартных логит-моделей. См. Пример « Красная шина / синяя шина», в котором этот шаблон не работает, или пример выбора пути. Был предложен ряд моделей, позволяющих корреляцию между альтернативами и более общими паттернами замещения:

  • Вложенная логит-модель - фиксирует корреляции между альтернативами путем разделения набора вариантов на «гнезда»
    • Кросс-вложенная модель логита (CNL) - альтернативы могут принадлежать более чем одному гнезду
    • Модель C-logit - фиксирует корреляции между альтернативами с использованием «фактора общности».
    • Парная комбинаторная логит-модель - подходит для задач выбора маршрута.
  • Generalized Extreme Value Model - Общий класс модели, производный от случайной полезной модели, к которой принадлежат полиномиальный логит и вложенный логит.
  • Условный пробит - допускает полную ковариацию между альтернативами с использованием совместного нормального распределения.
  • Смешанный логит - допускает любую форму корреляции и шаблонов замещения. Когда смешанный логит представляет собой совместно нормальные случайные члены, модели иногда называют «полиномиальной пробит-моделью с логит-ядром». Может применяться при выборе маршрута.

В следующих разделах подробно описаны модели вложенного логита, GEV, пробита и смешанного логита.

G. Вложенные логит-модели и модели обобщенных экстремальных значений (GEV)

Модель такая же, как и модель F, за исключением того, что ненаблюдаемый компонент полезности коррелирует по альтернативам, а не является независимым по отношению к альтернативам.

H. Полиномиальный пробит

Модель такая же, как и модель G, за исключением того, что ненаблюдаемые термины распределены совместно нормально , что допускает любую модель корреляции и гетероскедастичности :

где - совместная нормальная плотность с нулевым средним и ковариацией .

Интеграл для этой вероятности выбора не имеет замкнутой формы, поэтому вероятность аппроксимируется квадратурой или моделированием .

Когда это единичная матрица (такая, что нет корреляции или гетероскедастичности ), модель называется независимым пробитом.

I. Смешанный логит

Смешанные модели Logit становятся все более популярными в последние годы по нескольким причинам. Во-первых, модель позволяет быть случайным в дополнение к . Случайность приспосабливает случайные вкусовые вариации у людей и корреляцию между альтернативами, что порождает гибкие шаблоны замены. Во-вторых, успехи в моделировании сделали аппроксимацию модели довольно простой. Кроме того, Макфадден и Трейн показали, что любая модель истинного выбора может быть аппроксимирована с любой степенью точности смешанным логитом с соответствующей спецификацией объясняющих переменных и распределением коэффициентов.

  • U ni = βz ni + ε ni ,
  • для любого распределения , где - набор параметров распределения (например, среднее значение и дисперсия), которые необходимо оценить,
  • ε ni iid экстремальное значение ,

Вероятность выбора равна

где

является логит вероятности оценивается в с общим количеством альтернатив.

Интеграл для этой вероятности выбора не имеет замкнутой формы, поэтому вероятность аппроксимируется путем моделирования.

Оценка по выбору

Модели дискретного выбора часто оцениваются с использованием оценки максимального правдоподобия . Логит-модели можно оценить с помощью логистической регрессии , а пробит-модели можно оценить с помощью пробит-регрессии . Были предложены непараметрические методы, такие как оценка максимального балла . Оценка таких моделей обычно выполняется с помощью параметрических, полупараметрических и непараметрических методов максимального правдоподобия, но также может выполняться с использованием подхода моделирования траекторий методом частичных наименьших квадратов .

Оценка из рейтингов

Во многих ситуациях учитывается рейтинг альтернатив человека, а не только его избранная альтернатива. Например, человека, который купил новую машину, могут спросить, что он / она купил бы, если бы эту машину не предложили, что дает информацию о втором выборе этого человека в дополнение к его первому выбору. Или в опросе респондента могут спросить:

Пример . Оцените следующие планы телефонной связи с сотового телефона от наиболее предпочтительных к наименее предпочтительным.
* 60 долларов США в месяц за неограниченное количество минут в любое время, двухлетний контракт с оплатой за досрочное расторжение в размере 100 долларов США.
* 30 долларов в месяц за 400 минут в любое время, 3 цента за минуту после 400 минут, годовой контракт с платой за досрочное расторжение в 125 долларов
* 35 долларов в месяц за 500 минут в любое время, 3 цента за минуту после 500 минут, без контракта или платы за досрочное расторжение
* 50 долларов в месяц за 1000 минут в любое время, 5 центов за минуту после 1000 минут, двухлетний контракт с оплатой за досрочное расторжение в 75 долларов.

Описанные выше модели могут быть адаптированы для учета рейтингов, выходящих за рамки первого выбора. Самая известная модель рейтинговых данных - это расширенный логит и его смешанная версия.

J. Взорванный логит

При тех же предположениях, что и для стандартного логита ( модель F ), вероятность ранжирования альтернатив является продуктом стандартных логитов. Модель называется «разнесенным логитом», потому что ситуация выбора, которая обычно представлена ​​как одна логит-формула для выбранной альтернативы, расширена («разнесена»), чтобы иметь отдельную формулу логита для каждой ранжированной альтернативы. Разнесенная логит-модель является продуктом стандартных логит-моделей с уменьшающимся набором вариантов по мере ранжирования каждой альтернативы и оставляет набор доступных вариантов для последующего выбора.

Без потери общности, альтернативы могут быть переименованы для представления ранжирования человека, так что альтернатива 1 является первым выбором, 2 - вторым выбором и т. Д. Вероятность выбора ранжирования альтернатив J как 1, 2, ..., J равна тогда

Как и в случае стандартного логита, модель разнесенного логита не предполагает корреляции между ненаблюдаемыми факторами и альтернативами. Разобранный логит может быть обобщен так же, как стандартный логит, чтобы учесть корреляции между альтернативами и случайными вариациями вкусов. Модель «смешанного разнесенного логита» получается путем вероятности ранжирования, приведенного выше, для L ni в модели смешанного логита ( модель I ).

Эта модель также известна в эконометрике как модель рангового упорядоченного логита и была введена в этой области Беггсом, Карделлом и Хаусманом в 1981 году. Одним из приложений является Combes et al. документ, объясняющий рейтинг кандидатов на звание профессора. В биомедицинской литературе она также известна как модель Плакетта – Люса .

Заказанные модели

В опросах респондентов часто просят дать оценки, например:

Пример : дайте, пожалуйста, свою оценку того, как дела у президента.
1: Очень плохо
2: Плохо
3: Хорошо
4: Хорошо
5: Очень хорошо

Или же,

Пример . По шкале от 1 до 5, где 1 означает полностью не согласен, а 5 означает полностью согласен, насколько вы согласны со следующим утверждением. «Федеральное правительство должно делать больше, чтобы помочь людям, столкнувшимся с лишением права выкупа права выкупа».

Полиномиальная модель дискретного выбора может исследовать ответы на эти вопросы ( модель G , модель H , модель I ). Однако эти модели основаны на концепции, согласно которой респондент получает некоторую полезность для каждого возможного ответа и дает ответ, обеспечивающий наибольшую полезность. Было бы более естественно думать, что у респондента есть некая скрытая мера или индекс, связанный с вопросом и ответами на то, насколько высока эта мера. Упорядоченные логит-модели и упорядоченные пробит-модели выводятся в рамках этой концепции.

К. Заказал логит

Пусть U n представляет силу чувств или мнения респондента n по предмету опроса. Предположим, что есть ограничения по уровню мнения при выборе того или иного ответа. Например, в примере помощи людям, столкнувшимся с потерей права выкупа, человек выбирает

  • 1, если U n <a
  • 2, если a < U n <b
  • 3, если b < U n <c
  • 4, если c < U n <d
  • 5, если U n > d,

для некоторых действительных чисел a , b , c , d .

Если определить логистику , то вероятность каждого возможного ответа равна:

Параметрами модели являются коэффициенты β и точки отсечения a - d , одна из которых должна быть нормирована для идентификации. Когда есть только два возможных ответа, упорядоченный логит такой же, как двоичный логит ( модель A ), с одной точкой отсечки, нормализованной к нулю.

L. Заказал пробит

Описание модели такое же, как и у модели K , за исключением того, что ненаблюдаемые члены имеют нормальное распределение вместо логистического .

Вероятности выбора ( - интегральная функция стандартного нормального распределения):

Смотрите также

Заметки

Рекомендации

дальнейшее чтение

  • Андерсон, С., А. де Пальма и Ж.-Ф. Thisse (1992), Теория дискретного выбора дифференциации продуктов , MIT Press,
  • Бен-Акива, М .; Лерман, С. (1985). Анализ дискретного выбора: теория и применение к спросу на поездки . MIT Press.
  • Грин, Уильям Х. (2012). Эконометрический анализ (седьмое изд.). Река Аппер Сэдл: Пирсон Прентис-Холл. стр.  770 -862. ISBN   978-0-13-600383-0 .
  • Hensher, D .; Rose, J .; Грин, В. (2005). Прикладной анализ выбора: учебник . Издательство Кембриджского университета.
  • Маддала, Г. (1983). Ограниченно-зависимые и качественные переменные в эконометрике . Издательство Кембриджского университета.
  • Макфадден, Дэниел Л. (1984). Эконометрический анализ качественных моделей отклика . Справочник по эконометрике, Том II. Глава 24. Elsevier Science Publishers BV.
  • Поезд, К. (2009) [2003]. Методы дискретного выбора с моделированием . Издательство Кембриджского университета.