Выбор моделирования - Choice modelling

Моделирование выбора пытается смоделировать процесс принятия решения индивидуумом или сегментом через выявленные предпочтения или заявленные предпочтения, сделанные в конкретном контексте или контекстах. Как правило, он пытается использовать дискретный выбор (A вместо B; B вместо A, B и C), чтобы вывести позиции элементов (A, B и C) в некоторой релевантной скрытой шкале (обычно « полезность » в экономике и различных связанные поля). На самом деле существует множество альтернативных моделей в эконометрике , маркетинге , социометрии и других областях, включая максимизацию полезности , оптимизацию, применяемую к теории потребителей , и множество других стратегий идентификации, которые могут быть более или менее точными в зависимости от данных , выборки , гипотезы и конкретного решение моделируется. Кроме того, моделирование выбора считается наиболее подходящим методом для оценки готовности потребителей платить за повышение качества во многих аспектах.

Связанные термины

Есть ряд терминов, которые считаются синонимами термина «моделирование выбора». Некоторые из них точны (хотя обычно для конкретной дисциплины или континента), а некоторые используются в отраслевых приложениях, хотя в научных кругах считаются неточными (например, совместный анализ).

К ним относятся следующие:

Моделирование дискретного выбора заявленных предпочтений
Дискретный выбор
Выбор эксперимента
Заявленные исследования предпочтений
Совместный анализ
Контролируемые эксперименты

Хотя разногласия в терминологии сохраняются, примечательно, что академический журнал, предназначенный для обеспечения междисциплинарного источника новых и эмпирических исследований в этой области, называется Journal of Choice Modeling.

Теоретические основы

Теория моделирования выбора была разработана независимо экономистами и математическими психологами. Истоки моделирования выбора можно проследить до исследования Тёрстоуна пищевых предпочтений в 1920-х годах и теории случайной полезности . В экономике теория случайной полезности была развита Дэниелом Макфадденом, а в математической психологии - прежде всего Дунканом Люсом и Энтони Марли. По сути, моделирование выбора предполагает, что полезность (выгода или ценность), которую человек получает от элемента A по сравнению с элементом B, является функцией частоты, с которой он (-а) выбирает элемент A вместо элемента B при повторных выборах. Из-за того, что Терстон использовал нормальное распределение, он не смог обобщить этот бинарный выбор в рамках полиномиального выбора (который требовал полиномиальной логистической регрессии, а не функции пробит-связи), поэтому этот метод не использовался более 30 лет. Однако в 1960–1980-х годах этот метод был аксиоматизирован и применен в самых разных исследованиях.

Различие между выявленными и заявленными исследованиями предпочтений

Моделирование выбора используется как в исследованиях выявленных предпочтений (RP), так и в исследованиях заявленных предпочтений (SP). Исследования RP используют выбор, уже сделанный отдельными людьми, для оценки ценности, которую они приписывают предметам - они «раскрывают свои предпочтения - и, следовательно, ценности (полезности) - своим выбором». Исследования SP используют выбор, сделанный людьми, сделанными в экспериментальных условиях, для оценки этих значений - они «заявляют о своих предпочтениях через свой выбор». Макфадден успешно использовал выявленные предпочтения (сделанные в предыдущих транспортных исследованиях), чтобы спрогнозировать спрос на быстрый транзит в районе залива (BART) до его строительства. Люс и Марли ранее аксиоматизировали теорию случайной полезности, но не использовали ее в реальных приложениях; кроме того, они потратили много лет на тестирование метода в исследованиях SP с участием студентов-психологов.

История

Работа Макфаддена принесла ему Нобелевскую премию по экономическим наукам в 2000 году. Однако большая часть работы по моделированию выбора в течение почти 20 лет проводилась в области заявленных предпочтений. Такая работа возникла в различных дисциплинах, первоначально в сфере транспорта и маркетинга, из-за необходимости прогнозировать спрос на новые продукты, производство которых было потенциально дорогостоящим. Эта работа в значительной степени опиралась на области совместного анализа и планирования экспериментов , чтобы:

Представлять потребителям товары или услуги, которые определялись конкретными характеристиками (атрибутами), имеющими уровни, например, «цена» с уровнями «10, 20, 30 долларов»; «последующее обслуживание» с уровнями «без гарантии, гарантия 10 лет»;
Представьте конфигурации этих товаров, которые минимизировали количество вариантов выбора, необходимых для оценки функции полезности потребителя (правило принятия решения).

В частности, цель состояла в том, чтобы представить минимальное количество пар / троек и т. Д. (Например) мобильных / сотовых телефонов, чтобы аналитик мог оценить ценность, полученную потребителем (в денежных единицах) от всех возможных характеристик телефона. В отличие от большей части работы по совместному анализу, необходимо было делать дискретные выборы (A против B; B против A, B и C), а не рейтинги по шкалам рейтингов категорий ( шкалы Лайкерта ). Дэвид Хеншер и Джордан Лувьер широко известны как первые заявленные модели выбора предпочтений. Они оставались ключевыми фигурами вместе с другими, в том числе Жоффре Свайтом и Моше Бен-Акива, и в течение следующих трех десятилетий в области транспорта и маркетинга помогли разработать и распространить методы. Однако многие другие деятели, в основном занимающиеся транспортной экономикой и маркетингом, внесли свой вклад в теорию и практику и помогли широко распространить результаты работы.

Связь с совместным анализом

Моделирование выбора с самого начала страдало из-за отсутствия стандартизации терминологии, и для его описания использовались все приведенные выше термины. Однако наибольшее разногласие оказалось географическим: в Северной и Южной Америке, в соответствии с отраслевой практикой, стал преобладать термин «совместный анализ на основе выбора». Это отражало желание, чтобы моделирование выбора (1) отражало структуру атрибутов и уровней, унаследованную от совместного анализа, но (2) показывало, что дискретный выбор, а не числовые рейтинги, использовался в качестве показателя результата, полученного от потребителей. В других странах мира термин эксперимент с дискретным выбором стал доминировать практически во всех дисциплинах. Лувьер (маркетинг и транспорт) и его коллеги по экономике окружающей среды и здравоохранения отвергли американскую терминологию, заявив, что она вводит в заблуждение и скрывает фундаментальное отличие экспериментов с дискретным выбором от традиционных совместных методов: эксперименты с дискретным выбором имеют проверяемую теорию человеческого решения. создание их основы (теория случайной полезности), в то время как совместные методы - это просто способ разложения ценности блага с использованием статистических моделей числовых оценок, которые не имеют психологической теории, объясняющей, что означают числа шкалы оценок.

Разработка модели выбора

Разработка модели выбора или эксперимента с дискретным выбором (DCE) обычно состоит из следующих шагов:

Определение товара или услуги, которые нужно оценить;
Принятие решения о том, какие атрибуты и уровни полностью описывают товар или услугу;
Создание экспериментального дизайна , соответствующего этим атрибутам и уровням, либо из каталога проектов, либо с помощью программного обеспечения;
Построение опроса, замена кодов (цифр) дизайна соответствующими уровнями атрибутов;
Проведение опроса среди выборки респондентов в любом из множества форматов, включая бумагу и ручку, но все чаще через веб-опросы;
Анализ данных с использованием соответствующих моделей, часто начиная с модели полиномиальной логистической регрессии , учитывая ее привлекательные свойства с точки зрения соответствия теории экономического спроса.

Определение товара или услуги, которые нужно оценить

Часто это самая простая задача, обычно определяемая:

исследовательский вопрос в академическом исследовании, или
потребности клиента (в контексте потребительского товара или услуги)

Принятие решения о том, какие атрибуты и уровни полностью описывают товар или услугу

Товар или услуга, например мобильный (сотовый) телефон, обычно описывается рядом атрибутов (функций). Телефоны часто описываются по форме, размеру, памяти, марке и т. Д. В DCE должны быть изменены все атрибуты, которые интересны респондентам. Отсутствие ключевых атрибутов обычно заставляет респондентов делать выводы (предположения) о тех, которые отсутствуют в АКД, что приводит к проблемам с пропущенными переменными. Уровни, как правило, должны включать все доступные в настоящее время, и часто расширяются, чтобы включить те, которые возможны в будущем - это особенно полезно при разработке продукта.

Создание экспериментального плана, подходящего для этих атрибутов и уровней, либо из каталога проектов, либо с помощью программного обеспечения.

Сильная сторона DCE и объединенного анализа состоит в том, что они обычно представляют собой подмножество полного факториала. Например, телефон двух марок, трех форм, трех размеров и четырех объемов памяти имеет 2x3x3x4 = 72 возможных конфигурации. Это полный факториал, и в большинстве случаев он слишком велик для использования респондентами. Подмножества полного факториала могут быть получены различными способами, но в целом они имеют следующую цель: дать возможность оценить определенное ограниченное количество параметров, описывающих товар: основные эффекты (например, ценность, связанная с брендом, удерживая все остальное. равно), двусторонние взаимодействия (например, ценность, связанная с этой торговой маркой и наименьшим размером, этой торговой маркой и наименьшим размером) и т. д. Обычно это достигается путем намеренного смешения взаимодействий более высокого порядка с взаимодействиями более низкого порядка. Например, двухстороннее и трехстороннее взаимодействие можно спутать с основными эффектами. Это имеет следующие последствия:

Количество профилей (конфигураций) значительно сокращено;
Коэффициент регрессии для данного главного эффекта несмещен тогда и только тогда, когда смешанные члены (взаимодействия более высокого порядка) равны нулю;
Коэффициент регрессии смещен в неизвестном направлении и с неизвестной величиной, если смешанные члены взаимодействия не равны нулю;
Если смешанные члены не равны нулю, в анализ нельзя внести поправки для решения проблемы.

Таким образом, исследователей неоднократно предупреждали, что дизайн включает критические решения, которые должны быть приняты относительно того, будут ли двусторонние взаимодействия и взаимодействия более высокого порядка отличаться от нуля; ошибка на этапе проектирования фактически делает недействительными результаты, поскольку гипотеза о ненулевых взаимодействиях более высокого порядка не подлежит проверке.

Дизайны доступны из каталогов и статистических программ. Традиционно они обладали свойством ортогональности, когда все уровни атрибутов можно было оценивать независимо друг от друга. Это обеспечивает нулевую коллинеарность и может быть объяснено на следующем примере.

Представьте себе автосалон, который продает как роскошные автомобили, так и подержанные недорогие автомобили. Используя принцип максимизации полезности и допуская модель MNL, мы выдвигаем гипотезу о том, что решение купить автомобиль в этом представительстве является суммой индивидуального вклада каждого из следующих факторов в общую полезность.

Цена
Marque (BMW, Chrysler, Mitsubishi)
Происхождение (немецкий, американский)
Спектакль

Однако использование полиномиальной регрессии для данных о продажах не даст нам того, что мы хотим знать. Причина в том, что большая часть данных коллинеарна, поскольку автомобили в этом представительстве либо:

высокопроизводительные, дорогие немецкие автомобили
низкие характеристики, дешевые американские автомобили

Недостаточно информации и никогда не будет ее, чтобы сказать нам, покупают ли люди автомобили потому, что они европейские, потому что они BMW или потому что они высокопроизводительные. Это основная причина того, почему данные RP часто не подходят и почему требуются данные SP. В данных RP эти три атрибута всегда встречаются вместе и в этом случае идеально коррелируют . То есть: все BMW сделаны в Германии и обладают высокими характеристиками. Эти три атрибута: происхождение, марка и характеристики считаются коллинеарными или неортогональными. Только в экспериментальных условиях, с помощью данных SP, производительность и цена могут изменяться независимо - их эффекты разлагаются.

Схема эксперимента (см. Ниже) в эксперименте с выбором - это строгая схема для контроля и представления гипотетических сценариев или наборов выбора респондентам. Для одного и того же эксперимента можно использовать разные конструкции, каждый с разными свойствами. Наилучший дизайн зависит от целей упражнения.

Именно экспериментальный план определяет эксперимент и максимальные возможности модели. В открытом доступе существует множество очень эффективных проектов, которые позволяют проводить эксперименты, близкие к оптимальным.

Например, план « Латинский квадрат 16 ^17» позволяет оценить все основные эффекты продукта, который может иметь до 16 ¹⁷ (примерно 295 с восемнадцатью нулями) конфигураций. Более того, этого можно было достичь в рамках выборки, состоящей всего из 256 респондентов.

Ниже приведен пример гораздо меньшего размера. Это 3 ⁴ основных эффекта дизайна.

0	0	0	0
0	1	1	2
0	2	2	1
1	0	1	1
1	1	2	0
1	2	0	2
2	0	2	2
2	1	0	1
2	2	1	0

Этот план позволит оценить полезности основных эффектов из 81 (3 ⁴ ) возможных конфигураций продукта, предполагая, что все взаимодействия более высокого порядка равны нулю . Выборка из примерно 20 респондентов могла бы смоделировать основные эффекты всех 81 возможных конфигураций продукта со статистически значимыми результатами.

Некоторые примеры других часто используемых экспериментальных схем:

Сбалансированные неполные блочные конструкции (БИБД)
Случайные конструкции
Основные эффекты
Дизайн взаимодействия высшего порядка
Полный факториал

Совсем недавно были созданы эффективные конструкции. Они обычно минимизируют функции дисперсии (неизвестных, но оцененных) параметров. Общей функцией является D-эффективность параметров. Цель этих планов - уменьшить размер выборки, необходимый для достижения статистической значимости оцененных параметров полезности. Такие планы часто включают байесовские априорные значения для параметров для дальнейшего повышения статистической точности. Высокоэффективные конструкции стали чрезвычайно популярными, учитывая затраты на набор большего числа респондентов. Однако ключевые фигуры в разработке этих конструкций предупредили о возможных ограничениях, в первую очередь о следующих. Эффективность дизайна обычно максимальна, когда товар A и товар B настолько различаются, насколько это возможно: например, каждый атрибут (функция), определяющий телефон, различается в A и B. Это заставляет респондента торговать по цене, бренду, размеру, памяти и т. Д .; ни один из атрибутов не имеет одинакового уровня в A и B. Это может наложить когнитивную нагрузку на респондента, заставляя его / ее использовать упрощающую эвристику («всегда выбирать самый дешевый телефон»), которая не отражает его истинную функцию полезности (решение правило). Недавние эмпирические исследования подтвердили, что респонденты действительно имеют разные правила принятия решений при ответе на менее эффективный дизайн по сравнению с высокоэффективным.

Более подробную информацию об экспериментальных проектах можно найти здесь . Однако стоит повторить, что небольшие планы, которые оценивают основные эффекты, обычно делают это, сознательно смешивая взаимодействия более высокого порядка с основными эффектами. Это означает, что, если на практике эти взаимодействия не равны нулю, аналитик получит необъективные оценки основных эффектов. Более того, у него нет (1) возможности проверить это, и (2) нет способа исправить это в анализе. Это подчеркивает решающую роль дизайна в DCE.

Построение опроса

Построение опроса обычно включает:

Выполнение операции «найти и заменить» для того, чтобы коды экспериментального дизайна (обычно числа, указанные в приведенном выше примере) были заменены уровнями атрибутов рассматриваемого товара.
Внесение полученных конфигураций (например, типов мобильных / сотовых телефонов) в более широкий опрос, который может включать вопросы, относящиеся к социально-демографическим характеристикам респондентов. Это может помочь сегментировать данные на этапе анализа: например, мужчины могут отличаться от женщин по своим предпочтениям.

Проведение опроса среди выборки респондентов в любом из множества форматов, включая бумагу и ручку, но все чаще через интернет-опросы

Традиционно DCE проводились с помощью бумажных и ручных методов. С мощью Интернета интернет-опросы все чаще становятся нормой. Они имеют преимущества с точки зрения стоимости, рандомизации респондентов для различных версий опроса и использования скрининга. Примером последнего может быть достижение гендерного баланса: если ответило слишком много мужчин, их можно отсеять, чтобы количество женщин соответствовало количеству мужчин.

Анализ данных с использованием соответствующих моделей, часто начиная с модели полиномиальной логистической регрессии , учитывая ее привлекательные свойства с точки зрения соответствия теории экономического спроса

Анализ данных из АКД требует от аналитика принятия определенного типа правила принятия решений - или функциональной формы уравнения полезности, выражаясь экономистами. Обычно это продиктовано дизайном: если был использован дизайн с основными эффектами, то в модель нельзя включить условия двустороннего взаимодействия и взаимодействия более высокого порядка. Затем обычно оцениваются модели регрессии. Они часто начинаются с модели условного логита - традиционно, хотя и немного вводящей в заблуждение, разработчики моделей выбора называют полиномиальной логистической (MNL) моделью регрессии. Модель MNL преобразует наблюдаемые частоты выбора (являющиеся оценками вероятностей по шкале отношений) в оценки полезности (по шкале интервалов) с помощью логистической функции. Полезность (значение), связанная с каждым уровнем атрибута, может быть оценена, что позволяет аналитику построить общую полезность любой возможной конфигурации (в данном случае автомобиля или телефона). Однако в качестве альтернативы можно использовать DCE для оценки нерыночных экологических выгод и затрат.

Сильные стороны

Заставляет респондентов искать компромисс между атрибутами;
Делает систему координат явной для респондентов посредством включения массива атрибутов и альтернативных продуктов;
Позволяет оценивать неявные цены для атрибутов;
Позволяет оценить воздействие на благосостояние для нескольких сценариев;
Может использоваться для оценки уровня потребительского спроса на альтернативный «сервисный продукт» в неденежном выражении; и
Потенциально снижает мотивацию респондентов к стратегическому поведению.

Слабые стороны

Дискретный выбор предоставляет только порядковые данные , которые предоставляют меньше информации, чем данные о соотношении или интервале;
Выводы из порядковых данных для получения оценок по шкале интервалов / соотношений требуют допущений о распределении ошибок и правила принятия решения респондентом (функциональная форма функции полезности);
Дробные факторные планы, используемые на практике, намеренно смешивают двусторонние взаимодействия и взаимодействия более высокого порядка с оценками более низкого порядка (обычно главными эффектами), чтобы сделать план небольшим: если взаимодействия более высокого порядка не равны нулю, то основные эффекты смещены, без каких-либо причин. чтобы аналитик знал или исправлял это постфактум;
Невероятностное (детерминированное) принятие решения отдельным лицом нарушает теорию случайной полезности: в рамках модели случайной полезности оценки полезности становятся бесконечными.
У всех моделей с ограниченными зависимыми переменными, таких как логит- и пробит-модели, есть одна фундаментальная слабость: средние (истинные позиции) и дисперсии на скрытой шкале полностью смешаны . Другими словами, их нельзя разделить.

Путаница средней дисперсии

Ячев и Грилихес впервые доказали, что средние и дисперсии смешиваются в моделях с ограниченными зависимыми переменными (где зависимая переменная принимает любое из дискретного набора значений, а не непрерывного, как в традиционной линейной регрессии). Это ограничение становится острым при моделировании выбора по следующей причине: большая оценочная бета из регрессионной модели MNL или любой другой модели выбора может означать:

Респонденты ставят вопрос высоко на скрытой шкале (они высоко ценят его) или
Респонденты не ставят этот вопрос высоко на шкале, НО они очень уверены в своих предпочтениях, последовательно (часто) предпочитая этот элемент другим, представленным рядом, или
Некоторая комбинация (1) и (2).

Это имеет важные последствия для интерпретации результатов регрессионной модели. Все статистические программы «решают» проблему среднего отклонения, устанавливая дисперсию равной константе; все оцененные бета-коэффициенты фактически являются оценкой бета, умноженной на оцененную лямбду (обратная функция дисперсии). Это соблазняет аналитика игнорировать проблему. Однако он должен учитывать, отражает ли набор больших бета-коэффициентов сильные предпочтения (большая истинная бета) или последовательность в выборе (большая истинная лямбда), или некоторая комбинация этих двух. Разделение всех оценок друг на друга - обычно на оценку переменной цены - устраняет смешанный лямбда-член из числителя и знаменателя. Это решает проблему с дополнительным преимуществом, которое дает экономистам готовность респондента платить за каждый уровень атрибута. Однако вывод о том, что результаты, оцениваемые по «полезной площади», не совпадают с оценками по «готовности платить за площадь», предполагает, что проблема искажения не решается этим «трюком»: отклонения могут быть специфическими для атрибута или какой-либо другой функцией переменные (которые могли бы объяснить расхождение). Это предмет текущих исследований в данной области.

По сравнению с традиционными объединенными методами, основанными на рейтингах

Основные проблемы с оценочными вопросами, которые не возникают в моделях выбора:

нет информации о компромиссах. Риск, связанный с рейтингами, заключается в том, что респонденты склонны не различать воспринимаемые «хорошие» атрибуты и оценивать их все как привлекательные.
вариант личных весов. Разные люди по-разному оценивают «2» по шкале от 1 до 5. Агрегирование частот каждой из мер шкалы не имеет теоретической основы.
нет относительной меры. Как аналитик сравнивает то, что оценивается на 1, с тем, что имеет 2 балла? Один в два раза лучше другого? Опять же, нет теоретического способа агрегирования данных.

Другие типы

Рейтинг

Рейтинги действительно заставляют человека указывать относительные предпочтения по интересующим вопросам. Таким образом, можно, как и в DCE, обычно оценивать компромиссы между ними. Однако модели ранжирования должны проверять, оценивается ли одна и та же функция полезности на каждой глубине ранжирования: например, те же оценки (до шкалы дисперсии) должны быть результатом данных нижнего ранга и данных верхнего ранга.

Лучшее – худшее масштабирование

Шкала от лучшего к худшему (BWS) - это хорошо зарекомендовавшая себя альтернатива рейтингам и ранжированию. Он предлагает людям выбрать наиболее и наименее предпочтительные варианты из ряда альтернатив. Путем вычитания или интегрирования вероятностей выбора можно оценить полезность каждой альтернативы по шкале интервалов или соотношений для отдельных лиц и / или групп. Люди могут использовать различные психологические модели для получения наилучших наихудших данных, включая модель MaxDiff .

Использует

Моделирование выбора особенно полезно для:

Прогнозирование внедрения и совершенствование разработки новых продуктов
Оценка подразумеваемой готовности платить (WTP) за товары и услуги
Тестирование жизнеспособности продукта или услуги
Оценка влияния характеристик продукта на выбор потребителя
Варианты атрибутов продукта
Понимание ценности и предпочтений бренда
Оценка спроса и оптимальная цена

Смотрите также

внешние ссылки

СМИ, связанные с моделированием выбора, на Викискладе?
Кураторская библиография в IDEAS / RePEc

Languages

In other projects