Сожаление (теория принятия решений) - Regret (decision theory)

В теории принятия решений при принятии решений в условиях неопределенности - если информация о наилучшем образе действий поступит после принятия фиксированного решения - человеческая эмоциональная реакция сожаления часто ощущается и может быть измерена как величина разницы между принятым решением и принятым решением. оптимальное решение.

Теория неприятия сожаления или ожидаемого сожаления предполагает, что, столкнувшись с решением, люди могут ожидать сожаления и, таким образом, включать в свой выбор свое желание устранить или уменьшить эту возможность. Сожаление - это негативная эмоция с мощным социальным и репутационным компонентом, которая играет центральную роль в том, как люди учатся на собственном опыте, и в человеческой психологии неприятия риска . Сознательное ожидание сожаления создает петлю обратной связи, которая выходит за пределы сожаления из эмоциональной сферы - часто моделируемой как простое человеческое поведение - в сферу поведения рационального выбора, моделируемого в теории принятия решений.

Описание

Теория сожаления - это модель теоретической экономики, одновременно разработанная в 1982 году Грэмом Лумсом и Робертом Сагденом , Дэвидом Э. Беллом и Питером К. Фишберном . Теория сожаления моделирует выбор в условиях неопределенности с учетом эффекта ожидаемого сожаления. Впоследствии несколько других авторов улучшили его.

Он включает член сожаления в функции полезности, которая отрицательно зависит от реализованного результата и положительно от наилучшего альтернативного результата с учетом разрешения неопределенности. Этот термин сожаления обычно представляет собой возрастающую, непрерывную и неотрицательную функцию, вычитаемую из традиционного индекса полезности. Этот тип предпочтений всегда нарушает транзитивность в традиционном смысле, хотя большинство из них удовлетворяют более слабой версии.

Свидетельство

Несколько экспериментов как над стимулированным, так и над гипотетическим выбором свидетельствуют о величине этого эффекта.

Эксперименты на аукционах первой цены показывают, что, манипулируя обратной связью, которую участники ожидают получить, наблюдаются значительные различия в средних ставках. В частности, «сожаление проигравшего» может быть вызвано раскрытием выигравшей ставки всем участникам аукциона и, таким образом, раскрытием проигравшим, могли бы они получить прибыль и ее размер (участник, который получил оценка в 50 долларов, ставка 30 долларов и выяснение, что победившая ставка составила 35 долларов, также узнает, что она могла заработать до 15 долларов, сделав ставку на сумму более 35 долларов.) Это, в свою очередь, допускает возможность сожаления, и если участники торгов правильно это предвидят, они будут склонны предлагать более высокую ставку, чем в случае отсутствия обратной связи по выигравшей заявке, чтобы уменьшить вероятность сожаления.

При принятии решений о лотереях эксперименты также подтверждают ожидаемое сожаление. Как и в случае аукционов первой цены, различия в обратной связи по разрешению неопределенности могут вызвать возможность сожаления, а если это ожидается, это может вызвать различные предпочтения. Например, когда вы сталкиваетесь с выбором между 40 долларами с уверенностью и подбрасыванием монеты, при котором выплачивается 100 долларов, если результат угадан правильно, и 0 долларов в противном случае, не только определенный вариант оплаты минимизирует риск, но и возможность сожаления, поскольку обычно монета не будет подброшен (и, таким образом, неопределенность не устранена), в то время как, если выбрано подбрасывание монеты, результат, при котором выплачивается 0 долларов, вызовет сожаление. Если монета подбрасывается независимо от выбранной альтернативы, то альтернативный выигрыш всегда будет известен, и тогда не будет выбора, который исключил бы возможность сожаления.

Ожидаемое сожаление против пережитого сожаления

Ожидаемое сожаление обычно переоценивается как в отношении выбора, так и действий, за которые люди считают себя ответственными. Люди особенно склонны переоценивать сожаление, которое они испытают, если упустят желаемый результат с небольшим отрывом. В одном исследовании пассажиры предсказывали, что они испытают большее сожаление, если опоздали на поезд на 1 минуту больше, чем, например, на 5 минут, но пассажиры, которые фактически опоздали на поезд на 1 или 5 минут, испытали (равное и) меньшее количество сожаления. Пассажиры, казалось, переоценивали сожаление, которое они испытывали, опуская поезд с небольшим отрывом, потому что они были склонны недооценивать степень, в которой они связывали бы отсутствие поезда с внешними причинами (например, отсутствием кошелька или проведением меньшего количества времени в душе). .

Приложения

Помимо традиционного выбора лотереи, неприятие сожаления было предложено в качестве объяснения обычно наблюдаемого завышения ставок на аукционах первой цены и , среди прочего, эффекта диспозиции .

Минимальное сожаление

Минимаксные сожалеет подход заключается в минимизации наихудшего сожаления, первоначально представленный Леонард Savage в 1951 году Целью этого является выполнение как можно ближе к оптимальному курсу. Поскольку минимаксный критерий, применяемый здесь, касается сожаления (разницы или отношения выигрышей), а не самого выигрыша, он не столь пессимистичен, как обычный минимаксный подход. Подобные подходы использовались в различных областях, таких как:

Одно из преимуществ минимакса (в отличие от ожидаемого сожаления) заключается в том, что он не зависит от вероятностей различных результатов: таким образом, если сожаление может быть точно вычислено, можно надежно использовать минимаксное сожаление. Однако вероятность исхода оценить сложно.

Это отличается от стандартного минимаксного подхода тем, что в нем используются различия или отношения между результатами и, следовательно, требуются интервальные или относительные измерения, а также порядковые измерения (ранжирование), как в стандартном минимаксе.

Пример

Предположим, инвестор должен выбирать между инвестированием в акции, облигации или денежный рынок, а общий доход зависит от того, что происходит с процентными ставками. В следующей таблице показаны возможные варианты возврата:

Возвращение Повышение процентных ставок Статические ставки Процентные ставки падают Худшая отдача
Акции −4 4 12 −4
Облигации −2 3 8 −2
Денежный рынок 3 2 1 1
Лучшая отдача 3 4 12

Выбор грубого максимина, основанный на доходности, состоял бы в том, чтобы инвестировать в денежный рынок, обеспечивая доходность как минимум 1. Однако, если процентные ставки упадут, то сожаление, связанное с этим выбором, будет большим. Это будет 11, что является разницей между 12, которые можно было бы получить, если бы результат был известен заранее, и полученным 1. Смешанный портфель из 11,1% акций и 88,9% на денежном рынке обеспечил бы доходность не менее 2,22%; но, если бы процентные ставки упали, сожаление составило бы около 9,78.

Таблица сожалений для этого примера, построенная путем вычитания фактических доходов из лучших доходов, выглядит следующим образом:

Сожалеть Повышение процентных ставок Статические ставки Процентные ставки падают Худшее сожаление
Акции 7 0 0 7
Облигации 5 1 4 5
Денежный рынок 0 2 11 11

Поэтому, используя минимаксный выбор, основанный на сожалении, лучше всего было бы инвестировать в облигации, обеспечивая сожаление не хуже 5. Смешанный инвестиционный портфель подойдет еще лучше: 61,1% вложены в акции и 38,9% - в деньги. рынок выдал бы сожаление не хуже примерно 4,28.

Пример: настройка линейной оценки

Ниже приводится иллюстрация того, как концепция сожаления может быть использована для построения линейной оценки . В этом примере задача состоит в том, чтобы построить линейную оценку конечномерного вектора параметров на основе его линейного измерения с шумами с известной структурой ковариации шума. Потеря восстановления измеряется с помощью среднеквадратичной ошибки (MSE). Известно, что вектор неизвестных параметров лежит в эллипсоиде с центром в нуле. Сожаление определяется как разница между MSE линейного оценщика, который не знает параметр , и MSE линейного оценщика, который знает . Кроме того, поскольку оценка ограничена линейностью, нулевая MSE не может быть достигнута в последнем случае. В этом случае решение задачи выпуклой оптимизации дает оптимальную минимаксную минимизирующую сожаление линейную оценку, что можно увидеть с помощью следующих аргументов.

Согласно предположениям, наблюдаемый вектор и вектор неизвестного детерминированного параметра связаны линейной моделью

где - известная матрица с полным рангом столбца , а - случайный вектор с нулевым средним с известной ковариационной матрицей .

Позволять

- линейная оценка от , где - некоторая матрица. MSE этого оценщика определяется как

Поскольку MSE явно зависит от нее, ее нельзя минимизировать напрямую. Вместо этого можно использовать концепцию сожаления для определения линейного оценщика с хорошей производительностью MSE. Чтобы определить здесь сожаление, рассмотрим линейную оценку, которая знает значение параметра , т. Е. Матрица может явно зависеть от :

СКО IS

Чтобы найти оптимальное , дифференцируется по, и производная приравнивается к 0, получая

Затем, используя лемму об обращении матрицы

Подставляя это обратно , получаем

Это наименьшая MSE, достижимая при известной линейной оценке . На практике эта MSE не может быть достигнута, но она служит ограничением оптимальной MSE. Сожаление об использовании линейной оценки, указанной в, равно

Подход с минимаксным сожалением здесь состоит в том, чтобы свести к минимуму сожаление в худшем случае, т. Е. Это обеспечит производительность, максимально приближенную к наилучшей достижимой производительности в худшем случае параметра . Хотя эта проблема кажется сложной, это пример выпуклой оптимизации, и, в частности, можно эффективно вычислить численное решение. Подобные идеи можно использовать, когда случайное значение имеет неопределенность в ковариационной матрице .

Смотрите также

использованная литература

внешние ссылки