Сожаление (теория принятия решений) - Regret (decision theory)

В теории принятия решений при принятии решений в условиях неопределенности - если информация о наилучшем образе действий поступит после принятия фиксированного решения - человеческая эмоциональная реакция сожаления часто ощущается и может быть измерена как величина разницы между принятым решением и принятым решением. оптимальное решение.

Теория неприятия сожаления или ожидаемого сожаления предполагает, что, столкнувшись с решением, люди могут ожидать сожаления и, таким образом, включать в свой выбор свое желание устранить или уменьшить эту возможность. Сожаление - это негативная эмоция с мощным социальным и репутационным компонентом, которая играет центральную роль в том, как люди учатся на собственном опыте, и в человеческой психологии неприятия риска . Сознательное ожидание сожаления создает петлю обратной связи, которая выходит за пределы сожаления из эмоциональной сферы - часто моделируемой как простое человеческое поведение - в сферу поведения рационального выбора, моделируемого в теории принятия решений.

Описание

Теория сожаления - это модель теоретической экономики, одновременно разработанная в 1982 году Грэмом Лумсом и Робертом Сагденом , Дэвидом Э. Беллом и Питером К. Фишберном . Теория сожаления моделирует выбор в условиях неопределенности с учетом эффекта ожидаемого сожаления. Впоследствии несколько других авторов улучшили его.

Он включает член сожаления в функции полезности, которая отрицательно зависит от реализованного результата и положительно от наилучшего альтернативного результата с учетом разрешения неопределенности. Этот термин сожаления обычно представляет собой возрастающую, непрерывную и неотрицательную функцию, вычитаемую из традиционного индекса полезности. Этот тип предпочтений всегда нарушает транзитивность в традиционном смысле, хотя большинство из них удовлетворяют более слабой версии.

Свидетельство

Несколько экспериментов как над стимулированным, так и над гипотетическим выбором свидетельствуют о величине этого эффекта.

Эксперименты на аукционах первой цены показывают, что, манипулируя обратной связью, которую участники ожидают получить, наблюдаются значительные различия в средних ставках. В частности, «сожаление проигравшего» может быть вызвано раскрытием выигравшей ставки всем участникам аукциона и, таким образом, раскрытием проигравшим, могли бы они получить прибыль и ее размер (участник, который получил оценка в 50 долларов, ставка 30 долларов и выяснение, что победившая ставка составила 35 долларов, также узнает, что она могла заработать до 15 долларов, сделав ставку на сумму более 35 долларов.) Это, в свою очередь, допускает возможность сожаления, и если участники торгов правильно это предвидят, они будут склонны предлагать более высокую ставку, чем в случае отсутствия обратной связи по выигравшей заявке, чтобы уменьшить вероятность сожаления.

При принятии решений о лотереях эксперименты также подтверждают ожидаемое сожаление. Как и в случае аукционов первой цены, различия в обратной связи по разрешению неопределенности могут вызвать возможность сожаления, а если это ожидается, это может вызвать различные предпочтения. Например, когда вы сталкиваетесь с выбором между 40 долларами с уверенностью и подбрасыванием монеты, при котором выплачивается 100 долларов, если результат угадан правильно, и 0 долларов в противном случае, не только определенный вариант оплаты минимизирует риск, но и возможность сожаления, поскольку обычно монета не будет подброшен (и, таким образом, неопределенность не устранена), в то время как, если выбрано подбрасывание монеты, результат, при котором выплачивается 0 долларов, вызовет сожаление. Если монета подбрасывается независимо от выбранной альтернативы, то альтернативный выигрыш всегда будет известен, и тогда не будет выбора, который исключил бы возможность сожаления.

Ожидаемое сожаление против пережитого сожаления

Ожидаемое сожаление обычно переоценивается как в отношении выбора, так и действий, за которые люди считают себя ответственными. Люди особенно склонны переоценивать сожаление, которое они испытают, если упустят желаемый результат с небольшим отрывом. В одном исследовании пассажиры предсказывали, что они испытают большее сожаление, если опоздали на поезд на 1 минуту больше, чем, например, на 5 минут, но пассажиры, которые фактически опоздали на поезд на 1 или 5 минут, испытали (равное и) меньшее количество сожаления. Пассажиры, казалось, переоценивали сожаление, которое они испытывали, опуская поезд с небольшим отрывом, потому что они были склонны недооценивать степень, в которой они связывали бы отсутствие поезда с внешними причинами (например, отсутствием кошелька или проведением меньшего количества времени в душе). .

Приложения

Помимо традиционного выбора лотереи, неприятие сожаления было предложено в качестве объяснения обычно наблюдаемого завышения ставок на аукционах первой цены и , среди прочего, эффекта диспозиции .

Минимальное сожаление

Минимаксные сожалеет подход заключается в минимизации наихудшего сожаления, первоначально представленный Леонард Savage в 1951 году Целью этого является выполнение как можно ближе к оптимальному курсу. Поскольку минимаксный критерий, применяемый здесь, касается сожаления (разницы или отношения выигрышей), а не самого выигрыша, он не столь пессимистичен, как обычный минимаксный подход. Подобные подходы использовались в различных областях, таких как:

Одно из преимуществ минимакса (в отличие от ожидаемого сожаления) заключается в том, что он не зависит от вероятностей различных результатов: таким образом, если сожаление может быть точно вычислено, можно надежно использовать минимаксное сожаление. Однако вероятность исхода оценить сложно.

Это отличается от стандартного минимаксного подхода тем, что в нем используются различия или отношения между результатами и, следовательно, требуются интервальные или относительные измерения, а также порядковые измерения (ранжирование), как в стандартном минимаксе.

Пример

Предположим, инвестор должен выбирать между инвестированием в акции, облигации или денежный рынок, а общий доход зависит от того, что происходит с процентными ставками. В следующей таблице показаны возможные варианты возврата:

Возвращение	Повышение процентных ставок	Статические ставки	Процентные ставки падают	Худшая отдача
Акции	−4	4	12	−4
Облигации	−2	3	8	−2
Денежный рынок	3	2	1	1
Лучшая отдача	3	4	12

Выбор грубого максимина, основанный на доходности, состоял бы в том, чтобы инвестировать в денежный рынок, обеспечивая доходность как минимум 1. Однако, если процентные ставки упадут, то сожаление, связанное с этим выбором, будет большим. Это будет 11, что является разницей между 12, которые можно было бы получить, если бы результат был известен заранее, и полученным 1. Смешанный портфель из 11,1% акций и 88,9% на денежном рынке обеспечил бы доходность не менее 2,22%; но, если бы процентные ставки упали, сожаление составило бы около 9,78.

Таблица сожалений для этого примера, построенная путем вычитания фактических доходов из лучших доходов, выглядит следующим образом:

Сожалеть	Повышение процентных ставок	Статические ставки	Процентные ставки падают	Худшее сожаление
Акции	7	0	0	7
Облигации	5	1	4	5
Денежный рынок	0	2	11	11

Поэтому, используя минимаксный выбор, основанный на сожалении, лучше всего было бы инвестировать в облигации, обеспечивая сожаление не хуже 5. Смешанный инвестиционный портфель подойдет еще лучше: 61,1% вложены в акции и 38,9% - в деньги. рынок выдал бы сожаление не хуже примерно 4,28.

Пример: настройка линейной оценки

Ниже приводится иллюстрация того, как концепция сожаления может быть использована для построения линейной оценки . В этом примере задача состоит в том, чтобы построить линейную оценку конечномерного вектора параметров на основе его линейного измерения с шумами с известной структурой ковариации шума. Потеря восстановления измеряется с помощью среднеквадратичной ошибки (MSE). Известно, что вектор неизвестных параметров лежит в эллипсоиде с центром в нуле. Сожаление определяется как разница между MSE линейного оценщика, который не знает параметр , и MSE линейного оценщика, который знает . Кроме того, поскольку оценка ограничена линейностью, нулевая MSE не может быть достигнута в последнем случае. В этом случае решение задачи выпуклой оптимизации дает оптимальную минимаксную минимизирующую сожаление линейную оценку, что можно увидеть с помощью следующих аргументов. ${\ displaystyle x}$ ${\ displaystyle x}$ ${\ displaystyle E}$ ${\ displaystyle x}$ ${\ displaystyle x}$

Согласно предположениям, наблюдаемый вектор и вектор неизвестного детерминированного параметра связаны линейной моделью ${\ displaystyle y}$ ${\ displaystyle x}$

{\ displaystyle y = Hx + w}

где - известная матрица с полным рангом столбца , а - случайный вектор с нулевым средним с известной ковариационной матрицей . ${\ displaystyle H}$ ${\ Displaystyle п \ раз м}$ ${\ displaystyle m}$ ${\ displaystyle w}$ ${\ displaystyle C_ {w}}$

Позволять

{\ displaystyle {\ hat {x}} = Гр}

- линейная оценка от , где - некоторая матрица. MSE этого оценщика определяется как ${\ displaystyle x}$ ${\ displaystyle y}$ ${\ displaystyle G}$ ${\ Displaystyle м \ раз п}$

{\ displaystyle MSE = E \ left (|| {\ hat {x}} - x || ^ {2} \ right) = Tr (GC_ {w} G ^ {*}) + x ^ {*} (I -GH) ^ {*} (I-GH) x.}

Поскольку MSE явно зависит от нее, ее нельзя минимизировать напрямую. Вместо этого можно использовать концепцию сожаления для определения линейного оценщика с хорошей производительностью MSE. Чтобы определить здесь сожаление, рассмотрим линейную оценку, которая знает значение параметра , т. Е. Матрица может явно зависеть от : ${\ displaystyle x}$ ${\ displaystyle x}$ ${\ displaystyle G}$ ${\ displaystyle x}$

{\ displaystyle {\ hat {x}} ^ {o} = G (x) y.}

СКО IS ${\ displaystyle {\ hat {x}} ^ {o}}$

{\ displaystyle MSE ^ {o} = E \ left (|| {\ hat {x}} ^ {o} -x || ^ {2} \ right) = Tr (G (x) C_ {w} G ( x) ^ {*}) + x ^ {*} (IG (x) H) ^ {*} (IG (x) H) x.}

Чтобы найти оптимальное , дифференцируется по, и производная приравнивается к 0, получая ${\ Displaystyle G (х)}$ ${\ displaystyle MSE ^ {o}}$ ${\ displaystyle G}$

{\ displaystyle G (x) = xx ^ {*} H ^ {*} (C_ {w} + Hxx ^ {*} H ^ {*}) ^ {- 1}.}

Затем, используя лемму об обращении матрицы

{\ displaystyle G (x) = {\ frac {1} {1 + x ^ {*} H ^ {*} C_ {w} ^ {- 1} Hx}} xx ^ {*} H ^ {*} C_ {w} ^ {- 1}.}

Подставляя это обратно , получаем ${\ Displaystyle G (х)}$ ${\ displaystyle MSE ^ {o}}$

{\ displaystyle MSE ^ {o} = {\ frac {x ^ {*} x} {1 + x ^ {*} H ^ {*} C_ {w} ^ {- 1} Hx}}.}

Это наименьшая MSE, достижимая при известной линейной оценке . На практике эта MSE не может быть достигнута, но она служит ограничением оптимальной MSE. Сожаление об использовании линейной оценки, указанной в, равно ${\ displaystyle x}$ ${\ displaystyle G}$

{\ Displaystyle R (x, G) = MSE-MSE ^ {o} = Tr (GC_ {w} G ^ {*}) + x ^ {*} (I-GH) ^ {*} (I-GH) x - {\ frac {x ^ {*} x} {1 + x ^ {*} H ^ {*} C_ {w} ^ {- 1} Hx}}.}.

Подход с минимаксным сожалением здесь состоит в том, чтобы свести к минимуму сожаление в худшем случае, т. Е. Это обеспечит производительность, максимально приближенную к наилучшей достижимой производительности в худшем случае параметра . Хотя эта проблема кажется сложной, это пример выпуклой оптимизации, и, в частности, можно эффективно вычислить численное решение. Подобные идеи можно использовать, когда случайное значение имеет неопределенность в ковариационной матрице . ${\ displaystyle \ sup _ {x \ in E} R (x, G).}$ ${\ displaystyle x}$ ${\ displaystyle x}$

Смотрите также

использованная литература

внешние ссылки

«УЧЕБНИК G05: Теория принятия решений» . Архивировано из оригинала 3 июля 2015 года.

Languages

In other projects