Теория Демпстера – Шафера - Dempster–Shafer theory

Теория функций убеждений , называемых также теории доказательств или теория Демпстера Шафера ( DST ), является общей основой для рассуждений с неопределенностью, с понимаемыми связями с другими системами , такие как вероятности, возможность и вероятностью неточных теориями . Впервые представленная Артуром П. Демпстером в контексте статистического вывода, теория была позже развита Гленном Шейфером в общую основу для моделирования эпистемической неопределенности - математическую теорию свидетельств . Теория позволяет объединить свидетельства из разных источников и прийти к определенной степени уверенности (представленной математическим объектом, называемым функцией убеждений ), которая учитывает все доступные свидетельства.

В узком смысле термин теория Демпстера – Шафера относится к первоначальной концепции теории Демпстера и Шафера. Однако более распространено использование этого термина в более широком смысле того же общего подхода, адаптированного к конкретным типам ситуаций. В частности, многие авторы предложили разные правила объединения доказательств, часто с целью лучшего разрешения конфликтов между доказательствами. Ранний вклад также стал отправной точкой для многих важных разработок, включая переносимую модель убеждений и теорию намеков.

Обзор

Теория Демпстера – Шейфера является обобщением байесовской теории субъективной вероятности . Функции убеждения основывают степени уверенности (или уверенности, или доверия) для одного вопроса на субъективных вероятностях для связанного вопроса. Сами степени веры могут иметь или не иметь математические свойства вероятностей; насколько они различаются, зависит от того, насколько тесно связаны эти два вопроса. Другими словами, это способ представления эпистемических правдоподобий, но он может давать ответы, противоречащие тем, которые были получены при использовании теории вероятностей .

Теория Демпстера-Шафера, часто используемая как метод слияния сенсоров , основана на двух идеях: получение степени уверенности для одного вопроса из субъективных вероятностей для связанного вопроса и правило Демпстера для объединения таких степеней уверенности, когда они основаны на независимых элементах. доказательств. По сути, степень веры в предложение зависит в первую очередь от количества ответов (на связанные вопросы), содержащих предложение, и от субъективной вероятности каждого ответа. Также вносят свой вклад правила комбинирования, которые отражают общие предположения о данных.

В этом формализме степень веры (также называемая массой ) представлена ​​как функция веры, а не байесовское распределение вероятностей . Значения вероятностей присваиваются скорее множеству возможностей, чем отдельным событиям: их привлекательность основывается на том факте, что они естественным образом кодируют свидетельства в пользу предположений.

Теория Демпстера – Шейфера приписывает свои массы всем подмножествам предложений, составляющих систему, - в терминах теории множеств - множеству степеней предложений. Например, предположим ситуацию, когда в системе есть два связанных вопроса или предложения. В этой системе любая функция убеждения приписывает массу первому утверждению, второму, обоим или ни одному из них.

Вера и правдоподобие

Формализм Шафера исходит из набора рассматриваемых возможностей , например, числовых значений переменной или пар лингвистических переменных, таких как «дата и место происхождения реликвии» (спрашивая, антикварная она или недавняя подделка). Гипотеза представлена ​​подмножеством этой системы различения , например «(династия Мин, Китай)» или «(XIX век, Германия)».

Структура Шафера позволяет представить убеждения о таких предложениях в виде интервалов, ограниченных двумя ценностями: убеждением (или поддержкой ) и правдоподобием :

вераправдоподобие .

На первом этапе всем подмножествам кадра присваиваются субъективные вероятности ( массы ); обычно только ограниченное количество наборов будет иметь ненулевую массу ( фокальные элементы ). Вера в гипотезу складывается из суммы масс всех подмножеств набора гипотез. Это количество убеждений, которое напрямую поддерживает либо данную гипотезу, либо более конкретную, таким образом формируя нижнюю границу ее вероятности. Убеждение (обычно обозначаемое как Bel ) измеряет силу свидетельства в пользу утверждения p . Он варьируется от 0 (указывает на отсутствие доказательств) до 1 (означает уверенность). Правдоподобие равно 1 минус сумма масс всех множеств, пересечение которых с гипотезой пусто. Или его можно получить как сумму масс всех множеств, пересечение которых с гипотезой не является пустым. Это верхняя граница вероятности того, что гипотеза может быть верной, то есть «возможно , это может быть истинное состояние системы» до этого значения, потому что существует лишь определенное количество свидетельств, противоречащих этой гипотезе. Правдоподобие (обозначенное Pl) определяется как Pl ( p ) = 1 - Bel (~ p ). Он также варьируется от 0 до 1 и измеряет степень, в которой доказательства в пользу ~ p оставляют место для веры в p .

Например, предположим, что у нас есть убеждение 0,5 для предложения, скажем, «кот в коробке мертв». Это означает, что у нас есть доказательства, которые позволяют нам твердо утверждать, что утверждение верно с уверенностью 0,5. Однако доказательства, противоречащие этой гипотезе (например, «кошка жива») имеют достоверность только 0,2. Оставшаяся масса 0,3 (разрыв между 0,5 подтверждающим доказательством с одной стороны и 0,2 противоречащим доказательством с другой) является «неопределенной», что означает, что кошка могла быть либо мертвой, либо живой. Этот интервал представляет уровень неопределенности, основанный на свидетельствах в системе.

Гипотеза Масса Вера Правдоподобие
Нулевой (ни живой, ни мертвый) 0 0 0
В живых 0,2 0,2 0,5
Мертвый 0,5 0,5 0,8
Либо (живым, либо мертвым) 0,3 1.0 1.0

Нулевая гипотеза по определению устанавливается равной нулю (соответствует «нет решения»). Ортогональные гипотезы «Живой» и «Мертвый» имеют вероятности 0,2 и 0,5 соответственно. Это может соответствовать сигналам "Детектор живой / мертвой кошки", которые имеют надежность 0,2 и 0,5 соответственно. Наконец, всеобъемлющая гипотеза «Либо» (которая просто признает, что в коробке есть кошка) устраняет недостаток, так что сумма масс равна 1. Вера в гипотезы «Живой» и «Мертвой» соответствует их соответствующие массы, потому что у них нет подмножеств; Вера для «Либо» состоит из суммы всех трех масс (Либо, Живой и Мертвый), потому что «Живой» и «Мертвый» - это каждое подмножество «Либо». «Живое» правдоподобие составляет 1 -  m (мертвое): 0,5, а правдоподобие «мертвое» равно 1 -  m (живое): 0,8. Другими словами, «живое» правдоподобие - это m (живое) + m (любое), а «мертвое» правдоподобие - m (мертвое) + m (любое). Наконец, правдоподобие «Either» складывается из m (живого) +  m (мертвого) +  m (любого). Универсальная гипотеза («Либо») всегда будет иметь стопроцентное доверие и правдоподобие - она ​​действует как своего рода контрольная сумма .

Вот несколько более сложный пример, когда начинает проявляться поведение веры и правдоподобия. Мы смотрим через множество детекторных систем на один дальний сигнальный огонь, который может быть окрашен только в один из трех цветов (красный, желтый или зеленый):

Гипотеза Масса Вера Правдоподобие
Нулевой 0 0 0
красный 0,35 0,35 0,56
Желтый 0,25 0,25 0,45
Зеленый 0,15 0,15 0,34
Красный или желтый 0,06 0,66 0,85
Красный или зеленый 0,05 0,55 0,75
Желтый или зеленый 0,04 0,44 0,65
Любой 0,1 1.0 1.0

События такого типа не могут быть смоделированы как непересекающиеся множества в вероятностном пространстве, как здесь, в пространстве массового назначения. Скорее, событие «красный или желтый» будет рассматриваться как объединение событий «красный» и «желтый», и (см. Аксиомы вероятности ) P (красный или желтый) ≥ P (желтый) и P (любой) = 1. , где любое относится к красным или желтый или зеленый . В DST масса, присвоенная Любому, относится к пропорции свидетельства, которое не может быть отнесено ни к одному из других состояний, что здесь означает свидетельство, которое говорит, что есть свет, но ничего не говорит о том, какого он цвета. В этом примере доля свидетельств, показывающих, что свет красный или зеленый, имеет массу 0,05. Такие доказательства могут быть получены, например, от дальтоника R / G. DST позволяет нам извлекать ценность из свидетельств этого датчика. Кроме того, в DST считается, что нулевой набор имеет нулевую массу, что означает, что здесь существует сигнальная световая система, и мы исследуем ее возможные состояния, а не размышляем о том, существует ли она вообще.

Объединение убеждений

Убеждения из разных источников можно комбинировать с различными операторами слияния для моделирования конкретных ситуаций слияния убеждений, например, с правилом комбинирования Демпстера , которое комбинирует ограничения убеждений, которые продиктованы независимыми источниками убеждений, например, в случае комбинирования подсказок или комбинирования предпочтений. Обратите внимание, что массы вероятностей от утверждений, которые противоречат друг другу, могут использоваться для получения меры конфликта между независимыми источниками убеждений. Другие ситуации можно смоделировать с помощью различных операторов слияния, таких как совокупное слияние убеждений из независимых источников, которые можно смоделировать с помощью оператора кумулятивного слияния.

Правило комбинирования Демпстера иногда интерпретируется как приблизительное обобщение правила Байеса . В этой интерпретации априорные и условные выражения не нужно указывать, в отличие от традиционных байесовских методов, которые часто используют аргумент симметрии (минимаксная ошибка) для присвоения априорных вероятностей случайным величинам ( например, присвоение 0,5 двоичным значениям, для которых нет информации о том, какие из них скорее). Однако любая информация, содержащаяся в пропущенных априорных и условных выражениях, не используется в правиле комбинирования Демпстера, если она не может быть получена косвенно - и, возможно, тогда она доступна для вычислений с использованием уравнений Байеса.

Теория Демпстера-Шейфера позволяет указать степень невежества в этой ситуации вместо того, чтобы быть вынужденным предоставлять априорные вероятности, которые добавляют к единице. Ситуация такого рода, а также вопрос о том, существует ли реальное различие между риском и незнанием , широко обсуждались статистиками и экономистами. См., Например, противоположные взгляды Дэниела Эллсберга , Ховарда Райффа , Кеннета Эрроу и Фрэнка Найта .

Формальное определение

Пусть X - вселенная : множество, представляющее все возможные состояния рассматриваемой системы. Набор мощности

- это множество всех подмножеств X , включая пустое множество  . Например, если:

тогда

Элементы набора мощности могут быть взяты для представления предложений относительно фактического состояния системы, поскольку они содержат все и только состояния, в которых утверждение истинно.

Теория очевидности приписывает массу убеждений каждому элементу набора власти. Формально функция

называется базовым назначением убеждений (BBA), когда у него есть два свойства. Во-первых, масса пустого набора равна нулю:

Во-вторых, массы всех членов набора мощности в сумме составляют 1:

Масса м ( ) из А , данный элемент набора мощности, выражает долю всех соответствующих и имеющихся данных , который поддерживает утверждение о том , что фактическое состояние принадлежит A , но ни к какому конкретному подмножеству A . Значение m ( A ) относится только к набору A и не делает никаких дополнительных заявлений о каких-либо подмножествах A , каждое из которых по определению имеет свою собственную массу.

Из массовых назначений можно определить верхнюю и нижнюю границы вероятностного интервала. Этот интервал содержит точную вероятность интересующего множества (в классическом смысле) и ограничен двумя неаддитивными непрерывными мерами, называемыми убеждением (или поддержкой ) и правдоподобием :

Вера bel ( A ) для множества A определяется как сумма всех масс подмножеств интересующего множества:

Правдоподобие pl ( A ) - это сумма всех масс множеств B, которые пересекают интересующее множество A :

Эти две меры связаны друг с другом следующим образом:

И наоборот, для конечного A , учитывая меру bel ( B ) для всех подмножеств B в A , мы можем найти массы m ( A ) с помощью следующей обратной функции:

где | А  -  Б | - разница мощностей двух множеств.

Это следует из последних двух уравнений следует, что для конечного множества X , нужно знать только один из трех (массы, веры, или правдоподобности) вывести два других; хотя может потребоваться знать значения для многих наборов, чтобы вычислить одно из других значений для конкретного набора. В случае бесконечного X могут быть хорошо определенные функции доверия и правдоподобия, но не может быть четко определенной функции масс.

Правило комбинации Демпстера

Проблема, с которой мы сейчас сталкиваемся, заключается в том, как объединить два независимых набора вероятностных массовых назначений в конкретных ситуациях. В случае, если разные источники выражают свои убеждения через фрейм в терминах ограничений убеждений, например, в случае подсказок или в случае выражения предпочтений, тогда подходящим оператором слияния является правило комбинирования Демпстера. Это правило выводит общее мнение, разделяемое несколькими источниками, и игнорирует все конфликтующие (не разделяемые) убеждения с помощью фактора нормализации. Использование этого правила в других ситуациях, помимо объединения ограничений убеждений, подверглось серьезной критике, например, в случае объединения отдельных оценок убеждений из нескольких источников, которые должны быть объединены кумулятивным образом, а не в качестве ограничений. Кумулятивное слияние означает, что все вероятностные массы из разных источников отражаются в производном убеждении, поэтому никакая вероятностная масса не игнорируется.

В частности, комбинация (называемая совместной массой ) вычисляется из двух наборов масс m 1 и m 2 следующим образом:

куда

K - мера степени конфликта между двумя наборами масс.

Последствия конфликта

Приведенный выше коэффициент нормализации, 1 -  K , полностью игнорирует конфликт и приписывает любую массу, связанную с конфликтом, нулевому набору. Таким образом, это правило комбинирования доказательств может привести к противоречивым результатам, как мы покажем далее.

Пример получения правильных результатов в случае сильного конфликта

В следующем примере показано, как правило Демпстера дает интуитивно понятные результаты при применении в ситуации слияния предпочтений даже при высоком уровне конфликта.

Предположим, что двое друзей, Алиса и Боб, хотят однажды вечером посмотреть фильм в кинотеатре, и что здесь показаны только три фильма: X, Y и Z. Алиса выражает свое предпочтение фильму X с вероятностью 0,99, а ее предпочтение - фильму X с вероятностью 0,99. фильм Y с вероятностью всего 0,01. Боб выражает свое предпочтение фильму Z с вероятностью 0,99 и его предпочтение фильму Y с вероятностью только 0,01. При объединении предпочтений с правилом комбинирования Демпстера выясняется, что их объединенное предпочтение дает вероятность 1,0 для фильма Y, потому что это единственный фильм, который они оба согласны смотреть.
Правило комбинирования Демпстера дает интуитивные результаты даже в случае полностью противоречивых убеждений при такой интерпретации. Предположим, что Алиса предпочитает фильм X с вероятностью 1.0, а Боб предпочитает фильм Z с вероятностью 1.0. При попытке совместить их предпочтения с правилом Демпстера оказывается, что в данном случае оно не определено, а значит, решения нет. Это означало бы, что они не могут договориться о совместном просмотре какого-либо фильма, поэтому в этот вечер они не ходят вместе в кино. Однако семантика интерпретации предпочтения как вероятности расплывчата: если это относится к вероятности просмотра фильма X сегодня вечером, тогда мы сталкиваемся с ошибкой исключенной середины : событие, которое действительно происходит, когда сегодня вечером не виден ни один из фильмов, не имеет вероятностная масса 0.

Пример получения нелогичных результатов в случае сильного конфликта

Пример с точно такими же числовыми значениями был представлен Заде в 1979 году, чтобы указать на противоречащие интуиции результаты, генерируемые правилом Демпстера при высокой степени конфликта. Пример выглядит следующим образом:

Предположим, что у одного есть два равноадежных врача, и один врач считает, что у пациента опухоль головного мозга, с вероятностью (т. Е. Основным заданием - bba или массой убеждений) 0,99; или менингит, с вероятностью всего 0,01. Второй врач считает, что у пациента сотрясение мозга с вероятностью 0,99, и считает, что пациент страдает менингитом, с вероятностью только 0,01. Применяя правило Демпстера, чтобы объединить эти два набора масс убеждений, в итоге получаем m (менингит) = 1 (менингит диагностируется со 100-процентной достоверностью).

Такой результат противоречит здравому смыслу, поскольку оба врача согласны с тем, что вероятность того, что у пациента менингит, мала. Этот пример послужил отправной точкой для многих исследовательских работ, в которых пытались найти твердое обоснование правила Демпстера и основ теории Демпстера – Шафера или показать несостоятельность этой теории.

Пример получения противоречивых результатов в случае незначительного конфликта

В следующем примере показано, где правило Демпстера дает противоречивый результат, даже если конфликт незначителен.

Предположим, что один врач считает, что у пациента опухоль мозга с вероятностью 0,99 или менингит с вероятностью всего 0,01. Второй врач также считает, что у пациента опухоль головного мозга с вероятностью 0,99, и считает, что пациент страдает сотрясением мозга с вероятностью всего 0,01. Если мы вычислим m (опухоль головного мозга) по правилу Демпстера, мы получим

Этот результат подразумевает полную поддержку диагноза опухоли головного мозга, который оба доктора считали весьма вероятным . Соглашение возникает из-за низкой степени противоречия между двумя наборами доказательств, содержащихся во мнениях двух врачей.

В любом случае было бы разумно ожидать, что:

поскольку наличие ненулевых вероятностей веры для других диагнозов подразумевает менее чем полную поддержку диагноза опухоли головного мозга.

Демпстер – Шейфер как обобщение байесовской теории.

Как и в теории Демпстера – Шафера, байесовская функция доверия имеет свойства и . Третье условие, однако, входит в теорию DS, но смягчается:

Например, байесовец смоделирует цвет автомобиля как распределение вероятностей по (красный, зеленый, синий), присвоив каждому цвету одно число. Демпстер – Шафер присваивает номера каждому из (красный, зеленый, синий, (красный или зеленый), (красный или синий), (зеленый или синий), (красный, зеленый или синий)), которые не должны совпадать, для например Бел (красный) + Бел (зеленый)! = Бел (красный или зеленый). Это может быть более эффективным в вычислительном отношении, если свидетель сообщает: «Я видел, что машина была либо синей, либо зеленой», и в этом случае убеждение может быть присвоено за один шаг, а не разбиваться на значения для двух разных цветов. Однако это может привести к иррациональным выводам.

Эквивалентно, каждое из следующих условий определяет байесовский частный случай теории DS:

  • Для конечного X все центральные элементы функции доверия являются одиночными.

Условная вероятность Байеса - это частный случай правила комбинирования Демпстера.

Утверждалось, что теория DS обеспечивает более четкое различие между эпистемической неопределенностью и физической неопределенностью, чем байесовская теория. Например, рост ненаблюдаемого человека из популяции может иметь гауссовское распределение убеждений с высокой дисперсией, но байесовская теория получает такое же распределение в случае, когда все люди имеют одинаковый рост, но мало данных о том, что это за рост. , как и в случае, когда население имеет широкий диапазон физически разного роста. Стандартная байесовская теория может привести к неоптимальным решениям, если это различие не будет учтено с использованием вероятности второго порядка и механизма для оценки полезности действий по сбору информации.

Также утверждалось, что теория DS не является обобщением байесовской теории.

Байесовское приближение

Байесовское приближение уменьшает заданную BPA к (дискретным) распределению вероятностей, т.е. только одноэлементные подмножества кадра различения может быть фокусными элементами приближенной версии из :

Это полезно для тех, кого интересует только гипотеза единственного состояния.

Проделаем это на «легком» примере.

Гипотеза
Нулевой 0 0 0 0 0 0
красный 0,35 0,11 0,32 0,41 0,30 0,37
Желтый 0,25 0,21 0,33 0,33 0,38 0,38
Зеленый 0,15 0,33 0,24 0,25 0,32 0,25
Красный или желтый 0,06 0,21 0,07 0 0 0
Красный или зеленый 0,05 0,01 0,01 0 0 0
Желтый или зеленый 0,04 0,03 0,01 0 0 0
Любой 0,1 0,1 0,02 0 0 0

Критика

Джудея Перл (1988a, глава 9; 1988b и 1990) утверждала, что неверно интерпретировать функции убеждений как представляющие либо «вероятности события», либо «уверенность в вероятностях, приписываемых различным исходам», либо «степени». веры (или уверенности, или веры) в предложение »или« степени невежества в ситуации ». Вместо этого функции убеждений представляют вероятность того, что данное предложение доказуемо на основе набора других предложений, которым приписываются вероятности. Смешение вероятностей истины с вероятностями доказуемости может привести к противоречивым результатам в задачах рассуждения, таких как (1) представление неполного знания, (2) обновление убеждений и (3) объединение доказательств. Он также продемонстрировал, что если частичное знание кодируется и обновляется методами функции убеждений, полученные в результате убеждения не могут служить основой для рациональных решений.

Клопотек и Вежхонь предложили интерпретировать теорию Демпстера – Шафера в терминах статистики таблиц решений (теории приблизительных множеств ), в соответствии с которой оператор объединения свидетельств следует рассматривать как реляционное объединение таблиц решений. В другой интерпретации М.А. Клопотек и С.Т. Вежхон предлагают рассматривать эту теорию как описывающую деструктивную обработку материала (с потерей свойств), например, как в некоторых процессах производства полупроводников. При обеих интерпретациях рассуждение в DST дает правильные результаты, вопреки более ранним вероятностным интерпретациям, критиковавшимся Перлом в цитируемых статьях и другими исследователями.

Йосанг доказал, что правило комбинирования Демпстера на самом деле является методом объединения ограничений убеждений. Он представляет собой только приблизительный оператор слияния в других ситуациях, например, кумулятивное слияние убеждений, но обычно дает неверные результаты в таких ситуациях. Таким образом, путаница вокруг обоснованности правила Демпстера возникает из-за неспособности правильно интерпретировать природу ситуаций, которые необходимо моделировать. Правило комбинирования Демпстера всегда дает правильные и интуитивно понятные результаты в ситуации слияния ограничений убеждений из разных источников.

Реляционные меры

При рассмотрении предпочтений можно использовать частичный порядок в виде решетки вместо общего порядка реальной линии, найденных в теории Демпстера- Schafer. Действительно, Гюнтер Шмидт предложил эту модификацию и обрисовал метод.

Учитывая набор критериев C и решетку L с порядком E , Шмидт определяет реляционную меру μ из набора степеней на C в L, которая соблюдает порядок Ω на ( C ): инструменты исчисления отношений , включая композицию отношений , используются для выражения этого уважения:

  μ принимает пустое подмножество ( С ) до наименьшего элемента L , и принимает C до наибольшего элемента L .

Шмидт сравнивает μ с функцией убеждений Шафера, а также рассматривает метод объединения мер, обобщающий подход Демпстера (когда новое свидетельство сочетается с ранее имевшимся свидетельством). Он также вводит реляционный интеграл и сравнивает его с интегралом Шока и Сугенен интегралом . Любое отношение m между C и L может быть введено как «прямая оценка», а затем обработано с помощью исчисления отношений для получения меры возможности μ.

Смотрите также

использованная литература

дальнейшее чтение

внешние ссылки