Цепь Маркова с непрерывным временем - Continuous-time Markov chain

Непрерывное время цепь Марков ( СТМС ) представляет собой непрерывный случайный процесс , в котором для каждого состояния, то процесс будет изменяться состояние в соответствии с экспоненциальной случайной величиной , а затем перейти в другое состояние , как определенно с помощью вероятностей стохастической матрицы . Эквивалентная формулировка описывает процесс как изменяющееся состояние в соответствии с наименьшим значением из набора экспоненциальных случайных величин, по одной для каждого возможного состояния, в которое он может перейти, с параметрами, определяемыми текущим состоянием.

Пример CTMC с тремя состояниями следующий: процесс выполняет переход по истечении времени, заданного временем удержания, - экспоненциальной случайной величины , где i - его текущее состояние. Каждая случайная величина независима и такая, что , и . При переходе должно быть сделано, процесс переходит по прыжкам цепи , в дискретном времени цепь Маркова с стохастической матрицы:

Эквивалентно, согласно теории конкурирующих экспонент , этот CTMC меняет состояние из состояния i в соответствии с минимумом двух случайных величин, которые являются независимыми и такими, что для тех случаев, когда параметры задаются Q-матрицей

Каждое недиагональное значение может быть вычислено как произведение времени удержания исходного состояния на вероятность перехода в данное состояние из цепочки скачков. Значения диагонали выбираются так, чтобы сумма каждой строки равнялась 0.

CTMC удовлетворяет свойству Маркова , что его поведение зависит только от его текущего состояния, а не от его поведения в прошлом, из-за отсутствия памяти у экспоненциального распределения и цепей Маркова с дискретным временем.

Определение

Марковская цепь с непрерывным временем ( X t ) t  ≥ 0 определяется следующим образом:

  • конечное или счетное пространство состояний S ;
  • переход скорости матрицы Q с размерами , равной S ; и
  • начальное состояние, такое что , или распределение вероятностей для этого первого состояния.

Для i  ≠  j элементы q ij неотрицательны и описывают скорость переходов процесса из состояния i в состояние j . Элементы q ii могут быть выбраны равными нулю, но для математического удобства общее соглашение состоит в том, чтобы выбирать их так, чтобы каждая строка сумм равнялась нулю, то есть:

Обратите внимание, как это отличается от определения матрицы перехода для дискретных цепей Маркова , где все строчные суммы равны единице.

Есть три других определения процесса, эквивалентных приведенному выше.

Определение вероятности перехода

Другой распространенный способ определения цепей Маркова с непрерывным временем состоит в том, чтобы вместо матрицы скорости перехода использовать следующее:

  • , для , представляющая скорость распада (экспоненциального распределения), в котором система остается в состоянии, когда она входит в нее; и
  • , для , представляющая вероятность перехода системы в состояние при условии, что она в настоящее время выходит из состояния .

Естественно, у всех должен быть ноль .

Значения и тесно связаны с матрицей скорости перехода формулами:

Рассмотрим упорядоченную последовательность моментов времени и состояний, записанных в эти моменты времени , тогда она утверждает, что:

где p ij - решение прямого уравнения ( дифференциального уравнения первого порядка ):

с начальным условием P (0), являющимся единичной матрицей .

Бесконечно малое определение

Марковская цепь с непрерывным временем характеризуется скоростями переходов, производными по времени вероятностей переходов между состояниями i и j.

Пусть будет случайной величиной, описывающей состояние процесса в момент времени t , и предположим, что процесс находится в состоянии i в момент времени t . По определению цепи Маркова с непрерывным временем, не зависит от значений до момента ; то есть не зависит от . Имея это в виду, для всех , для всех и для небольших значений справедливо следующее:

,

где - дельта Кронекера, и были использованы краткие обозначения .

Приведенное выше уравнение показывает , что можно рассматривать как измерения , как быстро переход от к происходит из- за , и как быстро переход от происходит из- за .

Прыжковая цепь / определение времени удержания

Задайте цепь Маркова Y n с дискретным временем для описания n- го скачка процесса и переменные S 1 , S 2 , S 3 , ... для описания времени удержания в каждом из состояний, где S i следует экспоненциальному распределению со скоростью параметр - q Y i Y i .

Свойства

Общение на занятиях

Коммуникационные классы, быстротечность, рекуррентность, положительная и нулевая рекуррентность определяются так же, как для цепей Маркова с дискретным временем .

Переходное поведение

Напишите P ( t ) для матрицы с элементами p ij = P ( X t  =  j  |  X 0  =  i ). Тогда матрица P ( t ) удовлетворяет прямому уравнению - дифференциальному уравнению первого порядка

где штрих означает дифференцирование по t . Решение этого уравнения дается матричной экспонентой

В простом случае, таком как CTMC в пространстве состояний {1,2}. Общая Q- матрица для такого процесса - это следующая матрица 2 × 2 с α , β  > 0

Приведенное выше соотношение для прямой матрицы может быть решено явно в этом случае, чтобы дать

Однако прямые решения для больших матриц сложно вычислить. Тот факт, что Q является генератором полугруппы матриц

используется.

Стационарное распределение

Стационарное распределение для неприводимого рекуррентного CTMC - это распределение вероятностей, к которому процесс сходится при больших значениях t . Заметим, что для рассмотренного ранее процесса с двумя состояниями с P ( t ), заданным формулой

при t  → ∞ распределение стремится к

Обратите внимание, что каждая строка имеет одинаковое распределение, так как это не зависит от начального состояния. Вектор-строку π можно найти, решив

с дополнительным ограничением, что

Пример 1

Направленное графическое представление цепи Маркова с непрерывным временем, описывающей состояние финансовых рынков (примечание: числа выдуманы).

Изображение справа описывает цепь Маркова в непрерывном времени с пространством состояний {бычий рынок, медвежий рынок, застойный рынок} и матрицей скорости перехода.

Стационарное распределение этой цепочки может быть найдено путем решения при условии, что сумма элементов должна быть равна 1, чтобы получить

Пример 2

Граф переходов с вероятностями переходов, примерный для состояний 1, 5, 6 и 8. Между состояниями 2 и 8 существует двунаправленный секретный переход.

Изображение справа описывает цепь Маркова в дискретном времени, моделирующую Pac-Man с пространством состояний {1,2,3,4,5,6,7,8,9}. Игрок управляет Пакманом через лабиринт, поедая пак-точки. Тем временем за ним охотятся призраки. Для удобства лабиринт представляет собой небольшую сетку 3x3, а монстры беспорядочно перемещаются в горизонтальном и вертикальном направлениях. Секретный проход между состояниями 2 и 8 можно использовать в обоих направлениях. Записи с нулевой вероятностью удаляются в следующей матрице скорости перехода:

Эта цепь Маркова неприводима, потому что призраки могут перелететь из любого состояния в любое состояние за конечный промежуток времени. Из-за секретного прохода цепь Маркова также апериодична, потому что монстры могут переходить из любого состояния в любое состояние как при четном, так и при нечетном количестве переходов между состояниями. Следовательно, существует уникальное стационарное распределение, которое может быть найдено путем решения при условии, что сумма элементов должна быть равна 1. Решение этого линейного уравнения с учетом ограничения: Центральное состояние и граничные состояния 2 и 8 смежного секретного переходы посещаются больше всего, а угловые штаты посещаются меньше всего.

Обратное время

Для CTMC X t обратный во времени процесс определяется как . По лемме Келли этот процесс имеет такое же стационарное распределение, что и прямой процесс.

Цепочка называется обратимой, если обратный процесс такой же, как и прямой. Критерий Колмогорова утверждает, что необходимое и достаточное условие для того, чтобы процесс был обратимым, состоит в том, что произведение скоростей перехода по замкнутому контуру должно быть одинаковым в обоих направлениях.

Встроенная цепь Маркова

Один из методов нахождения стационарного распределения вероятностей , л , с концентрацией эргодической непрерывного времени марковской цепи, Q , являются первым нахождением его вложенного марковской цепью (ЭМС) . Строго говоря, EMC - это обычная цепь Маркова с дискретным временем, которую иногда называют скачкообразным процессом . Каждый элемент матрицы вероятности одношагового перехода EMC, S , обозначается s ij и представляет собой условную вероятность перехода из состояния i в состояние j . Эти условные вероятности могут быть найдены

Отсюда S можно записать как

где I - единичная матрица, а diag ( Q ) - диагональная матрица, сформированная путем выбора главной диагонали из матрицы Q и установки всех остальных элементов в ноль.

Чтобы найти вектор стационарного распределения вероятностей, мы должны затем найти такой, что

с вектор-строкой, так что все элементы в больше 0 и = 1. Отсюда π может быть найдено как

( S может быть периодическим, даже если Q - нет. Как только π найдено, его необходимо нормировать на единичный вектор .)

Другой процесс с дискретным временем, который может быть получен из цепи Маркова с непрерывным временем, - это δ-скелет - цепь Маркова (дискретного времени), образованная путем наблюдения X ( t ) с интервалами в δ единиц времени. Случайные величины X (0),  X (δ),  X (2δ), ... задают последовательность состояний, которые посещает δ-скелет.

Смотрите также

Ноты

Рекомендации