Метод статистического анализа
В статистике , байесовская линейная регрессия является подходом к линейной регрессии , в которой статистический анализ осуществляется в контексте вывода байесовского . Когда в регрессионной модели есть ошибки, которые имеют нормальное распределение , и если предполагается конкретная форма априорного распределения , доступны явные результаты для апостериорных вероятностных распределений параметров модели.
Настройка модели
Рассмотрим стандартную линейную регрессионную задачу, в которой для нас указать среднее значение условного распределения в данном виде предиктора :
где - вектор, а - независимые и одинаково нормально распределенные случайные величины:
Это соответствует следующей функции правдоподобия :
Обычным методом наименьших квадратов раствор используют для оценки вектора коэффициентов с использованием Псевдообращение Мура-Пенроуза :
где - матрица плана , каждая строка которой является вектором предиктора ; и является столбцом -вектором .
Это частотный подход, и он предполагает, что существует достаточно измерений, чтобы сказать что-то значимое . В байесовском подходе данные дополняются дополнительной информацией в виде априорного распределения вероятностей . Априорное мнение о параметрах комбинируется с функцией правдоподобия данных в соответствии с теоремой Байеса, чтобы получить апостериорное представление о параметрах и . Предварительная информация может принимать различные функциональные формы в зависимости от предметной области и информации, которая доступна априори .
С сопряженными приорами
Сопряженное предварительное распределение
Для произвольного априорного распределения может не быть аналитического решения для апостериорного распределения . В этом разделе мы рассмотрим так называемое сопряженное априорное распределение, для которого апостериорное распределение может быть получено аналитически.
Предшествующая является сопряженной к этой функции правдоподобия , если она имеет такую же функциональную форму по отношению к и . Поскольку логарифм правдоподобия квадратичен по , логарифм правдоподобия переписывается так, что правдоподобие становится нормальным в . Писать
Вероятность теперь переписывается как
где
где - количество коэффициентов регрессии.
Это предполагает форму для приора:
где - обратное гамма-распределение
В обозначениях, введенных в статье об обратном гамма-распределении , это плотность распределения с и с и в качестве предшествующих значений и , соответственно. Эквивалентно, это также может быть описано как масштабированное обратное распределение хи-квадрат ,
Кроме того, условная априорная плотность - это нормальное распределение ,
В обозначениях нормального распределения условное априорное распределение имеет вид
Заднее распространение
С указанием предыдущего момента апостериорное распределение может быть выражено как
При некоторой перекомпоновке апостериорное значение можно переписать так, чтобы апостериорное среднее вектора параметров можно было выразить в терминах оценщика наименьших квадратов и априорного среднего , с силой априорного значения, обозначенной матрицей априорной точности.
Чтобы подтвердить, что это действительно апостериорное среднее значение, квадратичные члены в экспоненте могут быть преобразованы в квадратичную форму в .
Теперь апостериорное распределение можно выразить как нормальное распределение, умноженное на обратное гамма-распределение :
Следовательно, апостериорное распределение можно параметризовать следующим образом.
где два фактора соответствуют плотностям и распределениям, параметры которых задаются выражением
Это можно интерпретировать как байесовское обучение, при котором параметры обновляются в соответствии со следующими уравнениями.
Типовое свидетельство
Модель доказательства есть вероятность данных , приведенных в модели . Он также известен как предельное правдоподобие и как априорная прогнозируемая плотность . Здесь, модель определяется с помощью функции правдоподобия и априорного распределения по параметрам, то есть . Свидетельства модели фиксируют одним числом, насколько хорошо такая модель объясняет наблюдения. Модельные доказательства модели байесовской линейной регрессии, представленные в этом разделе, могут быть использованы для сравнения конкурирующих линейных моделей путем сравнения байесовских моделей . Эти модели могут различаться по количеству и значениям переменных-предикторов, а также по своим априорным значениям для параметров модели. Сложность модели уже учтена в свидетельстве модели, потому что она исключает параметры путем интегрирования по всем возможным значениям и .
Этот интеграл можно вычислить аналитически, и решение дается в следующем уравнении.
Здесь обозначает гамма-функцию . Поскольку мы выбрали сопряженный априор, предельное правдоподобие также можно легко вычислить, оценив следующее равенство для произвольных значений и .
Обратите внимание, что это уравнение - не что иное, как перестановка теоремы Байеса . Вставка формул для априорного, вероятностного и апостериорного выражений и упрощение результирующего выражения приводит к аналитическому выражению, приведенному выше.
Другие случаи
В общем, аналитический вывод апостериорного распределения может оказаться невозможным или непрактичным. Однако можно аппроксимировать апостериорную оценку с помощью приближенного метода байесовского вывода, такого как выборка Монте-Карло или вариационный байесовский метод .
Частный случай называется регрессией гребня .
Аналогичный анализ может быть выполнен для общего случая многомерной регрессии, и частично он обеспечивает байесовскую оценку ковариационных матриц : см. Байесовскую многомерную линейную регрессию .
Смотрите также
Заметки
Рекомендации
-
Коробка, ГЭП ; Тяо, GC (1973). Байесовский вывод в статистическом анализе . Вайли. ISBN 0-471-57428-7 .
-
Карлин, Брэдли П.; Луи, Томас А. (2008). Байесовские методы анализа данных, третье издание . Бока-Ратон, Флорида: Чепмен и Холл / CRC. ISBN 1-58488-697-8 .
-
Fahrmeir, L .; Кнейб, Т .; Ланг, С. (2009). Регресс. Modelle, Methoden und Anwendungen (второе изд.). Гейдельберг: Springer. DOI : 10.1007 / 978-3-642-01837-4 . ISBN 978-3-642-01836-7 .
-
Форнальски KW; Парзыч Г .; Пылак М .; Satuła D .; Добжиньский Л. (2010). «Применение байесовских рассуждений и метода максимальной энтропии к некоторым задачам реконструкции» . Acta Physica Polonica . 117 (6): 892–899. DOI : 10.12693 / APhysPolA.117.892 .
-
Форнальский, Кшиштоф В. (2015). «Приложения надежного байесовского регрессионного анализа». Международный журнал науки о системах общества . 7 (4): 314–333. DOI : 10.1504 / IJSSS.2015.073223 .
-
Гельман, Андрей ; Карлин, Джон Б.; Стерн, Хэл С .; Рубин, Дональд Б. (2003). Байесовский анализ данных, второе издание . Бока-Ратон, Флорида: Чепмен и Холл / CRC. ISBN 1-58488-388-X .
-
Гольдштейн, Майкл; Wooff, Дэвид (2007). Линейная статистика, теория и методы Байеса . Вайли. ISBN 978-0-470-01562-9 .
- Минка, Томас П. (2001) Байесовская линейная регрессия , веб-страница исследования Microsoft
-
Росси, Питер Э .; Алленби, Грег М .; Маккалок, Роберт (2006). Байесовская статистика и маркетинг . Джон Вили и сыновья. ISBN 0470863676 .
-
О'Хаган, Энтони (1994). Байесовский вывод . Продвинутая теория статистики Кендалла. 2Б (Первое изд.). Холстед. ISBN 0-340-52922-9 .
-
Сивия, DS; Скиллинг, Дж. (2006). Анализ данных - байесовское руководство (второе изд.). Издательство Оксфордского университета.
-
Вальтер, Геро; Августин, Томас (2009). «Байесовская линейная регрессия - различные сопряженные модели и их (не) чувствительность к конфликту предшествующих данных» (PDF) . Технический отчет № 069, Статистический факультет Мюнхенского университета .
Внешние ссылки