Структурная функция Колмогорова - Kolmogorov structure function
В 1973 году Колмогоров предложил не вероятностный подход к статистике и выбору моделей. Пусть каждый элемент данных представляет собой конечную двоичную строку, а модель - конечный набор двоичных строк. Рассмотрим классы моделей, состоящие из моделей заданной максимальной колмогоровской сложности . Структура Колмогоров функция отдельной строки данных выражает соотношение между ограничением уровня сложности на классе модели и наименее лог-мощности модели в классе , содержащем данные. Структурная функция определяет все стохастические свойства отдельной строки данных: для каждого ограниченного класса модели она определяет индивидуальную наиболее подходящую модель в классе независимо от того, находится ли истинная модель в рассматриваемом классе модели или нет. В классическом случае мы говорим о наборе данных с распределением вероятностей, а свойства - это те, которые соответствуют ожиданиям. Напротив, здесь мы имеем дело с отдельными строками данных и свойствами отдельной строки, на которой сосредоточено внимание. В этом случае свойство выполняется с уверенностью, а не с высокой вероятностью, как в классическом случае. Структурная функция Колмогорова точно определяет степень согласия отдельной модели по отношению к отдельным данным.
Структурная функция Колмогорова используется в алгоритмической теории информации , также известной как теория сложности Колмогорова, для описания структуры струны с использованием моделей возрастающей сложности.
Колмогоровское определение
Структурная функция была первоначально предложена Колмогоровым в 1973 году на симпозиуме по советской теории информации в Таллинне, но эти результаты не были опубликованы с. 182. Но результаты были объявлены в 1974 году, это единственная письменная запись самого Колмогорова. Одно из его последних научных высказываний (перевод с русского оригинала Л.А. Левина):
Каждому конструктивному объекту соответствует функция натурального числа k - журнал минимальной мощности x-содержащих множеств, которые позволяют определять сложность не выше k. Если сам элемент x допускает простое определение, то функция падает до 0 даже при малых k. Без такого определения элемент является «случайным» в отрицательном смысле. Но это положительно «вероятностно случайное» только тогда, когда функция, приняв значение относительно небольшого , затем изменяется примерно как .
- Колмогоров , цитируемое выше объявление.
Современное определение
Это обсуждается в Обложке и Томасе. Он широко изучен в Верещагине и Витани, где также решены основные свойства. Структурную функцию Колмогорова можно записать как
где двоичная строка длины с , где находится рассматриваемая модель (набор строк н-Length) для , является Колмогоров сложностью из и является неотрицательным целым числом , ограничивающее сложности предполагается «с. Очевидно, что эта функция возрастает и достигает для где есть необходимое количество бит для изменения INTO и является Колмогоров сложностью из .
Алгоритмическая достаточная статистика
Определим набор, содержащий такие, что
- .
Функция никогда не убывает больше, чем фиксированная независимая константа ниже диагонали, называемой линией достаточности L, определяемой формулой
- .
К нему с точностью до постоянного расстояния приближается график для определенных аргументов (например, для ). Для них у нас есть и связанная модель (свидетель для ) называется оптимальным набором для , и поэтому ее описание битов является алгоритмически достаточной статистикой . Мы условно пишем "алгоритмическую" для "колмогоровской сложности". Основные свойства алгоритмической достаточной статистики следующие: если - алгоритмическая достаточная статистика для , то
- .
Таким образом, описание использования модели из двух частей и в качестве кода преобразования данных в модель с индексом в перечислении в битах столь же кратко, как и кратчайший код из одной части в битах. Это легко увидеть следующим образом:
- ,
используя простые неравенства и свойство достаточности, мы находим это . (Например, если мы можем описать само-delimitingly (вы можете определить его конец) в битах.) Таким образом, дефект случайности из в является постоянной, что означает , что является типичным (случайным образом ) элемент S. Тем не менее, существует могут быть модели, содержащие недостаточную статистику. Алгоритмическая достаточная статистика для имеет дополнительное свойство, помимо того, что она является моделью наилучшего соответствия, что и, следовательно, в силу симметрии колмогоровской сложности информации (информация о in примерно такая же, как информация о in x), мы имеем : алгоритмическую Достаточная статистика - это модель наилучшего соответствия, которая почти полностью определяется . ( является самой короткой программой для .) Алгоритмическая достаточная статистика, связанная с наименьшей таковой , называется алгоритмической минимальной достаточной статистикой .
Что касается рисунка: структурная функция MDL объясняется ниже. Структурная функция согласия является наименьшим недостатком случайности (см. Выше) любой модели для такой, что . Эта структурная функция дает степень согласия модели (содержащей x) для строки x. Когда он низкий, модель подходит хорошо, а когда высокий - модель не подходит. Если для некоторых, то существует типовая модель для такой, что и является типичной (случайной) для S. То есть, это наиболее подходящая модель для x. Подробнее см. И особенно и.
Подбор недвижимости
В рамках ограничений, что график спускается вниз под углом не менее 45 градусов, что он начинается в n и заканчивается примерно в , каждый граф (до аддитивного члена в аргументе и значении) реализуется структурной функцией некоторых данных x и наоборот. Если график первым попадает в диагональ, аргумент (сложность) - это минимально достаточная статистика. Невозможно определить это место. Видеть.
Основное свойство
Доказано, что на каждом уровне сложности структурная функция позволяет выбрать лучшую модель для отдельной строки x в пределах полосы с уверенностью, а не с большой вероятностью.
Вариант MDL
Функция минимальной длины описания (MDL): длина минимального двухчастного кода для x, состоящего из стоимости модели K (S) и длины индекса x в S, в модельном классе множеств данного максимального Колмогорова. сложность , сложность S, ограниченная сверху , задается функцией MDL или ограниченной оценкой MDL:
где - общая длина двухчастного кода x с помощью модели S.
Основное свойство
Доказано, что на каждом уровне сложности структурная функция позволяет выбрать лучшую модель S для отдельной строки x в пределах полосы с достоверностью, а не с большой вероятностью.
Применение в статистике
Разработанная выше математика была взята за основу MDL его изобретателем Йормой Риссаненом .
Вероятностные модели
Для любого вычислимого распределения вероятностей можно доказать, что
- .
Например, если есть некоторое вычислимое распределение на множестве строк длины , то каждая имеет вероятность . Структурная функция Колмогорова принимает вид
где х представляет собой бинарная строка длины п с , где находится рассматриваемая модель (вычислима вероятность -длина строк) для , является Колмогоров сложностью из и представляет собой целое значение , ограничивающее сложность предусматриваемых -х гг. Очевидно, что эта функция не возрастает и достигает для где с необходимым количеством бит к изменению во и является Колмогоров сложностью из . Тогда . Для каждого уровня сложности функция является версией максимального правдоподобия (ML) по Колмогорову .
Основное свойство
Доказано, что на каждом уровне сложности структурная функция позволяет выбрать лучшую модель для отдельной строки в пределах полосы с уверенностью, а не с большой вероятностью.
Вариант MDL и вероятностные модели
Функция MDL: длина минимального двухчастного кода для x, состоящего из стоимости модели K (P) и длины в модельном классе вычислимых функций вероятности и массы заданной максимальной колмогоровской сложности сложности P, ограниченной сверху by , задается функцией MDL или оценкой MDL с ограничениями:
где - общая длина двухчастного кода x с помощью модели P.
Основное свойство
Доказано, что на каждом уровне сложности функция MDL позволяет выбрать лучшую модель P для отдельной строки x в пределах полосы с определенностью, а не с большой вероятностью.
Расширение для оценки искажений и шумоподавления
Оказывается, что подход может быть расширен до теории искажения скорости отдельных конечных последовательностей и шумоподавления отдельных конечных последовательностей с использованием сложности Колмогорова. Эксперименты с использованием реальных компрессорных программ прошли успешно. Здесь предполагается, что для естественных данных колмогоровская сложность не отличается от длины сжатой версии с использованием хорошего компрессора.
Рекомендации
Литература
- Обложка, ТМ; П. Гакс; Р. М. Грей (1989). «Вклад Колмогорова в теорию информации и алгоритмическую сложность» . Анналы вероятности . 17 (3): 840–865. DOI : 10.1214 / AOP / 1176991250 . JSTOR 2244387 .
- Колмогоров, АН; Успенский В.А. (1 января 1987 г.). «Алгоритмы и случайность» . Теория вероятностей и ее приложения . 32 (3): 389–412. DOI : 10.1137 / 1132060 .
- Ли, М., Витани, PMB (2008). Введение в сложность Колмогорова и ее приложения (3-е изд.). Нью-Йорк: Спрингер. ISBN 978-0387339986 . , Особенно стр. 401–431 о структурной функции Колмогорова и стр. 613–629 об искажении скорости и шумоподавлении отдельных последовательностей.
- Шен А. (1 апреля 1999 г.). «Дискуссия о колмогоровской сложности и статистическом анализе». Компьютерный журнал . 42 (4): 340–342. DOI : 10.1093 / comjnl / 42.4.340 .
- Вьюгин, В.В. (1987). «О дефекте случайности конечного объекта относительно мер с заданными границами сложности» . Теория вероятностей и ее приложения . 32 (3): 508–512. DOI : 10.1137 / 1132071 .
- Вьюгин В.В. (1 апреля 1999 г.). «Алгоритмическая сложность и стохастические свойства конечных двоичных последовательностей». Компьютерный журнал . 42 (4): 294–317. DOI : 10.1093 / comjnl / 42.4.294 .