Структурная функция Колмогорова - Kolmogorov structure function

В 1973 году Колмогоров предложил не вероятностный подход к статистике и выбору моделей. Пусть каждый элемент данных представляет собой конечную двоичную строку, а модель - конечный набор двоичных строк. Рассмотрим классы моделей, состоящие из моделей заданной максимальной колмогоровской сложности . Структура Колмогоров функция отдельной строки данных выражает соотношение между ограничением уровня сложности на классе модели и наименее лог-мощности модели в классе , содержащем данные. Структурная функция определяет все стохастические свойства отдельной строки данных: для каждого ограниченного класса модели она определяет индивидуальную наиболее подходящую модель в классе независимо от того, находится ли истинная модель в рассматриваемом классе модели или нет. В классическом случае мы говорим о наборе данных с распределением вероятностей, а свойства - это те, которые соответствуют ожиданиям. Напротив, здесь мы имеем дело с отдельными строками данных и свойствами отдельной строки, на которой сосредоточено внимание. В этом случае свойство выполняется с уверенностью, а не с высокой вероятностью, как в классическом случае. Структурная функция Колмогорова точно определяет степень согласия отдельной модели по отношению к отдельным данным.

Структурная функция Колмогорова используется в алгоритмической теории информации , также известной как теория сложности Колмогорова, для описания структуры струны с использованием моделей возрастающей сложности.

Колмогоровское определение

Колмогоров (слева) рассказывает о структурной функции (см. Рисунок на доске) в ( Таллинн , 1973).

Структурная функция была первоначально предложена Колмогоровым в 1973 году на симпозиуме по советской теории информации в Таллинне, но эти результаты не были опубликованы с. 182. Но результаты были объявлены в 1974 году, это единственная письменная запись самого Колмогорова. Одно из его последних научных высказываний (перевод с русского оригинала Л.А. Левина):

Каждому конструктивному объекту соответствует функция натурального числа k - журнал минимальной мощности x-содержащих множеств, которые позволяют определять сложность не выше k. Если сам элемент x допускает простое определение, то функция падает до 0 даже при малых k. Без такого определения элемент является «случайным» в отрицательном смысле. Но это положительно «вероятностно случайное» только тогда, когда функция, приняв значение относительно небольшого , затем изменяется примерно как .

-  Колмогоров , цитируемое выше объявление.

Современное определение

Это обсуждается в Обложке и Томасе. Он широко изучен в Верещагине и Витани, где также решены основные свойства. Структурную функцию Колмогорова можно записать как

где двоичная строка длины с , где находится рассматриваемая модель (набор строк н-Length) для , является Колмогоров сложностью из и является неотрицательным целым числом , ограничивающее сложности предполагается «с. Очевидно, что эта функция возрастает и достигает для где есть необходимое количество бит для изменения INTO и является Колмогоров сложностью из .

Алгоритмическая достаточная статистика

Определим набор, содержащий такие, что

.

Функция никогда не убывает больше, чем фиксированная независимая константа ниже диагонали, называемой линией достаточности L, определяемой формулой

.

К нему с точностью до постоянного расстояния приближается график для определенных аргументов (например, для ). Для них у нас есть и связанная модель (свидетель для ) называется оптимальным набором для , и поэтому ее описание битов является алгоритмически достаточной статистикой . Мы условно пишем "алгоритмическую" для "колмогоровской сложности". Основные свойства алгоритмической достаточной статистики следующие: если - алгоритмическая достаточная статистика для , то

.

Таким образом, описание использования модели из двух частей и в качестве кода преобразования данных в модель с индексом в перечислении в битах столь же кратко, как и кратчайший код из одной части в битах. Это легко увидеть следующим образом:

,
Структурные функции

используя простые неравенства и свойство достаточности, мы находим это . (Например, если мы можем описать само-delimitingly (вы можете определить его конец) в битах.) Таким образом, дефект случайности из в является постоянной, что означает , что является типичным (случайным образом ) элемент S. Тем не менее, существует могут быть модели, содержащие недостаточную статистику. Алгоритмическая достаточная статистика для имеет дополнительное свойство, помимо того, что она является моделью наилучшего соответствия, что и, следовательно, в силу симметрии колмогоровской сложности информации (информация о in примерно такая же, как информация о in x), мы имеем : алгоритмическую Достаточная статистика - это модель наилучшего соответствия, которая почти полностью определяется . ( является самой короткой программой для .) Алгоритмическая достаточная статистика, связанная с наименьшей таковой , называется алгоритмической минимальной достаточной статистикой .

Что касается рисунка: структурная функция MDL объясняется ниже. Структурная функция согласия является наименьшим недостатком случайности (см. Выше) любой модели для такой, что . Эта структурная функция дает степень согласия модели (содержащей x) для строки x. Когда он низкий, модель подходит хорошо, а когда высокий - модель не подходит. Если для некоторых, то существует типовая модель для такой, что и является типичной (случайной) для S. То есть, это наиболее подходящая модель для x. Подробнее см. И особенно и.

Подбор недвижимости

В рамках ограничений, что график спускается вниз под углом не менее 45 градусов, что он начинается в n и заканчивается примерно в , каждый граф (до аддитивного члена в аргументе и значении) реализуется структурной функцией некоторых данных x и наоборот. Если график первым попадает в диагональ, аргумент (сложность) - это минимально достаточная статистика. Невозможно определить это место. Видеть.

Основное свойство

Доказано, что на каждом уровне сложности структурная функция позволяет выбрать лучшую модель для отдельной строки x в пределах полосы с уверенностью, а не с большой вероятностью.

Вариант MDL

Функция минимальной длины описания (MDL): длина минимального двухчастного кода для x, состоящего из стоимости модели K (S) и длины индекса x в S, в модельном классе множеств данного максимального Колмогорова. сложность , сложность S, ограниченная сверху , задается функцией MDL или ограниченной оценкой MDL:

где - общая длина двухчастного кода x с помощью модели S.

Основное свойство

Доказано, что на каждом уровне сложности структурная функция позволяет выбрать лучшую модель S для отдельной строки x в пределах полосы с достоверностью, а не с большой вероятностью.

Применение в статистике

Разработанная выше математика была взята за основу MDL его изобретателем Йормой Риссаненом .

Вероятностные модели

Для любого вычислимого распределения вероятностей можно доказать, что

.

Например, если есть некоторое вычислимое распределение на множестве строк длины , то каждая имеет вероятность . Структурная функция Колмогорова принимает вид

где х представляет собой бинарная строка длины п с , где находится рассматриваемая модель (вычислима вероятность -длина строк) для , является Колмогоров сложностью из и представляет собой целое значение , ограничивающее сложность предусматриваемых -х гг. Очевидно, что эта функция не возрастает и достигает для где с необходимым количеством бит к изменению во и является Колмогоров сложностью из . Тогда . Для каждого уровня сложности функция является версией максимального правдоподобия (ML) по Колмогорову .

Основное свойство

Доказано, что на каждом уровне сложности структурная функция позволяет выбрать лучшую модель для отдельной строки в пределах полосы с уверенностью, а не с большой вероятностью.

Вариант MDL и вероятностные модели

Функция MDL: длина минимального двухчастного кода для x, состоящего из стоимости модели K (P) и длины в модельном классе вычислимых функций вероятности и массы заданной максимальной колмогоровской сложности сложности P, ограниченной сверху by , задается функцией MDL или оценкой MDL с ограничениями:

где - общая длина двухчастного кода x с помощью модели P.

Основное свойство

Доказано, что на каждом уровне сложности функция MDL позволяет выбрать лучшую модель P для отдельной строки x в пределах полосы с определенностью, а не с большой вероятностью.

Расширение для оценки искажений и шумоподавления

Оказывается, что подход может быть расширен до теории искажения скорости отдельных конечных последовательностей и шумоподавления отдельных конечных последовательностей с использованием сложности Колмогорова. Эксперименты с использованием реальных компрессорных программ прошли успешно. Здесь предполагается, что для естественных данных колмогоровская сложность не отличается от длины сжатой версии с использованием хорошего компрессора.

Рекомендации

Литература