Проблема высоты звезды - Star height problem

Проблема высоты звезды в теории формального языка - это вопрос, все ли регулярные языки могут быть выражены с помощью регулярных выражений с ограниченной высотой звезды , то есть с ограниченной глубиной вложенности звезд Клини . В частности, всегда ли достаточна глубина вложенности, равная единице? Если нет, то есть ли алгоритм для определения необходимого количества? Проблема была поднята Эгганом (1963) .

Семейства обычных языков с неограниченной высотой звезды

На первый вопрос был дан отрицательный ответ, когда в 1963 году Эгган привел примеры регулярных языков звездной высоты n для каждого n . Здесь, высота звезды ч ( L ) регулярного язык L определяются как высота минимальной звезды среди всех регулярных выражений , представляющих L . Первые несколько языков, найденные Эгганом (1963) , описаны ниже с помощью регулярного выражения для каждого языка:

Принцип построения этих выражений состоит в том, что выражение получается путем объединения двух копий , соответствующего переименования букв второй копии с использованием новых символов алфавита, объединения результата с другим новым символом алфавита и последующего окружения полученного выражения звездой Клини . Оставшаяся, более трудная часть - доказать, что для не существует эквивалентного регулярного выражения для высоты звезды меньше n ; доказательство приведено в ( Eggan 1963 ).

Однако в примерах Эггана используется большой алфавит размером 2 n -1 для языка с высотой звезды n . Поэтому он спросил, можем ли мы также найти примеры для двоичных алфавитов. Это подтвердилось вскоре после этого Dejean & Schützenberger (1966) . Их примеры можно описать индуктивно определенным семейством регулярных выражений над двоичным алфавитом следующим образом: ср. Саломаа (1981) :

Опять же, требуется строгое доказательство того факта, что оно не допускает эквивалентного регулярного выражения для более низкой высоты звезды. Доказательства даны ( Dejean & Schützenberger 1966 ) и ( Salomaa 1981 ).

Вычисление звездной высоты обычных языков

Напротив, второй вопрос оказался намного сложнее, и этот вопрос стал известной открытой проблемой в теории формального языка на протяжении более двух десятилетий ( Brzozowski 1980 ). В течение многих лет прогресс был незначительным. В языках чистой группы были первым интересным семейством регулярных языков , для которых проблема высоты звезды оказалась разрешимыми ( McNaughton 1967 ). Но общая проблема оставалась открытой более 25 лет, пока ее не разрешил Хасигучи , который в 1988 году опубликовал алгоритм определения высоты звезды на любом регулярном языке. Алгоритм был непрактичным из-за неэлементарной сложности. Чтобы проиллюстрировать огромное потребление ресурсов этим алгоритмом, Ломбарди и Сакарович (2002) приводят некоторые реальные цифры:

[Процедура, описанная Хасигучи] приводит к вычислениям, которые совершенно невозможны даже для очень маленьких примеров. Например, если L принимается автоматом с 4 состояниями с циклической сложностью 3 (и с небольшим моноидом перехода из 10 элементов), то очень низкая миноранта количества языков, которые должны быть проверены с L на равенство:

-  С. Ломбарди и Дж. Сакарович, Звездная высота обратимых языков и универсальных автоматов, LATIN 2002

Обратите внимание, что одно только это число имеет 10 миллиардов нулей, записанное в десятичной системе счисления , и уже намного превышает количество атомов в наблюдаемой Вселенной .

Гораздо более эффективный алгоритм, чем процедура Хасигучи, был разработан Кирстен в 2005 году. Этот алгоритм работает для заданного недетерминированного конечного автомата в качестве входных данных в пространстве двойной экспоненты . Тем не менее, требования к ресурсам этого алгоритма по-прежнему значительно превышают пределы того, что считается практически выполнимым.

Этот алгоритм был оптимизирован и обобщен на деревья Колкомбетом и Лёдингом в 2008 г. ( Colcombet & Löding 2008 ) как часть теории регулярных функций стоимости. Он был реализован в 2017 году в наборе инструментов Stamina.

Смотрите также

Рекомендации

Процитированные работы

дальнейшее чтение