IP (сложность) - IP (complexity)

В теории сложности вычислений класс IP (который означает «Интерактивное полиномиальное время») - это класс задач, решаемых с помощью интерактивной системы доказательства . Равен классу PSPACE . Результат был закреплен в серии статей: первая, написанная Лундом, Карлоффом, Фортноу и Нисаном, показала, что co-NP имеет несколько интерактивных доказательств с помощью доказывающих устройств; а второй, Шамир, использовал свою технику, чтобы установить, что IP = PSPACE. В результате получился известный пример, когда доказательство не релятивизирует .

Концепция интерактивной системы доказательства была впервые представлена Шафи Голдвассером , Сильвио Микали и Чарльзом Ракоффом в 1985 году. Интерактивная система доказательства состоит из двух машин, доказывающего P , который представляет доказательство того, что данная строка n является членом некоторый язык и верификатор V , который проверяет правильность представленного доказательства. Предполагается, что доказывающая сторона бесконечна в вычислениях и хранении, в то время как верификатор представляет собой вероятностную машину полиномиального времени с доступом к случайной битовой строке, длина которой полиномиальна от размера n . Эти две машины обмениваются полиномиальным числом сообщений p ( n ), и после завершения взаимодействия проверяющий должен решить, присутствует ли n на языке, с вероятностью ошибки только 1/3. (Таким образом, любой язык в BPP находится в IP , с тех пор проверяющий может просто проигнорировать доказывающего и принять решение самостоятельно.)

Общее представление протокола интерактивного доказательства.

Определение

Язык L принадлежит IP, если существуют V , P такие, что для всех Q , w :

Протокол Артура – ​​Мерлина , введенный Ласло Бабаем , аналогичен по своей природе, за исключением того, что количество раундов взаимодействия ограничено константой, а не полиномом.

Goldwasser et al. показали, что протоколы публичных монет , в которых случайные числа, используемые верификатором, предоставляются доказывающему вместе с задачами, не менее мощны, чем протоколы приватных монет. Для воспроизведения эффекта протокола частной монеты требуется не более двух дополнительных раундов взаимодействия. Противоположное включение является простым, потому что проверяющий всегда может отправить проверяющему результаты своих частных подбрасываний монет, что доказывает, что два типа протоколов эквивалентны.

В следующем разделе мы докажем, что IP = PSPACE , важная теорема вычислительной сложности, которая демонстрирует, что интерактивная система доказательства может использоваться для определения того, является ли строка членом языка за полиномиальное время, даже если традиционное доказательство PSPACE может быть экспоненциально длинным.

Подтверждение IP = PSPACE

Доказательство можно разделить на две части: мы покажем, что IPPSPACE и PSPACEIP .

IP ⊆ PSPACE

Чтобы продемонстрировать, что IPPSPACE , мы представляем имитацию интерактивной системы доказательства с помощью машины полиномиального пространства. Теперь мы можем определить:

и для каждого 0 ≤ jp и каждой истории сообщений M j мы индуктивно определяем функцию N M j :

куда:

где Pr r - вероятность, взятая по случайной строке r длины p . Это выражение представляет собой среднее значение N M j + 1 , взвешенное по вероятности того, что проверяющий отправил сообщение m j + 1 .

Возьмем M 0 в качестве пустой последовательности сообщений, здесь мы покажем, что N M 0 может быть вычислено в полиномиальном пространстве, и что N M 0 = Pr [ V принимает w ]. Во-первых, чтобы вычислить N M 0 , алгоритм может рекурсивно вычислить значения N M j для каждого j и M j . Поскольку глубина рекурсии равна p , необходимо только полиномиальное пространство. Второе требование состоит в том, что нам нужно N M 0 = Pr [ V принимает w ], значение, необходимое для определения того, входит ли w в A. Мы используем индукцию, чтобы доказать это следующим образом.

Мы должны показать, что для любого 0 ≤ jp и любого M j , N M j = Pr [ V принимает w, начиная с M j ], и мы сделаем это, используя индукцию по j . Базовый случай - доказать для j = p . Затем мы воспользуемся индукцией, чтобы перейти от p к 0.

Базовый случай j = p довольно прост. Поскольку m p принимает или отклоняет, если m p принимает, N M p определяется как 1, а Pr [ V принимает w, начиная с M j ] = 1, поскольку поток сообщений указывает принятие, таким образом, утверждение истинно. Если m p отклонено, аргумент очень похож.

Для индуктивной гипотезы мы предполагаем, что для некоторого j +1 ≤ p и любой последовательности сообщений M j + 1 , N M j + 1 = Pr [ V принимает w, начиная с M j + 1 ], а затем докажем гипотезу для j и любая последовательность сообщений M j .

Если J четно, т J + 1 является сообщение от V к Р . По определению N M j ,

Тогда по предположению индукции мы можем сказать, что это равно

Наконец, по определению мы видим, что это равно Pr [ V принимает w, начиная с M j ].

Если J нечетно, т J + 1 является сообщение от P до V . По определению,

Тогда по предположению индукции это равно

Это равно Pr [ V принимает w, начиная с M j ], поскольку:

потому что доказывающий с правой стороны может отправить сообщение m j + 1, чтобы максимизировать выражение с левой стороны. А также:

Поскольку один и тот же Прувер не может сделать ничего лучше, чем отправить то же сообщение. Таким образом, это верно независимо от того, четно или нечетно i, и доказательство того, что IPPSPACE , завершено.

Здесь мы построили полиномиальное пространство машины , которая использует лучший Доказывающий P для конкретной строки ш в языке А . Мы используем эту лучшую доказывающую программу вместо доказывающей со случайными входными битами, потому что мы можем опробовать каждый набор случайных входных битов в полиномиальном пространстве. Поскольку мы смоделировали интерактивную систему доказательства с помощью машины с полиномиальным пространством, мы показали, что IPPSPACE , как и требовалось.

PSPACE ⊆ IP

Чтобы проиллюстрировать технику, которая будет использоваться для доказательства PSPACEIP , мы сначала докажем более слабую теорему, которая была доказана Лундом и др.: #SAT ∈ IP . Затем, используя концепции этого доказательства, мы расширим его, чтобы показать, что TQBF ∈ IP . Поскольку TQBF ∈ PSPACE -полный и TQBF ∈ IP, то PSPACEIP .

#SAT является членом IP

Начнем с того, что покажем, что #SAT находится в IP , где:

Обратите внимание, что это отличается от обычного определения #SAT тем , что это проблема решения, а не функция.

Сначала мы используем арифметизацию, чтобы отобразить булеву формулу с n переменными, φ ( b 1 , ..., b n ) в многочлен p φ ( x 1 , ..., x n ), где p φ имитирует φ в этом p φ равно 1, если φ истинно, и 0 в противном случае, если переменным p φ присвоены логические значения. Булевы операции ∨, ∧ и ¬, используемые в φ, моделируются в p φ путем замены операторов в φ, как показано в таблице ниже.

аб ab
аб ab  : = 1 - (1 - a ) (1 - b )
¬ а 1 - а
Правила арифметизации для преобразования булевой формулы φ ( b 1 , ..., b n ) в полином p φ ( x 1 , ..., x n )

Например, φ = a ∧ ( b ∨ ¬ c ) можно преобразовать в полином следующим образом:

Каждая из операций ab и ab приводит к многочлену со степенью, ограниченной суммой степеней многочленов для a и b, и, следовательно, степень любой переменной не больше длины φ.

Пусть теперь F - конечное поле порядка q > 2 n ; также требуйте, чтобы q было не менее 1000. Для каждого 0 ≤ in определите функцию f i на F , имеющую параметры , и единственную переменную a i в F : для 0 ≤ in и для let

Обратите внимание, что значение f 0 - это количество удовлетворяющих присвоений φ. f 0 - это функция void без переменных.

Теперь протокол для #SAT работает следующим образом:

  • Фаза 0 : Прувер Р выбирает простой д > 2 п и вычисляет F 0 , затем он посылает д и е 0 до верификатора V . V проверяет, что q является простым числом больше max (1000, 2 n ) и что f 0 () = k .
  • Фаза 1 : P отправляет коэффициенты f 1 ( z ) как полином от z. V проверяет, что степень f 1 меньше n и что f 0 = f 1 (0) + f 1 (1). (Если не V отвергает). В теперь посылает случайное число R 1 от F до P .
  • Фаза i : P отправляет коэффициенты в виде полинома от z . V проверяет, что степень f i меньше n и что . (Если не V отвергает). В теперь посылает случайное число г я от F до P .
  • Фаза п + 1 : V оценивает , чтобы сравнить со значением . Если они равны, V принимает, иначе V отклоняет.

Обратите внимание, что это алгоритм публичных монет.

Если φ имеет k удовлетворяющих назначений, очевидно, что V примет. Если φ не имеет k удовлетворяющих назначений, мы предполагаем, что существует доказывающий, который пытается убедить V, что φ действительно имеет k удовлетворяющих назначений. Мы показываем, что это возможно только с малой вероятностью.

Для того, чтобы предотвратить V от отказа в фазе 0, должен послать неправильное значение для P . Затем на этапе 1 необходимо отправить неверный многочлен со свойством, что . Когда V выбирает случайный r 1 для отправки в P ,

Это связано с тем, что многочлен от одной переменной степени не выше d может иметь не более d корней (если он всегда не равен 0). Таким образом, любые два полинома от одной переменной степени не выше d могут быть равны только в d местах. Поскольку | F | > 2 n вероятность того, что r 1 будет одним из этих значений, не больше, если n > 10, или не больше ( n / 1000) ≤ ( n / n 3 ), если n ≤ 10.

Обобщая эту идею для других фаз, мы имеем для каждого 1 ≤ in, если

тогда для r i, выбранного случайным образом из F ,

Есть n фаз, поэтому вероятность того, что повезет, потому что V выберет на каком-то этапе удобное r i , не превышает 1 / n . Таким образом, ни один доказывающий не может заставить проверяющего принять с вероятностью больше 1 / n . Мы также можем видеть из определения, что верификатор V работает за вероятностное полиномиальное время. Таким образом, #SAT ∈ IP .

TQBF является членом IP

Чтобы показать, что PSPACE - это подмножество IP , нам нужно выбрать проблему PSPACE-complete и показать, что она находится в IP . Как только мы это покажем, станет ясно, что PSPACEIP . Продемонстрированная здесь техника доказательства принадлежит Ади Шамиру .

Мы знаем, что TQBF находится в PSPACE-Complete . Итак, пусть ψ будет количественным логическим выражением:

где φ - формула КНФ. Тогда Q i является квантором либо, либо ∀. Теперь f i то же, что и в предыдущем доказательстве, но теперь оно также включает кванторы.

Здесь φ ( a 1 , ..., a i ) - это φ с заменой от 1 до a i на x 1 на x i . Таким образом, f 0 является истинным значением ψ. Чтобы арифметизировать ψ, мы должны использовать следующие правила:

где, как и ранее, мы определяем xy = 1 - (1 -  x ) (1 -  y ).

Используя метод, описанный в #SAT, мы должны столкнуться с проблемой, заключающейся в том, что для любого f i степень результирующего многочлена может удваиваться с каждым квантором. Чтобы предотвратить это, мы должны ввести новый оператор сокращения R, который будет уменьшать степени полинома без изменения их поведения на логических входах.

Итак, теперь, прежде чем арифметизировать, мы вводим новое выражение:

или по-другому:

Теперь для каждого ik определим функцию f i . Мы также определяем многочлен p ( x 1 , ..., x m ), который получается арифметизацией φ. Теперь, чтобы сохранить степень полинома низкой, мы определим f i через f i + 1 :

Теперь мы видим, что операция редукции R не меняет степени многочлена. Также важно видеть, что операция R x не изменяет значение функции на логических входах. Таким образом, f 0 по-прежнему является значением истинности ψ, но значение R x дает результат, линейный по x . Также после любого мы добавляем ψ ′, чтобы уменьшить степень до 1 после арифметизации .

Теперь опишем протокол. Если n - длина ψ, все арифметические операции в протоколе выполняются над полем размером не менее n 4, где n - длина ψ.

  • Фаза 0 : PV : Р посылает F 0 до V . V проверяет, что f 0 = 1, и отклоняет, если нет.
  • Фаза 1 : PV : Р посылает F 1 ( г ) до V . V использует коэффициенты для оценки f 1 (0) и f 1 (1). Затем он проверяет, что степень многочлена не превосходит n и выполняются следующие тождества:
Если что-то не удается, откажитесь.
  • Фаза i : PV : P пересылается как полином от z . r 1 обозначает ранее установленные случайные значения для

V использует коэффициенты для оценки и . Затем он проверяет, что степень полинома не превосходит n и что выполняются следующие тождества:

Если что-то не удается, откажитесь.

VP : V выбирает случайный r из F и отправляет его в P. (Если тогда это r заменяет предыдущее r ).

Перейти к фазе i  + 1, где P должен убедить V, что он прав.

  • Фаза k + 1 : V оценивает . Затем он проверяет , равны ли они, тогда V принимает, иначе V отклоняет.

Это конец описания протокола.

Если ψ истинно, то V примет, когда P следует протоколу. Точно так же, если злонамеренный доказывающий, который лжет, и если ψ ложно, тогда нужно будет лечь на фазе 0 и отправить какое-то значение для f 0 . Если в фазе I , V имеет неправильное значение , то и будет , вероятно , также будет неправильно, и так далее. Вероятность повезти на некотором случайном г самое большее степень полинома , деленному на размер поля: . Протокол проходит через O ( n 2 ) фаз, поэтому вероятность того, что на каком-то этапе вам повезет, составляет ≤ 1 / n . Если никогда не повезет, то V откажется на фазе k +1.

Поскольку теперь мы показали, что и IPPSPACE, и PSPACEIP , мы можем сделать вывод, что IP = PSPACE, как и нужно . Более того, мы показали, что любой IP- алгоритм может рассматриваться как публичная монета, поскольку сокращение от PSPACE к IP обладает этим свойством.

Варианты

Есть несколько вариантов IP, которые немного изменяют определение интерактивной системы доказательства. Мы резюмируем некоторые из наиболее известных здесь.

окунать

Подмножество IP - это детерминированный класс интерактивного доказательства , который подобен IP, но имеет детерминированный верификатор (то есть без случайности). Этот класс равен NP .

Идеальная полнота

Эквивалентное определение IP заменяет условие , что взаимодействие преуспевает с высокой вероятностью на строки в языке с требованием , чтобы он всегда преуспевает:

Этот, казалось бы, более сильный критерий «идеальной полноты» не меняет класс сложности IP , поскольку любому языку с интерактивной системой доказательства может быть предоставлена ​​интерактивная система доказательства с идеальной полнотой.

MIP

В 1988 году Goldwasser et al. создали еще более мощную интерактивную систему доказательства, основанную на IP, под названием MIP, в которой есть два независимых доказывающих. Два доказывающих не могут обмениваться данными после того, как проверяющий начал посылать им сообщения. Так же, как легче определить, лжет ли преступник, если его и его партнера допрашивают в разных комнатах, гораздо проще обнаружить злонамеренного доказывающего, пытающегося обмануть проверяющего, если есть другой доказывающий, с которым он может перепроверить. Фактически, это настолько полезно, что Бабай, Фортноу и Лунд смогли показать, что MIP = NEXPTIME , класс всех задач, решаемых недетерминированной машиной за экспоненциальное время , очень большой класс. Более того, все языки в NP имеют доказательства с нулевым разглашением в системе MIP без каких-либо дополнительных предположений; это известно только для IP, предполагающего существование односторонних функций.

IPP

IPP ( неограниченный IP ) - это вариант IP, в котором мы заменяем верификатор BPP на верификатор PP . Точнее, модифицируем условия полноты и правильности следующим образом:

  • Полнота : если строка находится на языке, честный проверяющий убедится в этом факте с вероятностью не менее 1/2.
  • Правильность : если строка не на языке, ни один проверяющий не сможет убедить честного проверяющего, что она на языке, за исключением случаев, когда вероятность меньше 1/2.

Хотя IPP также равен PSPACE , протоколы IPP ведут себя совершенно иначе, чем IP в отношении оракулов : IPP = PSPACE по отношению ко всем оракулам, а IPPSPACE по отношению почти ко всем оракулам.

QIP

QIP - это версия IP, заменяющаяверификатор BPP на верификатор BQP , где BQP - это класс задач, решаемых квантовыми компьютерами за полиномиальное время. Сообщения состоят из кубитов. В 2009 году Jain, Ji, Upadhyay и Watrous доказали, что QIP также соответствует PSPACE , подразумевая, что это изменение не дает протоколу дополнительных возможностей. Это включает предыдущий результат Китаева и Уотроуса о том, что QIP содержится в EXPTIME, потому что QIP = QIP [3], так что больше трех раундов никогда не требуется.

compIP

В то время как IPP и QIP дают больше возможностей верификатору, система compIP ( конкурентная система подтверждения IP ) ослабляет условие полноты таким образом, что ослабляет доказывающий:

  • Полнота : если строка написана на языке L , честный проверяющий убедится в этом факте с вероятностью не менее 2/3. Кроме того, доказывающий будет делать это в вероятностном полиномиальное время получили доступ к оракулу для языка L .

По сути, это делает доказывающий машину BPP с доступом к оракулу для языка, но только в случае полноты, а не в случае разумности. Идея состоит в том, что если язык входит в состав compIP , то интерактивно доказать его в каком-то смысле так же просто, как принять решение. С помощью оракула проверяющий может легко решить проблему, но его ограниченные возможности значительно затрудняют убеждение проверяющего в чем-либо. Фактически, compIP даже не известно и не предполагается, что он содержит NP .

С другой стороны, такая система может решить некоторые проблемы, которые считались сложными. Как это ни парадоксально, хотя считается, что такая система не может решить все NP , она может легко решить все NP-полные проблемы благодаря самовосстановлению. Это происходит из-за того, что если язык L не является NP- жестким, программа доказательства существенно ограничена в возможностях (поскольку она больше не может решать все проблемы NP с помощью своего оракула).

Кроме того, проблема неизоморфизма графов (которая является классической проблемой в IP ) также находится в compIP , поскольку единственная трудная операция, которую должен выполнить проверяющий, - это проверка изоморфизма, для решения которой он может использовать оракул. Квадратичная неотъемлемость и изоморфизм графов также находятся в compIP . Обратите внимание, что квадратичная неостаточность (QNR), вероятно, является более простой проблемой, чем изоморфизм графов, поскольку QNR находится в UP, пересекающем co-UP .

Примечания

  1. ^ Лунд, С .; Fortnow, L .; Karloff, H .; Нисан, Н. (1990). «Алгебраические методы для интерактивных систем доказательства». Труды [1990] 31-й ежегодный симпозиум по основам информатики . IEEE Comput. Soc. Нажмите: 2–10. DOI : 10.1109 / fscs.1990.89518 . ISBN 0-8186-2082-X.
  2. ^ Шамир, Ади. "Ip = pspace." Журнал ACM 39.4 (1992): 869-877.
  3. ^ Чанг Ричард; и другие. (1994). «Гипотеза случайного оракула неверна». Журнал компьютерных и системных наук . 49 (1): 24–39. DOI : 10.1016 / s0022-0000 (05) 80084-4 .
  4. ^ Furer Мартин, Голдрайх Одед, Мансур Йишай, Sipser Майкл, Zachos Stathis (1989). «О полноте и надежности в интерактивных системах проверки». Достижения в области компьютерных исследований: ежегодное исследование . 5 : 429–442. CiteSeerX  10.1.1.39.9412 .CS1 maint: несколько имен: список авторов ( ссылка )
  5. ^ Р. Чанг, Б. Чор, Одед Гольдрайх, Дж. Хартманис, Дж. Хастад, Д. Ранджан и П. Рохатги. Гипотеза случайного оракула неверна . Журнал компьютерных и системных наук , 49 (1): 24-39. 1994 г.
  6. ^ Дж. Уотроус. PSPACE имеет квантовые интерактивные системы доказательства с постоянным циклом . Труды IEEE FOCS'99 , стр. 112-119. 1999 г.
  7. ^ Рахул Джайн; Чжэнфэн Цзи; Сарвагья Упадхьяй; Джон Уотроус (2009). «QIP = PSPACE». arXiv : 0907.4737 [ квант-ф ].
  8. ^ А. Китаев и Дж. Уотрус. Распараллеливание, усиление и экспоненциальное моделирование во времени квантовых интерактивных систем доказательства . Труды 32-го симпозиума ACM по теории вычислений , стр. 608-617. 2000 г.
  9. Шафи Гольдвассер и Михир Белларе . Сложность решения против поиска . SIAM Journal on Computing , Volume 23, No. 1. Февраль 1994.
  10. ^ Cai JY, Трелфолл RA (2004). «Замечание о квадратичной остаточности и UP ». Письма об обработке информации . 92 (3): 127–131. CiteSeerX  10.1.1.409.1830 . DOI : 10.1016 / j.ipl.2004.06.015 .

использованная литература