Обратная задача - Inverse problem

Обратная задача в науке процесс вычисления из набора наблюдений на причинные факторы , которые производили их: например, вычисления изображения в рентгеновской компьютерной томографии , восстановления источника в акустике, или вычисления плотности Земли из измерений его гравитационное поле . Это называется обратной задачей, потому что она начинается с последствий, а затем вычисляет причины. Это обратная задача прямой задачи, которая начинается с причин, а затем рассчитывается последствия.

Обратные задачи - одни из самых важных математических задач в науке и математике, потому что они говорят нам о параметрах, которые мы не можем непосредственно наблюдать. Они имеют широкое применение в системной идентификации , оптике , радарах , акустике , теории коммуникации , обработке сигналов , медицинской визуализации , компьютерном зрении , геофизике , океанографии , астрономии , дистанционном зондировании , обработке естественного языка , машинном обучении ,неразрушающий контроль , анализ устойчивости откосов и многие другие области.

История

Начиная со следствий, чтобы обнаружить причины, на протяжении веков физиков интересовали. Исторический пример - вычисления Адамса и Леверье, которые привели к открытию Нептуна по нарушенной траектории Урана . Однако формальное изучение обратных задач началось только в 20 веке.

Один из самых ранних примеров решения обратной задачи был открыт Германом Вейлем и опубликован в 1911 году, описывая асимптотическое поведение собственных значений оператора Лапласа – Бельтрами . Сегодня известный как закон Вейля , его, пожалуй, легче всего понять как ответ на вопрос, можно ли услышать форму барабана . Вейль предположил, что собственные частоты барабана будут связаны с площадью и периметром барабана определенным уравнением, и этот результат улучшили более поздние математики.

Поле обратных задач позже было затронуто на советско - армянский физик Виктор Амбарцумян .

Будучи еще студентом, Амбарцумян досконально изучил теорию строения атома, формирования энергетических уровней, и уравнение Шредингера и его свойство, и , когда он овладел теорию собственных в дифференциальных уравнениях , он указал на очевидную аналогию между дискретными уровнями энергии и собственные значения дифференциальных уравнений. Затем он спросил: можно ли по семейству собственных значений найти форму уравнений, собственными значениями которых они являются? По сути, Амбарцумян рассматривал обратную задачу Штурма – Лиувилля , которая касалась определения уравнений колеблющейся струны. Эта статья была опубликована в 1929 г. в немецком физическом журнале Zeitschrift für Physik и долгое время оставалась в тени. Описывая эту ситуацию по прошествии многих десятилетий, Амбарцумян сказал: «Если астроном опубликует в физическом журнале статью с математическим содержанием, то, скорее всего, с ним произойдет забвение».

Тем не менее, ближе к концу Второй мировой войны эта статья, написанная 20-летним Амбарцумяном, была найдена шведскими математиками и послужила отправной точкой для целой области исследований обратных задач, став основой всей дисциплина.

Затем важные усилия были направлены на «прямое решение» обратной задачи рассеяния, особенно Гельфандом и Левитаном в Советском Союзе. Они предложили аналитический конструктивный метод определения решения. Когда стали доступны компьютеры, некоторые авторы исследовали возможность применения своего подхода к аналогичным задачам, таким как обратная задача в одномерном волновом уравнении. Но быстро выяснилось, что инверсия - нестабильный процесс: шум и ошибки могут быть значительно усилены, что делает прямое решение практически невозможным. Затем, примерно в семидесятых годах, появились методы наименьших квадратов и вероятностный подход, которые оказались очень полезными для определения параметров, задействованных в различных физических системах. Этот подход имел большой успех. В настоящее время обратные задачи также исследуются в областях, не относящихся к физике, таких как химия, экономика и информатика. В конце концов, когда числовые модели станут преобладающими во многих частях общества, мы можем ожидать обратную проблему, связанную с каждой из этих числовых моделей.

Концептуальное понимание

Со времен Ньютона ученые активно пытались моделировать мир. В частности, когда доступна математическая модель (например, закон тяготения Ньютона или уравнение Кулона для электростатики), мы можем предвидеть, учитывая некоторые параметры, которые описывают физическую систему (например, распределение массы или распределение электрических зарядов), поведение системы. Этот подход известен как математическое моделирование, а вышеупомянутые физические параметры называются параметрами модели или просто моделью . Точнее, введем понятие состояния физической системы : это решение уравнения математической модели. В теории оптимального управления эти уравнения называются уравнениями состояния . Во многих ситуациях нас действительно интересует не физическое состояние, а просто его влияние на некоторые объекты (например, влияние гравитационного поля на конкретную планету). Следовательно, мы должны ввести другой оператор, называемый оператором наблюдения , который преобразует состояние физической системы (здесь предсказанное гравитационное поле) в то, что мы хотим наблюдать (здесь движения рассматриваемой планеты). Теперь мы можем представить так называемую прямую задачу , которая состоит из двух шагов:

  • определение состояния системы по физическим параметрам, которые ее описывают
  • применение оператора наблюдения к предполагаемому состоянию системы, чтобы предсказать поведение того, что мы хотим наблюдать.

Это приводит к ввести еще один оператор ( Р означает «вперед») , который отображает параметры модели во , данные , которые модель предсказывает , что является результатом этой двухстадийной процедуры. Оператор называется прямым оператором или прямой картой . В этом подходе мы в основном пытаемся предсказать последствия, зная причины.

В приведенной ниже таблице показано, что Земля рассматривается как физическая система и для различных физических явлений, параметры модели, которые описывают систему, физическая величина, описывающая состояние физической системы, и наблюдения, обычно выполняемые за состоянием системы.

Основные уравнения Параметры модели Состояние физической системы Общие наблюдения над системой
Закон всемирного тяготения Ньютона Распределение массы Гравитационное поле Измерения гравиметрами в разных точках поверхности
Уравнения Максвелла Распределение магнитной восприимчивости Магнитное поле Магнитное поле, измеренное на разных участках поверхности с помощью магнитометров (случай установившегося состояния)
Волновое уравнение Распределение волновых скоростей и плотностей Волновое поле, вызванное искусственными или естественными сейсмическими источниками Скорость частиц измеряется сейсмометрами, расположенными в разных местах на поверхности
Уравнение диффузии Распределение коэффициента диффузии Концентрация рассеиваемого материала как функция пространства и времени Мониторинг этой концентрации измеряется в разных местах

В подходе обратной задачи мы, грубо говоря, пытаемся узнать причины с учетом следствий.

Общая постановка обратной задачи.

Обратная задача - это «обратная» прямой задачи: мы хотим определить параметры модели, которые производят данные, которые являются записанными нами наблюдениями (нижний индекс obs означает «наблюдаемое»). Так что ищем параметры модели такие, что (хотя бы приблизительно)

где прямая карта. Обозначим как количество параметров модели (возможно, бесконечное), так и количество записанных данных. Мы вводим некоторые полезные концепции и соответствующие обозначения, которые будут использоваться ниже:

  • Пространство моделей , обозначенные : в векторном пространстве , натянутом на модельных параметрах; имеет размеры;
  • Пространство данных , обозначенные : если мы проводим измеренные образцы в векторе с компонентами (если наши измерения состоят из функций, является векторным пространством с бесконечными размерами);
  • : отзыв модели ; он состоит из данных, предсказанных моделью ;
  • : изображение прямой карты, это подмножество (но не подпространство, если оно не линейное), состоящее из ответов всех моделей;
  • : несоответствия данных (или остатки), связанные с моделью : они могут быть расположены как вектор, элемент .

Концепция остатков очень важна: в рамках поиска модели, соответствующей данным, их анализ показывает, можно ли рассматривать рассматриваемую модель как реалистичную или нет . Систематические нереалистичные расхождения между данными и ответами модели также показывают, что прямая карта неадекватна и может дать представление об улучшенной прямой карте.

Когда оператор линейный, обратная задача линейна. В противном случае, чаще всего, обратная задача является нелинейной. Кроме того, модели не всегда могут быть описаны конечным числом параметров. Это тот случай, когда мы ищем распределенные параметры (например, распределение волновых скоростей): в таких случаях цель обратной задачи - получить одну или несколько функций. Такие обратные задачи являются обратными задачами бесконечной размерности.

Линейные обратные задачи

В случае линейной прямой карты и когда мы имеем дело с конечным числом параметров модели, прямую карту можно записать как линейную систему

где - матрица , характеризующая прямую карту.

Элементарный пример: гравитационное поле Земли.

Лишь несколько физических систем действительно линейны по отношению к параметрам модели. Одна из таких геофизических систем - это система гравитационного поля Земли . Гравитационное поле Земли определяется распределением плотности Земли в недрах. Поскольку литология Земли меняется довольно значительно, мы можем наблюдать мельчайшие различия в гравитационном поле Земли на поверхности Земли. Из нашего понимания гравитации (закона всемирного тяготения Ньютона) мы знаем, что математическое выражение гравитации выглядит следующим образом:

здесь - мера местного гравитационного ускорения, - это универсальная гравитационная постоянная , - это местная масса (которая связана с плотностью) породы в недрах и - это расстояние от массы до точки наблюдения.

Дискретизируя вышеприведенное выражение, мы можем связать дискретные данные наблюдений на поверхности Земли с параметрами дискретной модели (плотностью) в геологической среде, о которых мы хотим узнать больше. Например, рассмотрим случай, когда у нас есть измерения, проводимые в 5 точках на поверхности Земли. В этом случае наш вектор данных представляет собой вектор-столбец размерности (5x1): его th компонент связан с th местоположением наблюдения. Мы также знаем, что у нас есть только пять неизвестных масс под поверхностью (нереалистично, но использовалось для демонстрации концепции) с известным местоположением: мы обозначаем расстояние между th местом наблюдения и th массой. Таким образом, мы можем построить линейную систему, связывающую пять неизвестных масс с пятью точками данных, следующим образом:

Чтобы найти параметры модели, которые соответствуют нашим данным, мы могли бы инвертировать матрицу, чтобы напрямую преобразовать измерения в параметры нашей модели. Например:

Система с пятью уравнениями и пятью неизвестными - это очень специфическая ситуация: наш пример был разработан для того, чтобы в конечном итоге получить эту специфику. Как правило, количество данных и неизвестных различается, поэтому матрица не является квадратной.

Однако даже квадратная матрица не может иметь обратного: матрица может иметь недостаточный ранг (т.е. иметь нулевые собственные значения), и решение системы не является единственным. Тогда решение обратной задачи будет неопределенным. Это первая трудность. У чрезмерно определенных систем (больше уравнений, чем неизвестных) есть другие проблемы. Также шум может исказить наши наблюдения, возможно, вне пространства возможных ответов на параметры модели, так что решение системы может не существовать. Это еще одна трудность.

Инструменты для преодоления первой трудности

Первая трудность отражает серьезную проблему: наши наблюдения не содержат достаточно информации, и требуются дополнительные данные. Дополнительные данные могут поступать из физической априорной информации о значениях параметров, об их пространственном распределении или, в более общем плане, об их взаимной зависимости. Это также может происходить из других экспериментов: например, мы можем подумать об объединении данных, записанных гравиметрами и сейсмографами, для лучшей оценки плотности. Интеграция этой дополнительной информации - это в основном задача статистики . Эта дисциплина - та, которая может ответить на вопрос: как смешивать количества разной природы? Мы будем более точными в разделе «Байесовский подход» ниже.

Что касается распределенных параметров, априорная информация об их пространственном распределении часто состоит из информации о некоторых производных этих распределенных параметров. Кроме того, обычной практикой, хотя и несколько искусственной, является поиск «простейшей» модели, которая в разумных пределах соответствует данным. Обычно это достигается штрафом за норму градиента (или полное изменение ) параметров (этот подход также называется максимизацией энтропии). Можно также упростить модель с помощью параметризации, которая вводит степени свободы только при необходимости.

Дополнительная информация также может быть интегрирована через ограничения неравенства на параметры модели или некоторые их функции. Такие ограничения важны, чтобы избежать нереалистичных значений параметров (например, отрицательных значений). В этом случае пространство, охватываемое параметрами модели, больше не будет векторным пространством, а будет подмножеством допустимых моделей, обозначенных в дальнейшем.

Инструменты для преодоления второй трудности

Как упоминалось выше, шум может быть таким, что наши измерения не являются изображением какой-либо модели, поэтому мы не можем искать модель, которая производит данные, а скорее искать лучшую (или оптимальную) модель : то есть ту, которая лучше всего совпадает с данными. Это заставляет нас минимизировать целевую функцию , а именно функционал, который количественно определяет, насколько велики остатки или насколько далеко прогнозируемые данные от наблюдаемых данных. Конечно, когда у нас есть идеальные данные (то есть без шума), восстановленная модель должна идеально соответствовать наблюдаемым данным. Стандартная целевая функция имеет вид:

где - евклидова норма (она будет нормой, когда измерения являются функциями, а не выборками) остатков. Этот подход сводится к использованию обычного метода наименьших квадратов , широко используемого в статистике. Однако известно, что евклидова норма очень чувствительна к выбросам: чтобы избежать этой трудности, мы можем подумать об использовании других расстояний, например нормы, вместо нормы.

Байесовский подход

Вероятностный подход очень похож на подход наименьших квадратов: если мы знаем статистику шума, загрязняющего данные, мы можем подумать о поиске наиболее вероятной модели m, которая соответствует критерию максимального правдоподобия . Если шум является гауссовским , критерий максимального правдоподобия появляется как критерий наименьших квадратов, а евклидово скалярное произведение в пространстве данных заменяется скалярным произведением, включающим ковариацию шума. Кроме того, если будет доступна априорная информация о параметрах модели, мы могли бы подумать об использовании байесовского вывода для формулирования решения обратной задачи. Этот подход подробно описан в книге Тарантолы.

Численное решение нашего простейшего примера

Здесь мы используем евклидову норму для количественной оценки несоответствия данных. Поскольку мы имеем дело с линейной обратной задачей, целевая функция является квадратичной. Для его минимизации классическим является вычисление его градиента, используя то же логическое обоснование (как если бы мы минимизировали функцию только одной переменной). В оптимальной модели этот градиент исчезает, что можно записать как:

где Р Т обозначает транспонированную матрицу из F . Это уравнение упрощается до:

Это выражение известно как нормальное уравнение и дает нам возможное решение обратной задачи. В нашем примере матрица , как правило, имеет полный ранг, так что приведенное выше уравнение имеет смысл и однозначно определяет параметры модели: нам не нужно интегрировать дополнительную информацию для получения уникального решения.

Математические и вычислительные аспекты

Обратные задачи обычно некорректны, в отличие от корректных задач, которые обычно встречаются при математическом моделировании. Из трех условий корректной задачи, предложенных Жаком Адамаром (существование, единственность и устойчивость решения или решений), чаще всего нарушается условие устойчивости. В смысле функционального анализа обратная задача представлена ​​отображением между метрическими пространствами . В то время как обратные задачи часто формулируются в бесконечномерных пространствах, ограничения на конечное число измерений и практическое рассмотрение восстановления только конечного числа неизвестных параметров могут привести к тому, что проблемы будут преобразованы в дискретную форму. В этом случае обратная задача обычно плохо обусловлена . В этих случаях можно использовать регуляризацию для введения умеренных допущений относительно решения и предотвращения переобучения . Многие примеры регуляризованных обратных задач можно интерпретировать как частные случаи байесовского вывода .

Численное решение задачи оптимизации.

Некоторые обратные задачи имеют очень простое решение, например, когда у кого-то есть набор неизвлеченных функций , то есть набор функций, вычисление которых в различных точках дает набор линейно независимых векторов. Это означает, что при линейной комбинации этих функций коэффициенты можно вычислить, расположив векторы как столбцы матрицы и затем инвертируя эту матрицу. Простейший пример неизольвентных функций - это многочлены, построенные с использованием теоремы о неразрешимости так, чтобы быть неизольвентными. Конкретно это делается путем инвертирования матрицы Вандермонда . Но это очень специфическая ситуация.

В общем, решение обратной задачи требует сложных алгоритмов оптимизации. Когда модель описывается большим количеством параметров (количество неизвестных, используемых в некоторых приложениях дифракционной томографии, может достигать одного миллиарда), решение линейной системы, связанной с нормальными уравнениями, может быть обременительным. Численный метод, который будет использоваться для решения задачи оптимизации, зависит, в частности, от затрат, необходимых для вычисления решения прямой задачи. После выбора подходящего алгоритма для решения прямой задачи (простое умножение матрицы на вектор может оказаться неадекватным, если матрица огромна), соответствующий алгоритм для выполнения минимизации можно найти в учебниках, посвященных численным методам решения линейных систем. и для минимизации квадратичных функций (см., например, Ciarlet или Nocedal).

Кроме того, пользователь может пожелать добавить к моделям физические ограничения: в этом случае он должен быть знаком с методами оптимизации с ограничениями , что само по себе является предметом. Во всех случаях вычисление градиента целевой функции часто является ключевым элементом решения задачи оптимизации. Как упоминалось выше, информация о пространственном распределении распределенного параметра может быть введена посредством параметризации. Можно также подумать об адаптации этой параметризации во время оптимизации.

Если целевая функция основана на норме, отличной от евклидовой нормы, мы должны выйти из области квадратичной оптимизации. В результате задача оптимизации усложняется. В частности, когда норма используется для количественной оценки несоответствия данных, целевая функция больше не дифференцируема: ее градиент больше не имеет смысла. Входят специальные методы (см., Например, Lemaréchal) недифференцируемой оптимизации.

После того, как оптимальная модель рассчитана, мы должны ответить на вопрос: «Можем ли мы доверять этой модели?» Вопрос можно сформулировать следующим образом: насколько велик набор моделей, которые соответствуют данным «почти так же хорошо», как эта модель? В случае квадратичных целевых функций этот набор содержится в гиперэллипсоиде, подмножестве ( количество неизвестных), размер которого зависит от того, что мы подразумеваем под словом «почти так же хорошо», то есть от уровня шума. Направление наибольшей оси этого эллипсоида ( собственный вектор, связанный с наименьшим собственным значением матрицы ) - это направление плохо определенных компонентов: если мы будем следовать этому направлению, мы можем внести сильное возмущение в модель без значительного изменения значения цели функция и, таким образом, в итоге получим существенно иную квазиоптимальную модель. Мы ясно видим, что ответ на вопрос «можем ли мы доверять этой модели» определяется уровнем шума и собственными значениями гессиана целевой функции или, что эквивалентно, в случае, когда регуляризация не была интегрирована, сингулярными значениями матрицы . Конечно, использование регуляризации (или других видов априорной информации) уменьшает размер набора почти оптимальных решений и, в свою очередь, увеличивает уверенность, которую мы можем придать вычисленному решению.

Устойчивость, регуляризация и дискретизация модели в бесконечной размерности

Мы сосредоточены здесь на восстановлении распределенного параметра. При поиске распределенных параметров мы должны дискретизировать эти неизвестные функции. Поступая так, мы уменьшаем размер проблемы до чего-то конечного. Но теперь возникает вопрос: есть ли какая-либо связь между решением, которое мы вычисляем, и решением исходной проблемы? Тогда еще вопрос: что мы подразумеваем под решением исходной задачи? Поскольку конечное количество данных не позволяет определить бесконечное количество неизвестных, исходный функционал несоответствия данных должен быть регуляризован, чтобы гарантировать уникальность решения. Во многих случаях сокращение неизвестных до конечномерного пространства обеспечит адекватную регуляризацию: вычисленное решение будет выглядеть как дискретная версия решения, которое мы искали. Например, наивная дискретизация часто срабатывает для решения проблемы деконволюции : она будет работать до тех пор, пока мы не позволим пропущенным частотам появляться в численном решении. Но часто регуляризация должна быть явно интегрирована в целевую функцию.

Чтобы понять, что может произойти, мы должны иметь в виду, что решение такой линейной обратной задачи сводится к решению интегрального уравнения Фредгольма первого рода:

где - ядро, и - векторы , и - область в . Это справедливо для 2D-приложения. Для 3D-приложения мы рассматриваем . Обратите внимание, что здесь параметры модели состоят из функции, и что ответ модели также состоит из функции, обозначенной как . Это уравнение является расширением до бесконечной размерности матричного уравнения, заданного в случае дискретных задач.

Для достаточно гладких операторов, определенных выше, компактны на разумных банаховых пространствах, таких как . Теория Ф. Рисса утверждает, что множество сингулярных значений такого оператора содержит ноль (отсюда и существование нулевого пространства), является конечным или не более чем счетным, и в последнем случае они составляют последовательность, которая стремится к нулю. . В случае симметричного ядра у нас есть бесконечное количество собственных значений, а соответствующие собственные векторы составляют гильбертов базис . Таким образом, любое решение этого уравнения определяется с точностью до аддитивной функции в нулевом пространстве, и в случае бесконечности сингулярных значений решение (которое включает обратную величину произвольных малых собственных значений) является нестабильным: два ингредиента, которые делают решение этого интегрального уравнения - типичная некорректная задача! Однако мы можем определить решение через псевдообратное прямое отображение (снова с точностью до произвольной аддитивной функции). Когда прямое отображение компактно, классическая регуляризация Тихонова будет работать, если мы будем использовать ее для интегрирования априорной информации о том, что норма решения должна быть как можно меньше: это сделает обратную задачу корректной. Тем не менее, как и в случае с конечной размерностью, мы должны подвергнуть сомнению нашу уверенность в вычисленном решении. Опять же, в основном информация заключается в собственных значениях оператора Гессе. Если для вычисления решения исследовать подпространства, содержащие собственные векторы, связанные с небольшими собственными значениями, то этому решению вряд ли можно будет доверять: некоторые из его компонентов будут плохо определены. Наименьшее собственное значение равно весу, введенному в регуляризации Тихонова.

Неправильные ядра могут дать прямое отображение, которое не является компактным и даже неограниченным, если мы наивно снабдим пространство моделей нормой. В таких случаях гессиан не является ограниченным оператором, и понятие собственного значения теряет смысл. Требуется математический анализ, чтобы сделать его ограниченным оператором и разработать хорошо поставленную задачу: иллюстрацию можно найти в. Опять же, мы должны подвергнуть сомнению уверенность, которую мы можем придать вычисленному решению, и должны обобщить понятие собственного значения чтобы получить ответ.

Таким образом, анализ спектра оператора Гессе является ключевым элементом для определения надежности вычисленного решения. Однако такой анализ обычно является очень сложной задачей. Это побудило нескольких авторов исследовать альтернативные подходы в случае, когда нас интересуют не все компоненты неизвестной функции, а только под-неизвестные, которые являются образами неизвестной функции линейным оператором. Эти подходы называют «Бакуса и Гилберта метод», Львов Часовые «s подход, и метод SOLA: эти подходы оказались тесно связаны друг с другом , как описано в Chavent Наконец, концепция ограниченного разрешения , часто вызывается По мнению физиков, это не что иное, как особое мнение о том, что некоторые плохо определенные компоненты могут испортить решение. Но, вообще говоря, эти плохо определенные компоненты модели не обязательно связаны с высокими частотами.

Некоторые классические линейные обратные задачи восстановления распределенных параметров

Упомянутые ниже проблемы соответствуют различным версиям интеграла Фредгольма: каждая из них связана с определенным ядром .

Деконволюция

Цель деконволюции - восстановить исходное изображение или сигнал, которые кажутся зашумленными и размытыми на данных . С математической точки зрения ядро здесь зависит только от разницы между и .

Томографические методы

В этих методах мы пытаемся восстановить распределенный параметр, причем наблюдение состоит в измерении интегралов этого параметра, проводимом вдоль семейства линий. Обозначим линией в этом семействе точку измерения . Таким образом, наблюдение в можно записать как:

где - длина дуги по длине и известная весовая функция. Сравнивая это уравнение с интегралом Фредгольма, приведенным выше, мы замечаем, что ядро является своего рода дельта-функцией, которая достигает максимума на линии . С таким ядром прямое отображение не компактно.

Компьютерная томография

В рентгеновской компьютерной томографии линии, по которым интегрируется параметр, являются прямыми линиями: томографическая реконструкция распределения параметров основана на инверсии преобразования Радона . Хотя с теоретической точки зрения многие линейные обратные задачи хорошо изучены, проблемы, связанные с преобразованием Радона и его обобщениями, по-прежнему представляют собой множество теоретических проблем с нерешенными вопросами достаточности данных. К таким проблемам относятся неполные данные для трехмерного рентгеновского преобразования и проблемы, связанные с обобщением рентгеновского преобразования на тензорные поля. Изученные решения включают в себя метод алгебраической реконструкции , обратную проекцию с фильтрацией и, по мере увеличения вычислительной мощности, итерационные методы реконструкции, такие как итерационная разреженная асимптотическая минимальная дисперсия .

Дифракционная томография

Дифракционная томография - это классическая линейная обратная задача в разведочной сейсмологии: амплитуда, зарегистрированная за один раз для данной пары источник-приемник, представляет собой сумму вкладов, возникающих от таких точек, что сумма расстояний, измеренных во времени пробега, от источника и приемника, соответственно, равно соответствующему времени записи. В 3D параметр интегрируется не по линиям, а по поверхностям. Если скорость распространения постоянна, такие точки располагаются на эллипсоиде. Обратные задачи заключаются в восстановлении распределения точек дифрагирования по сейсмограммам, записанным вдоль съемки, при известном распределении скоростей. Прямое решение было первоначально предложено Бейлкиным и Ламбаре и др.: Эти работы были отправными точками подходов, известных как миграция с сохранением амплитуды (см. Бейлкин и Блейстайн). Если для решения волнового уравнения использовать методы геометрической оптики (т.е. лучи ), эти методы окажутся тесно связанными с так называемыми методами миграции наименьших квадратов, полученными на основе подхода наименьших квадратов (см. Lailly, Tarantola).

Доплеровская томография (астрофизика)

Если мы рассмотрим вращающийся звездный объект, спектральные линии, которые мы можем наблюдать на спектральном профиле, будут смещены из-за эффекта Доплера. Доплеровская томография направлена ​​на преобразование информации, содержащейся в спектральном мониторинге объекта, в двумерное изображение излучения (как функции от лучевой скорости и фазы в периодическом вращательном движении) звездной атмосферы. Как объяснил Марш, эта линейная обратная задача похожа на томографию: мы должны восстановить распределенный параметр, который был интегрирован по линиям, чтобы произвести его эффекты в записях.

Обратная теплопроводность

Ранние публикации по обратной теплопроводности возникли в результате определения поверхностного теплового потока во время входа в атмосферу с помощью датчиков температуры, находящихся под землей. Другие области применения, в которых необходим поверхностный тепловой поток, но поверхностные датчики нецелесообразны, включают: внутри поршневых двигателей, внутри ракетных двигателей; и испытания компонентов ядерного реактора. Для решения проблемы некорректности и чувствительности к ошибке измерения, вызванной затуханием и запаздыванием температурного сигнала, были разработаны различные численные методы.

Нелинейные обратные задачи

Нелинейные обратные задачи представляют собой более сложное семейство обратных задач. Здесь прямое отображение - нелинейный оператор. Моделирование физических явлений часто основывается на решении уравнения в частных производных (см. Таблицу выше, за исключением закона гравитации): хотя эти уравнения в частных производных часто являются линейными, физические параметры, которые появляются в этих уравнениях, зависят нелинейным образом от состояние системы и, следовательно, наши наблюдения за ней.

Некоторые классические нелинейные обратные задачи

Обратные задачи рассеяния

В то время как линейные обратные задачи были полностью решены с теоретической точки зрения в конце девятнадцатого века, только один класс нелинейных обратных задач был таковым до 1970 года: обратные спектральные и (одномерные) обратные задачи рассеяния после основополагающих работы русской математической школы ( Крейн , Гельфанд , Левитан, Марченко ). Большой обзор результатов был дан Чаданом и Сабатье в их книге «Обратные задачи квантовой теории рассеяния» (два издания на английском языке, одно на русском).

В задачах такого типа данные - это свойства спектра линейного оператора, описывающие рассеяние. Спектр состоит из собственных значений и собственных функций , образующих вместе «дискретный спектр», и обобщений, называемых непрерывным спектром. Очень примечательный физический момент состоит в том, что эксперименты по рассеянию дают информацию только о непрерывном спектре и что знание его полного спектра необходимо и достаточно для восстановления оператора рассеяния. Следовательно, у нас есть невидимые параметры, гораздо более интересные, чем нулевое пространство, которое обладает аналогичным свойством в линейных обратных задачах. Кроме того, существуют физические движения, в которых спектр такого оператора сохраняется как следствие такого движения. Это явление регулируется специальными нелинейными уравнениями эволюции в частных производных, например уравнением Кортевега – де Фриза . Если спектр оператора сводится к одному собственному значению, его соответствующее движение будет движением единственной выпуклости, которая распространяется с постоянной скоростью и без деформации, уединенной волны, называемой « солитоном ».

Идеальный сигнал и его обобщения для уравнения Кортевега – де Фриза или других интегрируемых нелинейных уравнений в частных производных представляют большой интерес и имеют множество возможных приложений. Эта область изучается как раздел математической физики с 1970-х годов. Нелинейные обратные задачи в настоящее время также изучаются во многих областях прикладной науки (акустика, механика, квантовая механика, электромагнитное рассеяние - в частности, радиолокационные зондирования, сейсмические зондирования и почти все методы построения изображений).

Последний пример связан с гипотезой Римана был дан В и подрессоренным, идея заключается в том , что в полуклассической старой квантовой теории инверсия потенциала внутри гамильтониана пропорциональна половинной производной счетной функции собственных значений (энергий)  п ( х ).

Согласование проницаемости в нефтяных и газовых коллекторах

Цель состоит в том, чтобы восстановить коэффициент диффузии в параболическом уравнении с частными производными, которое моделирует однофазные потоки жидкости в пористой среде. Эта проблема была объектом многих исследований, начиная с новаторской работы, выполненной в начале семидесятых годов. Что касается двухфазных потоков, важной проблемой является оценка относительной проницаемости и капиллярного давления.

Обратные задачи в волновых уравнениях

Цель состоит в том, чтобы восстановить волновые скорости (продольные и поперечные волны) и распределение плотности по сейсмограммам . Такие обратные задачи представляют первостепенный интерес в сейсмологии. В основном мы можем рассмотреть две математические модели:

Эти основные гиперболические уравнения можно улучшить, добавив затухание , анизотропию и т. Д.

Решение обратной задачи в одномерном волновом уравнении было объектом многих исследований. Это одна из очень немногих нелинейных обратных задач, для которых мы можем доказать единственность решения. Другой проблемой был анализ устойчивости решения. Были разработаны практические приложения с использованием метода наименьших квадратов. Попытки расширения на двумерные или трехмерные задачи и на уравнения эластодинамики предпринимались с 80-х годов, но это оказалось очень трудным! Эта проблема, которую часто называют полной инверсией формы сигнала (FWI), еще не решена полностью: одна из основных трудностей - хаотическое поведение функции несоответствия данных. Некоторые авторы исследовали возможность переформулировать обратную задачу, чтобы сделать целевую функцию менее хаотичной, чем функция несоответствия данных.

Томография во времени

Понимая, насколько сложна обратная задача в волновом уравнении, сейсмологи исследовали упрощенный подход с использованием геометрической оптики. В частности, они были нацелены на инверсию распределения скоростей распространения, зная времена прихода волновых фронтов, наблюдаемых на сейсмограммах. Эти волновые фронты могут быть связаны с прямыми приходами или с отражениями, связанными с отражателями, геометрия которых должна быть определена вместе с распределением скорости.

Распределение времени прихода ( точка в физическом пространстве) волнового фронта, исходящего от точечного источника, удовлетворяет уравнению Эйконала :

где обозначает медленное (обратное скорости) распределение. Наличие делает это уравнение нелинейным. Классически она решается путем выстрела лучей (траектории, время прихода которых стационарно) из точечного источника.

Эта проблема похожа на томографию: измеренные времена прихода являются интегралом вдоль пути луча от медленности. Но эта проблема, подобная томографии, является нелинейной, главным образом потому, что неизвестная геометрия траектории луча зависит от распределения скорости (или медленности). Несмотря на свой нелинейный характер, томография во времени пробега оказалась очень эффективной для определения скорости распространения в Земле или в недрах, причем последний аспект является ключевым элементом для построения сейсмических изображений, в частности, с использованием методов, упомянутых в разделе «Дифракция». томография".

Математические аспекты: вопросы Адамара

Вопросы касаются корректности: имеет ли задача наименьших квадратов единственное решение, которое постоянно зависит от данных (проблема стабильности)? Это первый вопрос, но он также сложен из-за нелинейности . Чтобы увидеть, откуда возникают трудности, Чавент предложил концептуально разделить минимизацию функции несоответствия данных на два последовательных шага ( это подмножество допустимых моделей):

  • шаг проекции: найти проекцию на (ближайшая точка в соответствии с расстоянием, используемым в определении целевой функции)
  • учитывая эту проекцию, найдите один прообраз, который является моделью, изображение которой оператором является этой проекцией.

Трудности могут возникать - и обычно возникают - на обоих этапах:

  1. оператор вряд ли будет однозначным, поэтому может быть более одного прообраза,
  2. даже когда он взаимно однозначен, его обратное не может быть непрерывным ,
  3. проекция на может не существовать, если этот набор не закрыт,
  4. проекция на может быть неединственной и не непрерывной, так как она может быть невыпуклой из-за нелинейности .

Мы обращаемся к Chavent для математического анализа этих моментов.

Вычислительные аспекты

Невыпуклая функция несоответствия данных

Прямая карта является нелинейной, поэтому функция несоответствия данных, вероятно, будет невыпуклой, что сделает методы локальной минимизации неэффективными. Было исследовано несколько подходов к преодолению этой трудности:

  • использование методов глобальной оптимизации, таких как выборка апостериорной функции плотности и алгоритм Метрополиса в вероятностной структуре обратной задачи, генетические алгоритмы (отдельно или в сочетании с алгоритмом Метрополиса: см. приложение для определения проницаемостей, которое соответствует существующим данным проницаемости) , нейронные сети, методы регуляризации, включая многомасштабный анализ;
  • переформулировку целевой функции наименьших квадратов, чтобы сделать ее более гладкой (см. обратную задачу в волновых уравнениях).

Вычисление градиента целевой функции

Обратные задачи, особенно в бесконечном измерении, могут иметь большой размер, что требует значительного вычислительного времени. Когда прямое отображение является нелинейным, вычислительные трудности возрастают, и минимизация целевой функции может быть затруднена. В отличие от линейной ситуации, явное использование матрицы Гессе для решения нормальных уравнений здесь не имеет смысла: матрица Гессе меняется в зависимости от модели. Гораздо более эффективным является оценка градиента целевой функции для некоторых моделей. Значительные вычислительные усилия могут быть сэкономлены, если мы можем избежать очень тяжелого вычисления якобиана (часто называемого « производными Фреше »): метод сопряженных состояний, предложенный Chavent и Lions, направлен на то, чтобы избежать этого очень тяжелого вычисления. Сейчас он очень широко используется.

Приложения

Теория обратной задачи широко используется в прогнозировании погоды, океанографии, гидрологии и нефтяной инженерии.

Обратные задачи также встречаются в области теплопередачи, где поверхностный тепловой поток оценивается исходя из температурных данных, измеренных внутри твердого тела; и в понимании контроля за распадом растительного вещества. Линейная обратная задача также является основой спектральной оценки и оценки направления прихода (DOA) при обработке сигналов .

Смотрите также

Академические журналы

В целом обратные задачи освещаются в четырех основных научных журналах:

  • Обратные задачи
  • Журнал обратных и некорректных задач
  • Обратные задачи в науке и технике
  • Обратные задачи и визуализация

Во многих журналах по медицинской визуализации, геофизике, неразрушающему контролю и т. Д. Преобладают обратные задачи в этих областях.

использованная литература

использованная литература

дальнейшее чтение

  • CW Groetsch (1999). Обратные задачи: занятия для студентов . Издательство Кембриджского университета. ISBN 978-0-88385-716-8.

внешние ссылки