Эхуд Шапиро - Ehud Shapiro

Эхуд Шапиро
וד שפירא פרופיל. Jpg
Родившийся 1955 г.  ( 1955 )
Национальность Израильский
Альма-матер Йель
Научная карьера
Учреждения Институт науки Вейцмана
Тезис Отладка алгоритмической программы   (1982)
Докторант Дана Англуин
Докторанты Авив Регев

Эхуд Шапиро ( иврит : אהוד שפירא ; родился в 1955 г.) - многопрофильный ученый, художник, предприниматель и профессор компьютерных наук и биологии в Институте наук Вейцмана . Имея международную репутацию, он внес фундаментальный вклад во многие научные дисциплины. Эхуд также был пионером Интернета, успешным интернет-предпринимателем, а также пионером и сторонником электронной демократии . Эхуд - основатель Ba Rock Band и задумал ее оригинальную художественную программу. Он является победителем двух передовых грантов ERC ( Европейского исследовательского совета ).

Образование и профессиональная подготовка

Родившийся в Иерусалиме в 1955 году, путеводной звездой для научных усилий Эхуда Шапиро стала научная философия Карла Поппера , с которой он познакомился в рамках школьного проекта под руководством Моше Кроя с факультета философии Тель-Авивского университета. В 1979 году Шаприо с отличием окончил бакалавриат по специальности математика и философия в Тель-Авивском университете . Докторская работа Шапиро с Даной Англуин в области компьютерных наук в Йельском университете была попыткой дать алгоритмическую интерпретацию философского подхода Поппера к научным открытиям , в результате чего была создана компьютерная система для вывода логических теорий из фактов и методология отладки программ , разработанная с использованием язык программирования Пролог . Его диссертация « Алгоритмическая отладка программ » была опубликована MIT Press в 1982 году в качестве выдающейся диссертации ACM, за которой в 1986 году последовал учебник «Искусство пролога» в соавторстве с Леоном Стерлингом.

Придя на факультет информатики и прикладной математики Вейцманнского института науки в 1982 году в качестве постдокторанта, Шапиро был вдохновлен японским проектом компьютерных систем пятого поколения на изобретение языка программирования высокого уровня для параллельных и распределенных компьютерных систем. , названный Concurrent Prolog . В 1987 году MIT Press опубликовала двухтомную книгу по параллельному прологу и связанную с ним работу. Работа Шапиро оказала решающее влияние на стратегическое направление японского национального проекта, и он тесно сотрудничал с проектом на протяжении его 10 лет.

В 1993 году Шапиро взял отпуск с занимаемой должности в Weizmann, чтобы основать Ubique Ltd. (и стать ее генеральным директором), пионера программного обеспечения для Интернета в Израиле. Основываясь на Concurrent Prolog, Ubique разработала «Virtual Places», предшественницу широко используемых сегодня систем мгновенного обмена сообщениями . Ubique была продана America Online в 1995 году, а после выкупа ее руководством в 1997 году была снова продана IBM в 1998 году, где она продолжает развивать SameTime, ведущий продукт IBM для обмена мгновенными сообщениями, основанный на технологии Ubique.

Готовясь к возвращению в академию, Шапиро отважился на самостоятельное изучение молекулярной биологии. Шапиро попытался построить компьютер из биологических молекул, руководствуясь видением «Доктора в клетке»: биомолекулярный компьютер, который работает внутри живого тела, запрограммированный с помощью медицинских знаний для диагностики заболеваний и производства необходимых лекарств. Не имея опыта в молекулярной биологии, Шапиро реализовал свой первый дизайн молекулярного компьютера в виде механического устройства, подобного LEGO, построенного с использованием трехмерной стереолитографии , которое было запатентовано после его возвращения к Вейцману в 1998 году. В течение последних полутора десятилетий лаборатория Шапиро занималась разработкой и успешно реализовали различные молекулярные вычислительные устройства.

В 2004 году профессор Шапиро также разработал эффективный метод синтеза безошибочных молекул ДНК из подверженных ошибкам строительных блоков. В 2011 году профессор Шапиро основал консорциум CADMAD: технологическая платформа CADMAD нацелена на революцию в обработке ДНК, аналогичную революции в редактировании текста, произошедшей с появлением электронных текстовых редакторов.

В 2005 году профессор Шапиро представил видение следующей грандиозной задачи в биологии человека: раскрыть дерево происхождения клеток человека . Внутри каждого из нас есть древо клеточных линий - история роста нашего тела от одной клетки ( оплодотворенной яйцеклетки ) до 100 триллионов клеток. Биологические и биомедицинские последствия такого успеха могут быть аналогичными, если не более значительными, чем влияние проекта «Геном человека» . В своем выступлении на TEDxTel-Aviv «Раскрытие дерева происхождения клеток человека - следующая грандиозная научная задача» профессор Шапиро описал систему и результаты, полученные с ее помощью, а также предложение для флагманского проекта FET «Инициатива флагманских линий человеческих клеток» для раскрытие дерева происхождения клеток человека в состоянии здоровья и болезней.

Индуктивное логическое программирование

Философ науки Карл Поппер предположил, что все научные теории по своей природе являются предположениями и по своей природе подвержены ошибкам, и что опровержение старой теории - это важнейший процесс научного открытия. Согласно философии Поппера, рост научного знания основан на предположениях и опровержениях . Докторантура профессора Шапиро с профессором Даной Англуин попыталась дать алгоритмическую интерпретацию подхода Карла Поппера к научным открытиям  - в частности, для автоматизации метода «догадок и опровержений» - сделав смелые предположения и затем проведя эксперименты, направленные на их опровержение. Профессор Шапиро обобщил это в «Алгоритме поиска противоречий» - алгоритме поиска противоречий. Этот алгоритм применим всякий раз, когда возникает противоречие между предполагаемой теорией и фактами. Проверяя конечное число основных атомов на их истинность в модели, алгоритм может отследить источник этого противоречия, а именно ложную гипотезу, и может продемонстрировать ее ложность, построив контрпример к ней. «Алгоритм обратного отслеживания противоречий» имеет отношение как к философской дискуссии об опровержимости научных теорий, так и для помощи в отладке логических программ. Профессор Шапиро заложил теоретические основы индуктивного логического программирования и построил его первую реализацию (Model Inference System): программу на Прологе, которая индуктивно выводила логические программы из положительных и отрицательных примеров. Индуктивное логическое программирование в настоящее время расцвело как подполе искусственного интеллекта и машинного обучения, которое использует логическое программирование как единое представление для примеров, базовых знаний и гипотез. Недавние работы в этой области, сочетающие логическое программирование, обучение и вероятность, привели к появлению новой области статистического реляционного обучения .

Отладка алгоритмической программы

Отладка программ - неизбежная часть разработки программного обеспечения . До 1980-х годов искусство отладки программ, которым занимался каждый программист, не имело никакой теоретической основы. В начале 1980-х годов были разработаны систематические и принципиальные подходы к отладке программ. Как правило, ошибка возникает, когда программист имеет конкретное намерение относительно того, что программа должна делать, однако фактически написанная программа демонстрирует поведение, отличное от предполагаемого в конкретном случае. Один из способов организации процесса отладки - автоматизировать его (хотя бы частично) с помощью алгоритмической техники отладки. Идея алгоритмической отладки состоит в том, чтобы иметь инструмент, который интерактивно направляет программиста в процессе отладки: он делает это, спрашивая программиста о возможных источниках ошибок. Алгоритмическая отладка была впервые разработана Эхудом Шапиро во время его докторской диссертации в Йельском университете, как это было представлено в его докторской диссертации, выбранной в 1982 году в качестве почетной диссертации ACM. Шапиро реализовал метод алгоритмической отладки на Прологе (языке логического программирования общего назначения) для отладки логических программ . В случае логических программ предполагаемое поведение программы представляет собой модель (набор простых истинных утверждений), а ошибки проявляются как неполнота программы (неспособность доказать истинное утверждение) или неправильность (способность доказать ложное утверждение). Алгоритм идентифицирует ложное утверждение в программе и предоставит контрпример к нему или пропущенное истинное утверждение, что это или его обобщение следует добавить в программу. Также был разработан метод обработки незавершенного действия .

Проект компьютерных систем пятого поколения

Проект компьютерных систем пятого поколения (FGCS) был инициативой Министерства международной торговли и промышленности Японии, начатой ​​в 1982 году, по созданию компьютера, использующего массовые параллельные вычисления / обработку. Это должно было стать результатом масштабного исследовательского проекта правительства / промышленности в Японии в 1980-х годах. Его целью было создание «эпохального компьютера» с производительностью, подобной суперкомпьютеру, и обеспечение платформы для будущих разработок в области искусственного интеллекта. В 1982 году во время посещения ICOT Эхуд Шапиро изобрел Concurrent Prolog , новый язык параллельного программирования, объединяющий логическое программирование и параллельное программирование. Concurrent Prolog - это язык логического программирования, предназначенный для параллельного программирования и параллельного выполнения. Это процессно-ориентированный язык , который воплощает в себе синхронизацию потока данных и неопределенность защищенных команд в качестве основных механизмов управления. Шапиро описал язык в Отчете, обозначенном как Технический отчет ICOT 003, в котором представлен интерпретатор параллельного Пролога, написанный на Прологе. Работа Шапиро над Concurrent Prolog вдохновила на изменение направления FGCS с сосредоточения внимания на параллельной реализации Prolog к фокусированию на параллельном логическом программировании как программной основе проекта. Он также вдохновил Уэда на создание языка параллельного логического программирования Guarded Horn Clauses (GHC), который лег в основу KL1, языка программирования, который, наконец, был разработан и реализован в рамках проекта FGCS в качестве основного языка программирования.

Ubique Ltd.

В 1993 году профессор Шапиро взял отпуск в Институте Вейцмана, чтобы основать и стать генеральным директором Ubique Ltd., пионера программного обеспечения для Интернета в Израиле. Ubique была компанией-разработчиком программного обеспечения, которая разработала продукты для обмена мгновенными сообщениями и совместной работы. Первый продукт компании Virtual Places 1.0, интегрированный в один продукт для обмена мгновенными сообщениями , передачи голоса по IP и социальных сетей на основе браузера, поверх рабочих станций на базе Unix. Эти идеи и технологии, объединенные в один продукт, были новыми и революционными и, возможно, опередили свое время. Ubique была продана America Online в 1995 году, выкуплена ее менеджментом в 1997 году и снова продана IBM в 1998 году.

Языки молекулярного программирования

В начале 21 века научному прогрессу удалось объединить доступным образом знания о «последовательностях» и «структурах» молекулярной биологии клетки . Так , например, ДНК-последовательности , как- абстракции захватили первичную последовательность нуклеотидов , в том числе , не выше и биохимические свойства низшего порядка. Эта абстракция позволяет применять батарею строковых алгоритмов , а также дает возможность практической разработки баз данных и общих репозиториев.

Поскольку молекулярные цепи являются устройствами обработки информации клеток и организмов, они уже многие десятилетия являются предметом исследований биологов. До появления инструментов вычислительной биологии биологи не имели доступа к большим объемам данных и их анализу. Горы знаний о функциях, активности и взаимодействии молекулярных систем в клетках оставались фрагментированными. Более того, эти прошлые исследования, которые идентифицировали и связывали несколько компонентов или взаимодействий по одному, потребовали десятилетий последовательной работы.

В основополагающей статье, опубликованной в 2002 году в журнале Nature «Клеточные абстракции: клетки как вычисление», профессор Шапиро поднял вопрос: почему изучение биомолекулярных систем не может совершить аналогичный вычислительный скачок? При исследовании как последовательности, так и структуры были приняты хорошие абстракции: «ДНК как строка» и «белок как трехмерный граф с метками» соответственно. Он считал, что информатика может обеспечить столь необходимую абстракцию для биомолекулярных систем. Вместе со своим доктором философии. Студент Авив Регев использовал передовые концепции информатики для исследования абстракции «молекула как вычисление», в которой система взаимодействующих молекулярных объектов описывается и моделируется системой взаимодействующих вычислительных объектов. Он разработал абстрактные компьютерные языки для спецификации и изучения систем взаимодействующих вычислений, чтобы представить биомолекулярные системы, включая регуляторные, метаболические и сигнальные пути, а также многоклеточные процессы, такие как иммунные ответы. Эти «языки молекулярного программирования» позволили моделировать поведение биомолекулярных систем, а также разрабатывать базы знаний, поддерживающие качественные и количественные рассуждения о свойствах этих систем.

Новаторская работа (первоначально использовавшая π-исчисление , исчисление процессов ) позже была передана IBM Cambridge в Великобритании ( Лука Карделли ), которая разработала SPiM (стохастическая вычислительная машина Пи). В последнее десятилетие в этой области появилось множество приложений. Совсем недавно эта область даже превратилась в синтез двух разных областей - молекулярных вычислений и молекулярного программирования. Комбинация двух показывает, как различные математические формализмы (такие как сети химических реакций ) могут служить «языками программирования», а различные молекулярные архитектуры (такие как архитектура молекул ДНК) могут в принципе реализовать любое поведение, которое может быть математически выражено с помощью формализма. используемый.

Доктор в камере

Объединив информатику и молекулярную биологию, исследователи смогли работать над программируемым биологическим компьютером, который в будущем сможет перемещаться по человеческому телу, диагностировать болезни и назначать лечение. Это то, что профессор Эхуд Шапиро из института Вейцмана назвал «доктором в камере».

Его группа разработала крошечный компьютер, полностью состоящий из биологических молекул, который был успешно запрограммирован - в пробирке - для определения молекулярных изменений в организме, указывающих на наличие определенных видов рака. Затем компьютер смог диагностировать конкретный тип рака и отреагировать, производя молекулу лекарства, которая мешает деятельности раковых клеток, вызывая их самоуничтожение. За эту работу был членом журнала "Scientific American 50" 2004 года как руководитель исследований в области нанотехнологий.

В 2009 году Шапиро и аспирант Том Ран представили прототип автономной программируемой молекулярной системы, основанной на манипулировании нитями ДНК , которая способна выполнять простые логические выводы . Этот прототип - первый простой язык программирования, реализованный на молекулярном уровне. Введенная в организм, эта система обладает огромным потенциалом для точного нацеливания на определенные типы клеток и проведения соответствующего лечения, поскольку она может одновременно выполнять миллионы вычислений и «мыслить» логически.

Команда профессора Шапиро стремится заставить эти компьютеры выполнять очень сложные действия и отвечать на сложные вопросы, следуя логической модели, впервые предложенной Аристотелем более 2000 лет назад. Биомолекулярные компьютеры чрезвычайно малы: три триллиона компьютеров могут поместиться в одной капле воды. Если бы компьютерам было дано правило «Все люди смертны» и факт «Сократ - человек», они ответили бы: «Сократ смертен». Команда проверила множество правил и фактов, и каждый раз биомолекулярные компьютеры отвечали на них правильно.

Команда также нашла способ сделать эти микроскопические вычислительные устройства « удобными для пользователя », создав компилятор  - программу для перехода между языком программирования высокого уровня и кодом ДНК-вычислений. Они стремились разработать гибридную систему in silico / in vitro , которая поддерживает создание и выполнение программ молекулярной логики аналогично электронным компьютерам, позволяя любому, кто знает, как работать с электронным компьютером, без каких-либо знаний в области молекулярной биологии , управлять биомолекулярным компьютером.

В 2012 году профессору Эхуду Шапиро и доктору Тому Рану удалось создать генетическое устройство, которое независимо работает в бактериальных клетках . Устройство запрограммировано на идентификацию определенных параметров и получение соответствующего ответа. Устройство ищет факторы транскрипции  - белки , контролирующие экспрессию генов в клетке. Неисправность этих молекул может нарушить экспрессию генов . В раковых клетках , например, факторы транскрипции, регулирующие рост и деление клеток , не работают должным образом, что приводит к усилению деления клеток и образованию опухоли . Устройство, состоящее из последовательности ДНК, вставленной в бактерию , выполняет «перекличку» факторов транскрипции . Если результаты соответствуют заранее запрограммированным параметрам, он реагирует, создавая белок, излучающий зеленый свет, что  является видимым признаком «положительного» диагноза. В последующих исследованиях ученые планируют заменить белок, излучающий свет, на белок , который повлияет на судьбу клетки, например, на белок, который может заставить клетку совершить самоубийство. Таким образом, устройство вызовет самоуничтожение только «положительно» диагностированных клеток. После успеха исследования бактериальных клеток исследователи планируют протестировать способы привлечения таких бактерий в качестве эффективной системы для удобного введения в организм человека в медицинских целях (что не должно быть проблематичным, учитывая наш естественный микробиом ; недавнее исследование показывает, что в организме человека уже в 10 раз больше бактериальных клеток, чем клеток человека, которые разделяют пространство нашего тела симбиотическим образом). Еще одна цель исследования - использовать аналогичную систему внутри клеток человека, которые намного сложнее бактерий.

Редактирование ДНК

Профессор Шапиро разработал эффективный метод синтеза безошибочных молекул ДНК из подверженных ошибкам строительных блоков. ДНК-программирование - это ДНК-двойник компьютерного программирования. Базовый цикл компьютерного программирования заключается в изменении существующей программы, тестировании измененной программы и повторении, пока не будет получено желаемое поведение. Точно так же цикл программирования ДНК заключается в изменении молекулы ДНК, проверке ее результирующего поведения и повторении до тех пор, пока не будет достигнута цель (которая заключается в понимании поведения или его улучшении). Одно из ключевых различий между ними заключается в том, что в отличие от компьютерного программирования, наше понимание ДНК как языка программирования очень далеко от совершенства, и поэтому метод проб и ошибок является нормой, а не исключением в исследованиях и разработках на основе ДНК. Следовательно, программирование ДНК более эффективно, если несколько вариантов программы ДНК, также называемой библиотекой ДНК, создаются и тестируются параллельно, а не создаются и тестируются только по одной программе за раз. Следовательно, базовый цикл программирования ДНК, когда он работает на полную мощность, берет лучшие программы ДНК из предыдущего цикла, использует их в качестве основы для создания нового набора программ ДНК, проверяет их и повторяет, пока цель не будет достигнута.

Кроме того, полимеразная цепная реакция (ПЦР) является ДНК-эквивалентом печати с подвижным шрифтом Гутенберга, позволяя воспроизводить крупномасштабные фрагменты текста. Синтез ДНК de novo - это ДНК-эквивалент механического набора текста; оба упрощают настройку текста для тиражирования. Что такое ДНК-эквивалент текстового процессора? Обработка текста была быстро принята как замена пишущей машинке, когда пользователи обнаружили ее революционные преимущества в создании, редактировании, форматировании и сохранении документов. В то время как электронное представление текста в компьютерах позволяет обрабатывать текст в простой унифицированной структуре, обработка ДНК - создание вариаций и комбинаций существующей ДНК - выполняется биологическими лабораториями ежедневно с использованием множества несвязанных между собой ручных трудоемких методов. В результате до сих пор не было предложено универсального метода обработки ДНК и, следовательно, не возникло инженерной дисциплины, которая бы использовала обработанную ДНК в дальнейшем. Проф. Шапиро основал консорциум CADMAD: технологическая платформа CADMAD нацелена на революцию в обработке ДНК, аналогичную революции в редактировании текста, произошедшей с появлением электронных текстовых редакторов. Революция в биотехнологии в значительной степени сдерживается ее заведомо продолжительным циклом НИОКР по сравнению с циклом компьютерного программирования. Технология CAD / CAM для ДНК, которая упростит обработку ДНК текстовым редактором и, таким образом, поддержит быстрое программирование ДНК, произведет революцию в биотехнологии, сократив цикл исследований и разработок приложений на основе ДНК. Это может быть достигнуто только путем согласования разработки сложных, многоуровневых технологий, которые объединяют опыт из таких разнообразных областей, как алгоритмика, разработка программного обеспечения, биотехнология, робототехника и химия. Они только сейчас начинают казаться осуществимыми.

Дерево происхождения клеток человека

В 2005 году профессор Шапиро представил видение следующей грандиозной задачи в биологии человека: раскрыть Древо происхождения клеток человека . Внутри каждого из нас есть древо клеточных линий  - история роста нашего тела от одной клетки ( оплодотворенной яйцеклетки ) до 100 триллионов клеток. Биологические и биомедицинские последствия такого успеха могут быть аналогичными, если не более значительными, чем влияние проекта «Геном человека» .

Каждый человек начинается с единой клетки  - слияния яйцеклетки и сперматозоида  - и прогрессирует через деление и смерть клеток через развитие, рождение, рост и старение. Здоровье человека зависит от поддержания правильного процесса деления, обновления и смерти клеток, а самые тяжелые заболевания человечества, особенно рак , аутоиммунные заболевания , диабет, нейродегенеративные и сердечно-сосудистые расстройства, а также множество унаследованных редких заболеваний являются результатом специфических отклонений в этом процессе.

История клеток человека, от зачатия до любого конкретного момента времени, может быть зафиксирована математическим объектом, называемым деревом происхождения клеток . Корень дерева представляет собой оплодотворенное яйцо, листья дерева представляют сохранившиеся клетки человека, а ветви дерева фиксируют каждое отдельное деление клетки в истории человека.

Науке точно известно древо клеточных линий только одного организма - червя Caenorhabditis elegans, который достигает своего полного размера в 1 миллиметр и 1000 клеток за 36 часов. Для сравнения: новорожденная мышь весом всего несколько граммов имеет около 1 миллиарда клеток. В среднем у человека около 100 триллионов клеток. Понимание структуры и динамики древовидной структуры человеческих клеток в развитии, росте, обновлении, старении и болезнях является центральным и неотложным вопросом биологии и медицины. Задача раскрытия древа происхождения клеток человека напоминает, как по характеру, так и по объему, проблему, с которой столкнулся Проект генома человека в самом начале, и, по сути, его результаты будут решающим образом способствовать функциональному преобразованию и окончательному пониманию последовательность генома . Технологический скачок масштаба, подобный тому, который произошел во время Проекта генома человека, необходим для успеха проекта линии человеческих клеток, и биологическое и биомедицинское воздействие такого успеха может быть аналогичным, если не больше, чем проект "Геном человека".

Центральными открытыми проблемами в биологии и медицине, по сути, являются вопросы о древе клеточных линий человека: его структуре и динамике в развитии, росте, обновлении, старении и болезнях. Следовательно, знание дерева происхождения клеток человека решит эти проблемы и повлечет за собой скачкообразный прогресс в человеческих знаниях и здоровье.

Многие центральные вопросы биологии и медицины, которые на самом деле являются конкретными вопросами о древе происхождения клеток человека, о здоровье и болезнях:

  • Какие раковые клетки вызывают рецидив после химиотерапии?
  • Какие раковые клетки могут метастазировать?
  • Обновляются ли бета-клетки, производящие инсулин, у здоровых взрослых?
  • Обновляются ли яйца у взрослых самок?
  • Какие клетки обновляются в здоровом и нездоровом мозге взрослого человека?

Знание дерева происхождения клеток человека ответит на все эти и многие другие вопросы. К счастью, древо наших клеток неявно закодировано в геномах наших клеток посредством мутаций, которые накапливаются при делении клеток тела. Теоретически его можно реконструировать с высокой точностью, секвенировав каждую клетку нашего тела, по непомерно высокой цене. На практике для реконструкции клеточного клона достаточно анализа только высокомолабильных фрагментов генома. Лаборатория Шапиро разработала проверенный мультидисциплинарный метод и систему для анализа клеточных клонов по соматическим мутациям.

В своем выступлении на TEDxTel-Aviv «Раскрытие дерева происхождения клеток человека - следующая грандиозная научная задача» профессор Шапиро описал систему и результаты, полученные с ее помощью, а также предложение для флагманского проекта FET «Инициатива флагманских линий человеческих клеток» для раскрытие дерева происхождения клеток человека в области здоровья и болезней.

Электронная демократия

Эхуд инициировал в 2012 году и возглавил проект « Открытая вечеринка » (позднее «открытое сообщество») в рамках Public Knowledge Workshop , целью которого было создание основы для работы электронной вечеринки, поддерживающей прямую демократию через Интернет. Он также расширил свои концепции электронной демократии в своей лекции на ВЭФ в Давосе в 2016 году и статье «Мнение Financial Times» . В 2020 году Эхуд основал политическую партию Democratit - свобода, равенство и братство.

Смотрите также


Рекомендации