Юрген Шмидхубер - Jürgen Schmidhuber

Юрген Шмидхубер
Юрген Шмидхубер.jpg
Шмидхубер выступает на Всемирном саммите AI for GOOD в 2017 году
Родился 17 января 1963 г.
Национальность Немецкий
Альма-матер Технический университет Мюнхена
Известен Искусственный интеллект , глубокое обучение , искусственные нейронные сети , рекуррентные нейронные сети , машина Гёделя , искусственное любопытство, мета-обучение
Научная карьера
Поля Искусственный интеллект
Учреждения Институт исследований искусственного интеллекта Далле Молле
Веб-сайт люди .idsia .ch / ~ юрген

Юрген Шмидхубер (родился 17 января 1963 г.) - ученый-компьютерщик, наиболее известный своей работой в области искусственного интеллекта , глубокого обучения и искусственных нейронных сетей . Он является содиректором Института исследований искусственного интеллекта Далле Молле в Лугано , в Тичино на юге Швейцарии . После Google Scholar с 2016 по 2021 год он получил более 100 000 научных цитирований ( Профиль ). Его называют «отцом современного ИИ», «отцом ИИ», «отцом зрелого ИИ», «папой» известных продуктов ИИ, «Крестным отцом» и «отцом глубокого обучения». (Сам Шмидхубер, однако, назвал Алексея Григорьевича Ивахненко «отцом глубокого обучения».)

Шмидхубер учился на бакалавриате в Техническом университете Мюнхена в Мюнхене , Германия. Он преподавал там с 2004 по 2009 год, когда стал профессором искусственного интеллекта в Università della Svizzera Italiana в Лугано , Швейцария.

Работа

Вместе со своими учениками Зеппом Хохрайтером , Феликсом Герсом , Фредом Камминсом, Алексом Грейвсом и другими Шмидхубер опубликовал все более изощренные версии типа рекуррентной нейронной сети, называемой долгой краткосрочной памятью (LSTM). Первые результаты уже были представлены в дипломной работе Хохрайтера (1991), в которой анализировалась и решалась знаменитая проблема исчезающего градиента . Название LSTM было введено в техническом отчете (1995 г.), что привело к наиболее цитируемой публикации LSTM (1997 г.).

Стандартная архитектура LSTM, которая используется почти во всех текущих приложениях, была представлена ​​в 2000 году. Сегодняшний "ванильный LSTM", использующий обратное распространение во времени, был опубликован в 2005 году, а его алгоритм обучения временной классификации коннекционистов (CTC) - в 2006 году. закончить распознавание речи с LSTM. В 2015 году LSTM, обученный CTC, был использован в новой реализации распознавания речи в программном обеспечении Google для смартфонов . Google также использовал LSTM для умного помощника Allo и Google Translate . Apple использовала LSTM для функции «Quicktype» на iPhone и для Siri . Amazon использовал LSTM для Amazon Alexa . В 2017 году Facebook ежедневно выполнял около 4,5 миллиардов автоматических переводов с использованием сетей LSTM. Bloomberg Business Week писал: «Эти возможности делают LSTM, пожалуй, самым коммерческим достижением ИИ, используемым для всего, от прогнозирования заболеваний до сочинения музыки».

В 2011 году команда Шмидхубера в IDSIA вместе с его постдоком Дэном Чиресаном также достигла значительного ускорения сверточных нейронных сетей (CNN) на быстрых параллельных компьютерах, называемых графическими процессорами . Более ранний CNN на GPU Челлапиллы и др. (2006) была в 4 раза быстрее, чем эквивалентная реализация на CPU. Глубокий CNN Дэна Чиресана и др. (2011) в IDSIA были уже в 60 раз быстрее и достигли первого сверхчеловеческого выступления в конкурсе компьютерного зрения в августе 2011 года. В период с 15 мая 2011 года по 10 сентября 2012 года их быстрые и глубокие CNN выиграли не менее четырех конкурсов изображений. Они также значительно улучшили лучшую производительность в литературе для нескольких баз данных изображений . Этот подход стал центральным в области компьютерного зрения . Он основан на проектах CNN, представленных намного ранее Янном ЛеКуном и др. (1989), которые применили алгоритм обратного распространения ошибки к варианту оригинальной архитектуры CNN Кунихико Фукусимы, названной неокогнитроном , позже модифицированной методом Дж. Венга, названным max-pooling .

В 2014 году Шмидхубер основал компанию Nnaisense для работы над коммерческими приложениями искусственного интеллекта в таких областях, как финансы, тяжелая промышленность и беспилотные автомобили . Советниками компании являются Зепп Хохрайтер, Яан Таллинн и Маркус Хаттер . В 2016 году объем продаж составил менее 11 миллионов долларов США; однако Шмидхубер заявляет, что в настоящее время акцент делается на исследованиях, а не на доходах. Nnaisense увеличил свой первый раунд капитального финансирования в январе 2017 года. Общая цель Шмидхубера - создать универсальный ИИ путем последовательного обучения одного ИИ для решения множества узких задач.

Просмотры

Согласно The Guardian , Шмидхубер жаловался в «едкой статье 2015 года», что коллеги- исследователи глубокого обучения Джеффри Хинтон , Янн ЛеКун и Йошуа Бенжио «сильно цитируют друг друга», но «не признают пионеров в этой области», якобы занижая вклад Шмидхубера и других пионеров машинного обучения, в том числе Алексея Григорьевича Ивахненко, который опубликовал первые сети глубокого обучения еще в 1965 году. ЛеКун отверг обвинения, заявив вместо этого, что Шмидхубер «продолжает требовать признания, которого он не заслуживает». Шмидхубер ответил, что ЛеКун не привел ни одного примера для своего заявления, и перечислил несколько приоритетных споров .

Признание

Шмидхубер получил премию Гельмгольца Международного общества нейронных сетей в 2013 г. и премию «Пионер нейронных сетей» Общества вычислительного интеллекта IEEE в 2016 г. за «новаторский вклад в глубокое обучение и нейронные сети». Он является членом Европейской академии наук и искусств .

использованная литература