Джозеф Мариани - Joseph Mariani

Джозеф Мариани
Photo-JM4.png
Родившийся ( 1950-02-01 )1 февраля 1950 г. (71 год)
Национальность Французский
Занятие Исследователь в области компьютерных наук

Джозеф Мариани (родился Жозеф-Жан Мариани ; 1 февраля 1950 г.) - французский исследователь компьютерных наук и пионер в области обработки речи.

Образование и карьера

Получив в 1977 году степень доктора технических наук в Университете Пьера и Марии Кюри , Джозеф Мариани присоединился к Национальному центру научных исследований (CNRS) в Лаборатории информатики для механики и инженерных наук (LIMSI) в качестве исследователя. Затем он был главой группы речевой коммуникации с 1982 по 1985 год. Он уехал в Соединенные Штаты (1985–1986), где работал приглашенным исследователем в исследовательском центре IBM TJ Watson Research Center ( Йорктаун-Хайтс , Нью-Йорк , США).). Вернувшись во Францию, с 1987 по 2001 год он возглавлял департамент человеко-машинной коммуникации и был директором LIMSI с 1989 по 2000 год. Позже он был назначен директором департамента информационных и коммуникационных технологий Министерства исследований. В министерстве он создал программы Techno-Langue и Techno-Vision по развитию и оценке технологий в этих двух областях.

За это время он был назначен президентом Европейской ассоциации языковых ресурсов (ELRA) и входил в правление нескольких организаций, включая ANFr, IGN, OST и INRIA . Он участвовал в создании многих ассоциаций и международных конференций, таких как ELSNET, COCOSDA, ESCA / ISCA , ELRA и LREC .

С 2006 по декабрь 2013 года он был директором Института многоязычной и мультимедийной информации (IMMI), смешанного международного подразделения CNRS, являющегося частью программы Quaero, совместной работы LIMSI, Технологического института Карлсруэ (KIT) и Университета Карлсруэ. Экс-ла-Шапель (RWTH). В феврале 2016 года CNRS присвоило ему звание почетного старшего научного сотрудника.

Области исследований

Исследовательская деятельность Джозефа в основном касается человеко-машинного общения, как устного, так и письменного, в области обработки естественного языка.

В начале своей карьеры он сосредоточился на автоматическом распознавании речи и обработке сигналов.

В начале 1980-х Джозеф Мариани уже в рамках оценочной деятельности рабочей группы RSG-10 НАТО использовал название «парадигма оценки» для обозначения открытых усилий по оценке, рассматриваемых как количественный черный ящик с показателями эффективности на общих данных, а затем объединив и сравнив, задача теперь называется «общая задача». Эта парадигма оценки позволила постоянно улучшать обработку речи и в конечном итоге появление голосовых помощников, таких как SIRI, Cortan, ECHO и Google Voice.

Он участвовал в том, чтобы NIST 2 стал центром деятельности по оценке автоматической обработки речи и текста в США в 1987 году. В 1994 году вместе с Робертом Мартином, тогдашним директором Национального института французского языка (INaLF), он организовал первый франкоязычный открытый оценка текста для морфосинтаксических анализаторов французского текста благодаря поддержке двух отделов CNRS, гуманитарных и социальных наук и технических наук. В том же году он помог начать программу в области лингвистической инженерии Aupelf-Uref (ныне AUF, Ассоциация Francophone университета) и координируются франкоязычной сеть по языковой инженерии (FRANCIL) усилить франкоязычную деятельность в этой области. Это включает в себя согласованные исследовательские действия (CRA), основные действия, касающиеся парадигмы оценки текста и речи 4 . В начале 2000-х он внес вклад в крупную публикацию по автоматической обработке речи: Speken Language Processing 5 .

В период с 2000 по 2010 год его деятельность была сосредоточена на многоязычии с разработкой языковых матриц для 24 языков Европейского Союза 6 . Позже он работал над публикацией серии 7 информационных документов META-NET , чтобы составить перечень ресурсов, доступных для французского языка (словари, грамматики и программы).

С 2010 года он работает над автоматической обработкой региональных языков 8 и интересуется этическими проблемами, связанными с использованием компьютеров в повседневной жизни.

С 2013 года 9 он собирает и изучает статьи по всей области обработки естественного языка, включая обработку речи и поиск информации. Эта работа была выполнена в рамках проекта NLP4NLP 10, который начался с использования архивов ISCA , а затем архивов LREC 11 , TALN и IEEE, а затем других конференций и ревю, таких как TREC . После этого этапа сбора, на котором впервые была собрана большая часть публикаций в данной области, публикации были автоматически проанализированы с нескольких точек зрения. Во-первых, все технические термины были извлечены и собраны в лексикон. Во-вторых, каждая лексическая запись приписывалась автору, который первым ее использовал. Это нововведение 12 в научных публикациях. Цель состояла в том, чтобы понять механизмы, влияющие на область, и, таким образом, определить текущие и будущие тенденции. Эта работа включала создание технических терминов, их эволюцию (появление и в конечном итоге распад и возрождение), таких как термин «нейронные сети». Другая стратегия заключалась в создании прогнозного анализа, который состоит в создании статистического представления использования технических терминов для прогнозирования их использования в течение следующих четырех лет. В исследовании также изучалось влияние одной конференции на другую, на плагиат и повторное использование в научных публикациях 13 . Полный синтез NLP4NLP был опубликован в 2019 году в форме двойной публикации в Frontiers in Research Metrics and Analytics.

Отличия

Джозеф Мариани был назначен кавалером Французского национального ордена за заслуги (1985) и офицером Ордена искусств и литературы (2016). Он является почетным членом Франкоязычной ассоциации речевой коммуникации (AFCP), товарищем и пожизненным членом ISCA , где он получил медаль за особую службу в 1999 году, и почетным президентом ELRA с 2010 года.

Библиография

Джозеф Мариани - автор, соавтор или редактор более 500 публикаций.

Рекомендации

  1. ↑ Жан-Сильвен Льенар, Джозеф Мариани, 1980, Система разведки изолированных движений: MOISE - Зарегистрированный технический отчет ANVAR 50312, июнь 1980 г.
  2. ↑ Дэвид Паллет, 1998 Роль NIST в тестах автоматического распознавания речи, LREC 1998
  3. Ральф Гришман, Бет Сандхейм, Конференция по пониманию сообщений-6 , 1996 г .: Краткая история [архив] , COLING, 1996 г.
  4. Обзор современного состояния технологий человеческого языка [1] [архив]
  5. ↑ Разговорная обработка [2] [архив]
  6. Языковые матрицы и влияние языковых ресурсов, Джозеф Мариани, Гил Франкопуло, dans Language Production, Cognition and the lexicon, под редакцией Gala, Rapp, Bel-Enguix, Springer
  7. ↑ Серия информационных материалов META-NET: Френч, Джозеф Мариани, Патрик Пароубек, Хиль Франкопуло, Орелиен Макс, Франсуа Ивон, Пьер Цвейгенбаум. Springer [3] [архив]
  8. ↑ Technologies de la langue: état des lieux, Joseph Mariani, dans Les Technologies pour les langues régionales de France, Colloque du 19 et 20 février 2015 Organisé par la DGLFLF
  9. ↑ Повторное открытие 25 лет открытий в обработке разговорной речи: предварительный анализ архива ISCA, Джозеф Мариани, Патрик Пароубек, Гил Франкопуло, Марин Делаборд, [4] [архив]
  10. ↑ NLP4NLP: Дети сапожника не разойдутся, Гил Франкопуло, Джозеф Мариани, Патрик Пароубек, D-Lib Magazine: The Magazine of Digital Library Research, ноябрь 2015 г. [5] [архив]
  11. ↑ Повторное открытие 15 лет открытий в языковых ресурсах и оценке: анализ антологии LREC, Джозеф Мариани, Патрик Пароубек, Гил Франкопуло, Оливье Хамон, LREC 2014, [6] [архив]
  12. ↑ Text Mining for Notabilility Computation, Гил Франкопуло, Джозеф Мариани, Патрик Пароубек, LREC 2016, Семинар по межплатформенному интеллектуальному анализу текста и взаимодействию обработки естественного языка [7] [архив]
  13. Исследование повторного использования и плагиата в статьях LREC, Гил Франкопуло, Джозеф Мариани, Патрик Пароубек, LREC 2016, http://www.lrec-conf.org/proceedings/lrec2016/index.html [архив]

Внешние ссылки