Лаборатория повсеместной обработки знаний - Ubiquitous Knowledge Processing Lab

Повсеместный обработки знаний Lab (также УКП Lab ) является исследовательской лабораторией на кафедре информатики в Technische Universität Дармштадта . Основана в 2006 году Ириной Гуревич .

Исследовательская деятельность

UKP Lab разрабатывает методы обработки естественного языка для автоматического понимания письменного текста и применяет их к управлению информацией, например к поиску информации , ответам на вопросы и структурированию информации в Вики .

Лаборатория повсеместной обработки знаний входит в число ведущих исследовательских институтов в области использования контента Web 2.0 в качестве источника лексико-семантической информации для обработки естественного языка (NLP). Википедия и Викисловарь используются как совместно созданные лексико-семантические ресурсы и используются для улучшения таких экспертных ресурсов, как WordNet . Эти ресурсы используются для разработки семантически усовершенствованных алгоритмов поиска информации и ответов на вопросы. Примером может служить семантический поиск : если пользователь вводит запрос «пирог-фрукт» в поисковую систему, стандартная поисковая система найдет страницы, содержащие слова «пирог», но не слово «фрукт», предоставляя множество страниц по запросу «яблоко». пирог ». Интеллектуальная поисковая машина «поймет», что пользователя интересуют рецепты пирогов, в которых не используются какие-либо фрукты, и найдет соответствующие документы.

Дальнейшие исследования лаборатории UKP включают автоматическую оценку качества текста, анализ настроений и анализ мнений. Исследовательская деятельность организована по следующим направлениям:

  • Образовательная обработка естественного языка
  • Многоязычное семантическое управление информацией
  • Обработка естественного языка для вики

UKP Lab уделяет большое внимание использованию новых алгоритмов обработки естественного языка в реальных приложениях. UKP Lab сотрудничает с партнерами из академических кругов и промышленности для улучшения различных сценариев приложений, таких как управление взаимоотношениями с клиентами , цифровые гуманитарные науки , образовательные приложения или общественная безопасность.

Программное обеспечение

Часть исследовательских усилий UKP Lab - это разработка программного обеспечения для обработки естественного языка (NLP) . Следующие программные пакеты доступны бесплатно для исследовательских целей:

DKPro

Дармштадтский репозиторий программного обеспечения для обработки знаний (DKPro) - это сообщество программных проектов с открытым исходным кодом, нацеленных на обработку естественного языка. Он предлагает надежные, готовые к использованию компоненты NLP, которые построены на основе архитектуры управления неструктурированной информацией (UIMA) IBM в качестве общей и открытой платформы .

DKPro содержит базовые компоненты обработки естественного языка, такие как тегирование части речи и лемматизация . Кроме того, пакет предлагает компоненты, которые поддерживают обработку пользовательского дискурса. Пользовательский контент содержит орфографические ошибки, сокращения и смайлики, запрещающие прямое применение стандартных компонентов НЛП. DKPro предоставляет необходимые инструменты предварительной обработки.

Википедия API

Библиотека Java Wikipedia (JWPL) также была разработана UKP Lab. Это интерфейс прикладного программирования на основе Java для Википедии, обеспечивающий программный доступ ко всей информации, содержащейся в Википедии .

Викисловарь API

Параллельно с JWPL библиотека Java Wiktionary (JWKTL) предлагает программный доступ к информации, содержащейся в английской и немецкой версиях Wiktionary .

Рекомендации

  1. ^ Hessen-IT News 03/2008 .
  2. ^ Пример из: Impulse für die Wissenschaft 2010 (Volkswagenstiftung) .
  3. ^ a b Справочная публикация: [1] Зеш, Мюллер, Гуревич: Извлечение лексико-семантических знаний из Википедии и Викисловаря, Труды LREC 2008.

Внешние ссылки

Координаты : 49.877235 ° N 8.654688 ° E 49 ° 52′38 ″ с.ш., 8 ° 39′17 ″ в.д. /  / 49.877235; 8,654688