Пользовательский интерфейс на естественном языке - Natural-language user interface

Пользовательский интерфейс на естественном языке ( LUI или NLUI ) - это тип компьютерного интерфейса человека, в котором языковые явления, такие как глаголы, фразы и предложения, действуют как элементы управления пользовательского интерфейса для создания, выбора и изменения данных в программных приложениях.

В дизайне интерфейсов естественно-языковые интерфейсы востребованы из-за их скорости и простоты использования, но большинство из них страдают от проблем, связанных с пониманием большого разнообразия неоднозначного ввода . Естественно-языковые интерфейсы - активная область исследований в области обработки естественного языка и компьютерной лингвистики . Интуитивно понятный общий интерфейс на естественном языке - одна из активных целей Семантической паутины .

Текстовые интерфейсы в разной степени «естественны». Многие формальные (неестественные) языки программирования включают идиомы естественного человеческого языка. Точно так же традиционная поисковая машина по ключевым словам может быть описана как «неглубокий» пользовательский интерфейс на естественном языке.

Обзор

Теоретически поисковая машина на естественном языке может находить целевые ответы на вопросы пользователей (в отличие от поиска по ключевым словам). Например, при ответе на вопрос в форме «в каком штате США самый высокий налог на прибыль ?» Обычные поисковые системы игнорируют этот вопрос и вместо этого выполняют поиск по ключевым словам «штат», «доход» и «налог». С другой стороны, поиск на естественном языке пытается использовать обработку на естественном языке, чтобы понять природу вопроса, а затем искать и возвращать подмножество сети, содержащее ответ на вопрос. Если это сработает, результаты будут иметь более высокую релевантность, чем результаты из поисковой системы по ключевым словам, из-за включения вопроса.

История

Интерфейсы Prototype Nl появились уже в конце шестидесятых - начале семидесятых годов.

  • SHRDLU , интерфейс на естественном языке, который управляет блоками в виртуальном «мире блоков».
  • Lunar , интерфейс на естественном языке к базе данных, содержащей химические анализы лунных горных пород Аполлона-11, выполненные Уильямом А. Вудсом .
  • Chat-80 преобразовывал английские вопросы в выражения Пролога , которые оценивались по базе данных Пролога. Код Chat-80 получил широкое распространение и лег в основу нескольких других экспериментальных интерфейсов N1. Онлайн-демонстрация доступна на веб-сайте LPA.
  • ELIZA , написанная в Массачусетском технологическом институте Джозефом Вайценбаумом между 1964 и 1966 годами, имитировала психотерапевта и работала, обрабатывая ответы пользователей на сценарии. Не используя почти никакой информации о человеческих мыслях или эмоциях, сценарий DOCTOR иногда давал поразительно человеческое взаимодействие. Онлайн-демонстрация доступна на веб-сайте LPA.
  • Janus - также одна из немногих систем, поддерживающих временные вопросы.
  • Интеллект от Trinzic (образован в результате слияния AICorp и Aion).
  • Язык BBN основан на опыте разработки систем Rus и Irus .
  • IBM Languageaccess
  • Вопросы и ответы от Symantec .
  • Datatalker от Natural Language Inc.
  • Локи из BIM Systems.
  • Английский мастер от Linguistic Technology Corporation .

Вызовы

Интерфейсы на естественном языке в прошлом побуждали пользователей антропоморфизировать компьютер или, по крайней мере, приписывать машинам больше интеллекта, чем это требуется. Со стороны пользователя это привело к нереалистичным ожиданиям возможностей системы. Такие ожидания затруднят изучение ограничений системы, если пользователи приписывают ей слишком большие возможности, и в конечном итоге приведут к разочарованию, когда система не сможет работать так, как ожидалось, как это было в зиме ИИ 1970-х и 80-х годов.

В документе 1995 года, озаглавленном «Интерфейсы естественного языка для баз данных - введение», описываются некоторые проблемы:

Вложение модификатора
Запрос «Перечислить всех сотрудников компании с водительскими правами» неоднозначен, если вы не знаете, что компании не могут иметь водительские права.
Конъюнкция и дизъюнкция
«Перечислите всех кандидатов, которые живут в Калифорнии и Аризоне» двусмысленно, если вы не знаете, что человек не может жить в двух местах одновременно.
Разрешение анафоры
решить, что пользователь имеет в виду под «он», «она» или «оно» в запросе со ссылками на самого себя.

Другими целями, которые следует учитывать в более общем плане, являются скорость и эффективность интерфейса, во всех алгоритмах эти два момента являются основным моментом, который определяет, будут ли одни методы лучше других и, следовательно, иметь больший успех на рынке. Кроме того, локализация на сайтах на нескольких языках требует особого внимания - это основано на различной структуре предложений и вариациях синтаксиса языков для большинства языков.

Наконец, что касается используемых методов, основная проблема, которую необходимо решить, - это создание общего алгоритма, который может распознавать весь спектр разных голосов, не обращая внимания на национальность, пол или возраст. Существенные различия между извлеченными функциями - даже от говорящих, которые произносят одно и то же слово или фразу - должны быть успешно преодолены.

Использование и приложения

Интерфейс на естественном языке дает начало технологии, используемой для множества различных приложений.

Некоторые из основных применений:

  • Диктовка - это наиболее распространенное сегодня использование систем автоматического распознавания речи (ASR). Сюда входят медицинские расшифровки, юридические и деловые диктанты, а также общий текстовый редактор. В некоторых случаях используются специальные словари для повышения точности системы.
  • Системы управления и контроля , системы ASR, которые предназначены для выполнения функций и действий в системе, определяются как системы управления и контроля. Такие фразы, как «Open Netscape» и «Start a new xterm», сделают именно это.
  • Телефония , некоторые системы PBX / голосовой почты позволяют вызывающим абонентам произносить команды вместо нажатия кнопок для отправки определенных сигналов.
  • Носимые устройства , поскольку входы для носимых устройств ограничены, разговор - это естественная возможность.
  • Медицинские, инвалиды , многие люди испытывают трудности с набором текста из-за физических ограничений, таких как травмы от повторяющихся деформаций (RSI), мышечная дистрофия и многие другие. Например, люди с проблемами слуха могут использовать систему, подключенную к их телефону, для преобразования речи звонящего в текст.
  • Встроенные приложения , некоторые новые сотовые телефоны включают распознавание речи C&C, которое позволяет произносить фразы, такие как «позвонить домой». Это может стать важным фактором в будущем автоматического распознавания речи и Linux .
  • Разработка программного обеспечения : интегрированная среда разработки может встраивать интерфейсы на естественном языке, чтобы помочь разработчикам.

Ниже приведены названия и определения некоторых приложений, которые используют распознавание естественного языка и, следовательно, имеют интегрированные утилиты, перечисленные выше.

Повсеместность

Ubiquity, надстройка для Mozilla Firefox , представляет собой набор быстрых и простых команд на естественном языке, которые действуют как гибридные веб-службы, что позволяет пользователям получать информацию и связывать ее с текущими и другими веб-страницами.

вольфрам Альфа

Wolfram Alpha - это онлайн-сервис, который отвечает на фактические запросы напрямую, вычисляя ответ на основе структурированных данных, а не предоставляет список документов или веб-страниц, которые могут содержать ответ, как это сделала бы поисковая машина . Он был объявлен в марте 2009 года Стивеном Вольфрамом и опубликован 15 мая 2009 года.

Siri

Siri - это интеллектуальное приложение для персонального помощника, интегрированное с операционной системой iOS . Приложение использует обработку естественного языка, чтобы отвечать на вопросы и давать рекомендации.

Маркетинговые утверждения Siri включают в себя то, что он адаптируется к индивидуальным предпочтениям пользователя с течением времени и персонализирует результаты, а также выполняет такие задачи, как бронирование столиков на ужин, пытаясь поймать такси.

Другие

  • Ask.com - Первоначальная идея Ask Jeeves (Ask.com) заключалась в традиционном поиске по ключевым словам с возможностью получать ответы на вопросы, задаваемые повседневным, естественным языком. Текущий Ask.com по-прежнему поддерживает это, с добавленной поддержкой математических, словарных и конверсионных вопросов.
  • Braina - Braina - это интерфейс на естественном языке для ОС Windows, который позволяет вводить или произносить предложения на английском языке для выполнения определенных действий или поиска информации.
Скриншот классического интерфейса GNOME DO.
  • GNOME Do - позволяет быстро находить различные артефакты среды GNOME (приложения, контакты Evolution и Pidgin, закладки Firefox, исполнители и альбомы Rhythmbox и т. Д.) И выполнять с ними основные действия (запуск, открытие, электронная почта, чат, воспроизведение, так далее.).
  • hakia - hakia была поисковой машиной в Интернете. Компания изобрела новую инфраструктуру, альтернативную индексации, которая использовала алгоритм SemanticRank, смесь решений из дисциплин онтологической семантики, нечеткой логики, вычислительной лингвистики и математики. hakia закрылся в 2014 году.
  • Lexxe - Lexxe была поисковой системой в Интернете, которая использовала обработку запросов на естественном языке (семантический поиск). Для поиска можно использовать ключевые слова, фразы и вопросы, например "Сколько лет Википедии?" Lexxe закрыла свои поисковые системы в 2015 году.
  • Pikimal - Pikimal использовал естественный язык, привязанный к предпочтениям пользователя, чтобы давать рекомендации по поиску по шаблону. Пикимал закрылся в 2015 году.
  • Powerset - 11 мая 2008 года компания представила инструмент для поиска в фиксированном подмножестве Википедии, используя разговорные фразы, а не ключевые слова. 1 июля 2008 года он был приобретен Microsoft .
  • Q-go - технология Q-go обеспечивает релевантные ответы пользователям в ответ на запросы на веб-сайте компании или в корпоративной интрасети, сформулированные как естественными предложениями, так и введенными ключевыми словами. Q-go была приобретена RightNow Technologies в 2011 году.
  • Yebol - Yebol была вертикальной поисковой машиной, которая разработала платформу семантического поиска, основанную на знаниях. Алгоритмы искусственного интеллекта Yebol, основанные на человеческом интеллекте, автоматически группируют и классифицируют результаты поиска, веб-сайты, страницы и контент, которые он представляет в визуально индексированном формате, который больше соответствует первоначальным намерениям человека. Yebol использовал алгоритмы ассоциации, ранжирования и кластеризации для анализа связанных ключевых слов или веб-страниц. Yebol интегрировал обработку естественного языка, открытые сложные системы с метасинтетической инженерией и машинные алгоритмы с человеческими знаниями для каждого запроса, чтобы создать веб-каталог, который фактически `` учится '', используя алгоритмы корреляции, кластеризации и классификации для автоматической генерации запроса знаний, который был сохранен и регенерирован вперед.

Смотрите также

использованная литература