Разметка семантических ролей - Semantic role labeling

В обработке естественного языка , семантическая роль маркировка (также называемый мелкий семантический синтаксический анализ или слот-наполнение ) является процессом , который присваивает этикетки на слова или фразы в предложении , что указует на их семантическую роль в предложении, как , например, из агента , целей, или результат.

Он помогает найти смысл предложения. Чтобы сделать это, он обнаруживает аргументы , связанные с предикатом или глаголом в виде предложения и как они классифицируются в своих конкретных ролей . Типичный пример - предложение «Мэри продала книгу Джону». Агент - «Мэри», сказуемое - «продано» (или, скорее, «продать»), тема - «книга», а получатель - «Джон». Другой пример: «книга принадлежит мне» потребуются две метки, такие как «владеет» и «владелец», а «книга была продана Джону» потребуются две другие метки, такие как тема и получатель, несмотря на то, что эти два пункта похожи. к функциям «субъект» и «объект».

История

В 1968 году Чарльз Дж. Филлмор предложил первую идею обозначения семантических ролей . Его предложение привело к проекту FrameNet, который создал первый крупный вычислительный лексикон, систематически описывающий многие предикаты и их соответствующие роли. Дэниел Гилдеа (в настоящее время работает в Университете Рочестера , ранее - Калифорнийский университет, Беркли / Международный институт компьютерных наук ) и Даниэль Джурафски (в настоящее время преподает в Стэнфордском университете , но ранее работает в Университете Колорадо и Калифорнийском университете в Беркли ) разработали первую систему автоматической семантической маркировки ролей. на базе FrameNet. PropBank корпус добавлены созданная вручную семантическая роль аннотации к Penn Treebank своду Wall Street Journal текстов. Многие системы автоматического назначения семантических ролей использовали PropBank в качестве обучающего набора данных, чтобы научиться автоматически аннотировать новые предложения.

Использует

Маркировка семантических ролей в основном используется машинами для понимания ролей слов в предложениях. Это приносит пользу приложениям, подобным программам обработки естественного языка, которым необходимо понимать не только слова языков, но и то, как их можно использовать в различных предложениях. Лучшее понимание семантической классификации ролей может привести к прогрессу в вопросе ответа , извлечении информации , автоматический текст реферирования , интеллектуальном анализе данных текста и распознавании речи .

Смотрите также

Рекомендации

  1. ^ Лаукс, Майкл (2019-01-13). «Если вы еще не знали» . Блог SunJackson (на китайском языке) . Проверено 8 декабря 2020 .
  2. ^ Удав, Ганс; Дакс, Райан. «Из прошлого в настоящее: от корпусных рамок к семантическим рамкам» (PDF).
  3. ^ Gildea, Даниил; Джурафски, Даниэль (2000). «Автоматическая разметка смысловых ролей» . Труды 38-го Ежегодного собрания Ассоциации компьютерной лингвистики - ACL '00 . Гонконг: Ассоциация компьютерной лингвистики: 512–520. DOI : 10.3115 / 1075218.1075283 .
  4. ^ Парк, Jaehui (2019). «Избирательно связанное самовнимание для обозначения семантических ролей». Прикладные науки . 9 (8) - через ProQuest.
  5. ^ Gildea, Даниил; Джурафский, Даниэль. «Автоматическое обозначение семантических ролей» (PDF) . Ассоциация компьютерной лингвистики . 28 (3).

Внешние ссылки