Распределительно-реляционная база данных - Distributional–relational database

Дистрибутивный-реляционная база данных , или слово-вектор базы данных , является система управления базами данных (СУБД) , которая использует дистрибутивные слово векторные представления , чтобы обогатить семантику структурированных данных .

Поскольку распределенные словесные векторы могут быть построены автоматически из крупномасштабных корпусов , это обогащение поддерживает создание баз данных, которые могут встраивать крупномасштабные базовые знания здравого смысла в свои операции. Распределенно-реляционные модели могут применяться для построения не зависящих от схемы баз данных (баз данных, в которых пользователи могут запрашивать данные, не зная их схемы ), семантического поиска , интеграции схемы и индуктивных и абдуктивных рассуждений, а также различных приложений, в которых необходима семантически гибкая модель представления знаний. Основное преимущество распределенно-реляционных моделей перед чисто логическими / семантическими веб- моделями заключается в том, что основные семантические ассоциации могут быть автоматически получены из корпусов в отличие от определения вручную курируемых онтологий и баз знаний правил.

Распределительно-реляционные модели

Распределительно-реляционные модели сначала были формализованы как механизм, позволяющий справиться со словарным / семантическим разрывом между пользователями и схемой, лежащей в основе данных. В этом сценарии меры семантической связи распределения в сочетании с эвристикой семантического поворота могут поддерживать приближение между пользовательскими запросами (выраженными в их собственном словаре) и данными (выраженными в словаре разработчика).

В этой модели символы базы данных (сущности и отношения) встроены в распределенное семантическое пространство и имеют геометрическую интерпретацию в скрытом или явном семантическом пространстве. Геометрический аспект поддерживает семантическое приближение между сущностями из разных баз данных или между термином запроса и сущностью базы данных. Затем распределительная реляционная модель становится двухуровневой моделью, в которой семантика структурированных данных обеспечивает детализированную семантику, заданную разработчиком базы данных , которая расширяется семантической моделью распределения, которая содержит семантические ассоциации, выраженные при более широком использовании. Эти модели поддерживают обобщение от сценария закрытого взаимодействия (в котором разработчики баз данных и пользователи живут в одном контексте, например, в одной организации) до сценария открытого взаимодействия (например, разные организации, Интернет), создавая уровень абстракции между пользователями и конкретное представление концептуальной модели.

Рекомендации

  1. Перейти ↑ Harris, Z. (1954). «Распределительная структура». Слово. 10 (23): 146–162.
  2. ^ Метэ, Элизабет; Рош, Матьё; Teisseire, Maguelonne (16.06.2014). Обработка естественного языка и информационные системы: 19-я Международная конференция по приложениям естественного языка к информационным системам, NLDB 2014, Монпелье, Франция, 18-20 июня 2014 г. Материалы . Springer. ISBN   978-3-319-07983-7 .
  3. ^ Фрейтас, А. «Не зависящие от схемы запросы к базам данных с большой схемой: подход распределенной семантики», докторская диссертация, 2015 г.
  4. ^ Фрейтас, А., Хандшу, С., Карри, Э., Распределительно-реляционные модели: масштабируемая семантика для баз данных, Весенний симпозиум AAAI, Трек представления знаний и рассуждений, Стэнфорд, 2014 г.