Граф знаний - Knowledge graph

Пример концептуальной схемы

В представлении знаний и рассуждениях , граф знаний является базой знаний , которая использует граф структурированной модели данных или топологию для интеграции данных . Графы знаний часто используются для хранения взаимосвязанных описаний сущностей  - объектов, событий, ситуаций или абстрактных концепций - с семантикой произвольной формы .

С момента развития семантической паутины графы знаний часто ассоциируются со связанными проектами открытых данных , уделяя особое внимание связям между концепциями и сущностями. Они также широко используются в поисковых системах, таких как Google , Bing и Yahoo ; механизмы знаний и службы ответов на вопросы, такие как WolframAlpha , Apple Siri и Amazon Alexa ; и социальные сети, такие как LinkedIn и Facebook .

История

Этот термин был придуман еще в 1972 году при обсуждении того, как создавать модульные системы обучения для курсов. В конце 1980-х Университет Гронингена и Университет Твенте совместно начали проект под названием «Графы знаний», сфокусированный на разработке семантических сетей с ребрами, ограниченными ограниченным набором отношений, чтобы упростить использование алгебр на графе. В последующие десятилетия различия между семантическими сетями и графами знаний были размыты.

Некоторые графики ранних знаний были тематическими. В 1985 году была основана Wordnet , улавливающая семантические отношения между словами и значениями - применение этой идеи к самому языку. В 2005 году Марк Вирк основал Geonames, чтобы фиксировать взаимосвязи между различными географическими названиями, местами и связанными с ними объектами. В 1998 году Эндрю Эдмондс из Science in Finance Ltd в Великобритании создал систему под названием ThinkBase, которая предлагала рассуждения на основе нечеткой логики в графическом контексте.

В 2007 году и DBpedia, и Freebase были основаны как хранилища знаний общего назначения на основе графов. DBpedia сосредоточилась исключительно на данных, извлеченных из Википедии, в то время как Freebase также включала ряд общедоступных наборов данных. Ни те, ни другие не называли себя «графом знаний», но разработали и описали связанные концепции.

В 2012 году Google представил свою сеть знаний , основанную, среди прочего, на DBpedia и Freebase. Позже они включили RDFa , Microdata , контент JSON-LD, извлеченный из проиндексированных веб-страниц, включая CIA World Factbook , Wikidata и Wikipedia . Типы сущностей и отношений, связанные с этим графом знаний, были дополнительно организованы с использованием терминов из словаря schema.org. Сеть знаний Google стала успешным дополнением к поиску на основе строк в Google, а его популярность в Интернете привела к более широкому использованию этого термина.

С тех пор несколько крупных транснациональных корпораций рекламировали использование графов знаний, что еще больше популяризировало этот термин. К ним относятся Facebook, LinkedIn, Airbnb , Microsoft , Amazon , Uber и eBay .

В 2019 году IEEE объединил свои ежегодные международные конференции по теме «Большие знания» и «Интеллектуальный анализ данных и интеллектуальные вычисления» в Международную конференцию по графу знаний.

Определения

Нет единого общепринятого определения графа знаний. Большинство определений рассматривают тему через призму семантической паутины и включают в себя следующие особенности:

  • Гибкие отношения между знаниями в тематических областях: граф знаний (i) определяет абстрактные классы и отношения сущностей в схеме, (ii) в основном описывает сущности реального мира и их взаимосвязи, организованные в виде графа, (iii) допускает потенциально взаимосвязь произвольных объекты друг с другом, и (iv) охватывает различные тематические области.
  • Общая структура : сеть сущностей, их семантические типы, свойства и отношения.
  • Обоснование рассуждений по предполагаемым онтологиям : граф знаний собирает и интегрирует информацию в онтологию и применяет логику рассуждений для получения новых знаний.

Однако существует множество представлений графов знаний, для которых некоторые из этих функций не актуальны. Для таких графов знаний более полезным может оказаться более простое определение:

  • Цифровая структура, которая представляет знания как концепции и отношения между ними (факты). Граф знаний может включать в себя онтологию, которая позволяет людям и машинам понимать его содержимое и рассуждать о нем.

Реализации

В дополнение к приведенным выше примерам этот термин использовался для описания проектов открытых знаний, таких как YAGO и Wikidata; федерации, такие как облако связанных открытых данных; ряд коммерческих поисковых инструментов, в том числе Spark, помощник по семантическому поиску Yahoo, Knowledge Graph от Google и Satori от Microsoft; и диаграммы сущностей LinkedIn и Facebook. Этот термин также все чаще используется в приложениях для создания заметок, позволяющих пользователю построить свой личный граф знаний.

Использование графа знаний для рассуждений над данными

Граф знаний формально представляет семантику, описывая сущности и их отношения. Графы знаний могут использовать онтологии в качестве слоя схемы. Делая это, они позволяют логический вывод для извлечения неявных знаний, а не только запросы, запрашивающие явные знания.

Чтобы разрешить использование графов знаний в различных задачах машинного обучения, было разработано несколько методов получения представлений скрытых функций для сущностей и отношений. Эти вложения графов знаний позволяют подключать их к методам машинного обучения, которым требуются векторы функций, такие как вложения слов . Это может дополнять другие оценки концептуального сходства.

Смотрите также

использованная литература

внешние ссылки

  • Уилл Дуглас Хевен (4 сентября 2020 г.). «Этот всезнайка ИИ учится, непрерывно читая всю сеть» . Обзор технологий Массачусетского технологического института . Дата обращения 5 сентября 2020 . Diffbot строит крупнейший в истории граф знаний, применяя распознавание изображений и обработку естественного языка для миллиардов веб-страниц.