Язык веб-онтологий - Web Ontology Language

Язык веб-онтологий OWL
Положение дел Опубликовано
Год начался 2004 г.
Редакторы Майк Дин ( BBN Technologies ), Гус Шрайбер
Базовые стандарты Структура описания ресурсов , RDFS
Домен Семантическая сеть
Сокращенное название СОВА
Веб-сайт Ссылка на OWL
OWL 2 Язык веб-онтологий
Положение дел Опубликовано
Год начался 2009 г.
Редакторы Рабочая группа W3C OWL
Базовые стандарты Структура описания ресурсов, RDFS
Домен Семантическая сеть
Сокращенное название СОВА 2
Веб-сайт OWL 2 Обзор

Язык веб-онтологий ( OWL ) - это семейство языков представления знаний для создания онтологий . Онтологии - это формальный способ описания таксономий и классификационных сетей, по сути определяющий структуру знаний для различных областей: существительные, представляющие классы объектов, и глаголы, представляющие отношения между объектами.

Онтологии напоминают иерархии классов в объектно-ориентированном программировании, но есть несколько важных отличий. Иерархии классов предназначены для представления структур, используемых в исходном коде, которые развиваются довольно медленно (возможно, с ежемесячными пересмотрами), тогда как онтологии предназначены для представления информации в Интернете и, как ожидается, будут развиваться почти постоянно. Точно так же онтологии обычно гораздо более гибкие, поскольку они предназначены для представления информации в Интернете, поступающей из всех видов разнородных источников данных. С другой стороны, иерархии классов обычно довольно статичны и полагаются на гораздо менее разнообразные и более структурированные источники данных, такие как корпоративные базы данных.

Языки OWL характеризуются формальной семантикой . Они построены на стандарте XML консорциума World Wide Web (W3C) для объектов, который называется инфраструктурой описания ресурсов (RDF). OWL и RDF привлекли значительный академический, медицинский и коммерческий интерес.

В октябре 2007 года была создана новая рабочая группа W3C, которая расширила OWL несколькими новыми функциями, как это было предложено в заявке участников OWL 1.1. W3C анонсировал новую версию OWL 27 октября 2009 года. Эта новая версия, получившая название OWL 2, вскоре нашла свое применение в семантических редакторах, таких как Protégé, и в средствах семантического мышления, таких как Pellet, RacerPro, FaCT ++ и HermiT.

Семейство OWL содержит множество видов, сериализаций, синтаксисов и спецификаций с похожими именами. OWL и OWL2 используются для обозначения спецификаций 2004 и 2009 годов соответственно. Будут использоваться полные названия видов, включая версию спецификации (например, OWL2 EL). При более общем обращении будет использоваться семейство OWL .

История

Ранние онтологические языки

Онтологическое развитие философии и информатики имеет долгую историю . С 1990-х годов был проведен ряд исследований, посвященных тому, как идея представления знаний (KR) от искусственного интеллекта (AI) может быть использована во всемирной паутине. К ним относятся языки, основанные на HTML (называемый SHOE ), основанный на XML (называемый XOL, позже OIL ), а также различные языки KR на основе фреймов и подходы к получению знаний.

Языки онтологий для Интернета

В 2000 году в США DARPA начало разработку DAML под руководством Джеймса Хендлера . В марте 2001 года Объединенный комитет ЕС / США по языкам разметки агентов решил, что DAML следует объединить с OIL. / США Специальная совместная рабочая группа ЕС по Агент Языки разметки гипертекста была созвана для разработки DAML + OIL как язык веб - онтологий. Эта группа совместно финансировалась DARPA (в рамках программы DAML) и проектом финансирования технологий информационного общества (IST) Европейского союза . DAML + OIL был задуман как тонкий слой над RDFS с формальной семантикой, основанной на логике описания (DL).

DAML + OIL оказывает особенно большое влияние на OWL; Дизайн OWL был специально основан на DAML + OIL.

Стандарты семантической сети

Семантическая сеть Web обеспечивает общую структуру, которая позволяет совместно использовать и повторно использовать данные в рамках приложений, предприятий и сообществ.

-  Консорциум World Wide Web, W3C Semantic Web Activity

Схема RDF

язык декларативного представления, на который влияют идеи представления знаний

-  Консорциум World Wide Web, Метаданные

В конце 1990-х годов деятельность по метаданным Консорциума Всемирной паутины (W3C) начала работу над схемой RDF (RDFS), языком для совместного использования словарей RDF . RDF стал Рекомендацией W3C в феврале 1999 года, а RDFS - кандидатом в рекомендацию в марте 2000 года. В феврале 2001 года действие семантической паутины заменило действие метаданных. В 2004 году (как часть более широкой версии RDF) RDFS стала Рекомендацией W3C. Хотя RDFS обеспечивает некоторую поддержку спецификации онтологий, необходимость в более выразительном языке онтологий стала очевидной.

Рабочая группа по веб-онтологии

В понедельник, 31 мая, наша рабочая группа официально завершит свою работу. Мы достигли всего, что нам было поручено сделать, и я считаю, что наша работа получает высокую оценку.

-  Джеймс Хендлер и Гус Шрайбер, Рабочая группа по веб-онтологии: выводы и дальнейшая работа

Консорциум World Wide Web (W3C) создал рабочую группу по веб-онтологии как часть своей деятельности по семантической сети. Он начал работу 1 ноября 2001 года с сопредседателями Джеймсом Хендлером и Гусом Шрайбером. Первые рабочие проекты абстрактного синтаксиса , справочника и синопсиса были опубликованы в июле 2002 года. OWL стал официальной рекомендацией W3C 10 февраля 2004 года, а 31 мая 2004 года рабочая группа была распущена.

Рабочая группа OWL

В 2005 году на семинаре OWL Experiences And Directions Workshop был сформирован консенсус в отношении того, что недавние достижения в логике описания позволят сделать более выразительный пересмотр для более полного удовлетворения требований пользователей при сохранении хороших вычислительных свойств. В декабре 2006 года в W3C было подано заявление члена OWL1.1. W3C учредил рабочую группу OWL как часть деятельности по семантической паутине в сентябре 2007 года. В апреле 2008 года эта группа решила назвать этот новый язык OWL2, что указывает на существенную переработку.

OWL 2 стал рекомендацией W3C в октябре 2009 года. OWL 2 представляет профили для улучшения масштабируемости в типичных приложениях.

Акроним

Почему бы не быть непоследовательным хотя бы в одном аспекте языка, который связан с непротиворечивостью?

-  Гус Шрайбер, почему OWL, а не WOL?

OWL был выбран в качестве легко выраженной аббревиатурой , что дало бы хорошие логотипы, предложить мудрость и честь Уильяма А. Мартин «s One World Язык представления знаний проекта с 1970 - х годов.

Принятие

Обзор онтологий 2006 года, доступных в сети, собрал 688 онтологий OWL. Из них 199 были OWL Lite, 149 были OWL DL и 337 OWL Full (по синтаксису). Они обнаружили, что 19 онтологий имеют более 2000 классов, а 6 - более 10 000. В том же опросе было собрано 587 словарей RDFS.

Онтологии

Онтология - это явная спецификация концептуализации.

-  Том Грубер , подход к переводу спецификаций переносимых онтологий

Данные, описываемые онтологией в семействе OWL, интерпретируются как набор «индивидов» и набор «утверждений свойств», которые связывают этих индивидов друг с другом. Онтология состоит из набора аксиом, которые накладывают ограничения на наборы индивидов (называемых «классами») и типы отношений, разрешенные между ними. Эти аксиомы обеспечивают семантику, позволяя системам выводить дополнительную информацию на основе явно предоставленных данных. Полное введение в выразительную мощь OWL представлено в Руководстве W3C по OWL .

Онтологии OWL могут импортировать другие онтологии, добавляя информацию из импортированной онтологии в текущую онтологию.

Пример

Онтология, описывающая семейства, может включать аксиомы, утверждающие, что свойство «hasMother» присутствует только между двумя индивидуумами, когда также присутствует «hasParent», и что индивидуумы класса «HasTypeOBlood» никогда не связаны через «hasParent» с членами «HasTypeABBlood». класс. Если указано, что индивидуальная Харриет связана через «hasMother» с индивидуальной Сью, и что Харриет является членом класса «HasTypeOBlood», то можно сделать вывод, что Сью не является членом «HasTypeABBlood». Однако это верно только в том случае, если понятия «родитель» и «мать» означают только биологического родителя или мать, а не социального родителя или матери.

Разновидность

OWL диалекты

Спецификация OWL, одобренная W3C, включает определение трех вариантов OWL с разными уровнями выразительности. Это OWL Lite, OWL DL и OWL Full (в порядке возрастания выразительности). Каждый из этих подъязыков является синтаксическим расширением своего более простого предшественника. Имеет место следующий набор соотношений. Их обратные нет.

  • Каждая юридическая онтология OWL Lite является юридической онтологией OWL DL.
  • Каждая юридическая онтология OWL DL является юридической онтологией OWL Full.
  • Каждый действительный вывод OWL Lite является действительным выводом OWL DL.
  • Каждое действительное заключение OWL DL является действительным заключением OWL Full.

OWL Lite

Первоначально OWL Lite предназначался для поддержки тех пользователей, которым в первую очередь нужна иерархия классификации и простые ограничения. Например, в то время как он поддерживает мощностные ограничения, она допускает только значение мощности 0 или 1. Он надеялся , что было бы проще обеспечить поддержку инструмента для OWL Lite , чем его более выразительные родственники, что позволяет быстро пути миграции для систем с использованием тезаурусов и другими таксономии . На практике, однако, большинство ограничений выразительности, накладываемых на OWL Lite, сводятся лишь к синтаксическим неудобствам: большинство конструкций, доступных в OWL DL, могут быть построены с использованием сложных комбинаций функций OWL Lite, и они столь же выразительны, как и логика описания . Таким образом, разработка инструментов OWL Lite оказалась почти такой же сложной, как разработка инструментов для OWL DL, а OWL Lite широко не используется.

СОВА DL

OWL DL разработан для обеспечения максимально возможной выразительности при сохранении вычислительной полноты ( выполняется либо φ, либо ¬φ), разрешимости (существует эффективная процедура для определения выводимости φ) и наличия практических алгоритмов рассуждений. OWL DL включает в себя все языковые конструкции OWL, но их можно использовать только при определенных ограничениях (например, количественные ограничения не могут быть наложены на свойства, которые объявлены транзитивными; и хотя класс может быть подклассом многих классов, класс не может быть экземпляром другого класса). OWL DL назван так из-за его соответствия логике описания , области исследований, в которой изучались логики, которые составляют формальную основу OWL.

OWL Полный

OWL Full основан на семантике, отличной от семантики OWL Lite или OWL DL, и был разработан для сохранения некоторой совместимости со схемой RDF. Например, в OWL Full класс можно рассматривать одновременно как совокупность индивидов и как отдельную личность; это не разрешено в OWL DL. OWL Full позволяет онтологии расширять значение предопределенного (RDF или OWL) словаря. OWL Full неразрешим, поэтому никакое программное обеспечение для рассуждений не может выполнить для него полное рассуждение.

OWL2 профили

В OWL 2 есть три подъязыка языка. OWL 2 EL - фрагмент, имеющий полиномиальную временную сложность рассуждения; OWL 2 QL разработан для облегчения доступа и запросов к данным, хранящимся в базах данных; OWL 2 RL - это подмножество правил OWL 2.

Синтаксис

Семейство языков OWL поддерживает множество синтаксисов. Полезно отличать синтаксисы высокого уровня, направленные на спецификацию, от синтаксисов обмена, более подходящих для общего использования.

Высокий уровень

Они близки к онтологической структуре языков семейства OWL.

Абстрактный синтаксис OWL

Синтаксис высокого уровня используется для определения структуры и семантики онтологии OWL.

Абстрактный синтаксис OWL представляет онтологию как последовательность аннотаций , аксиом и фактов . Аннотации несут метаданные, ориентированные на машины и человека. Информация о классах, свойствах и индивидуумах, составляющих онтологию, содержится только в аксиомах и фактах. Каждый класс, свойство и лицо либо анонимны, либо идентифицируются ссылкой URI . Факты содержат данные либо о человеке, либо о паре отдельных идентификаторов (идентифицируемые объекты являются разными или одинаковыми). Аксиомы определяют характеристики классов и свойств. Этот стиль подобен фреймовым языкам и весьма отличается от хорошо известных синтаксисов для DL и Resource Description Framework (RDF).

Шон Беххофер и др. утверждают, что, хотя этот синтаксис трудно разобрать, он вполне конкретен. Они приходят к выводу, что абстрактный синтаксис имени может вводить в заблуждение.

Функциональный синтаксис OWL2

Этот синтаксис точно соответствует структуре онтологии OWL2. Он используется OWL2 для определения семантики, сопоставлений для обмена синтаксисами и профилями.

Синтаксисы обмена

OWL RDF / XML-сериализация
XML.svg
Расширение имени файла
.owx, .owl, .rdf
Тип интернет-СМИ
приложение / сова + xml, приложение / rdf + xml
Разработано Консорциум World Wide Web
Стандарт OWL 2 XML-сериализация 27 октября 2009 г . ; 11 лет назад , ссылка на OWL, 10 февраля 2004 г . ; 17 лет назад ( 2009-10-27 )
 ( 2004-02-10 )
Открытый формат ? да

Синтаксисы RDF

Синтаксические отображения в RDF указаны для языков семейства OWL. Было разработано несколько форматов сериализации RDF . Каждый приводит к синтаксису для языков в семействе OWL через это сопоставление. RDF / XML является нормативным.

OWL2 XML-синтаксис

OWL2 определяет сериализацию XML, которая точно моделирует структуру онтологии OWL2.

Манчестерский синтаксис

Манчестерский синтаксис - это компактный, удобочитаемый синтаксис со стилем, близким к фреймовым языкам. Доступны варианты для OWL и OWL2. Не все онтологии OWL и OWL2 могут быть выражены в этом синтаксисе.

Примеры

  • Язык веб-онтологий W3C OWL 2 предоставляет примеры синтаксиса.

Чайная онтология

Рассмотрим онтологию чая, основанную на классе Tea. Во-первых, необходим идентификатор онтологии. Каждая онтология OWL должна быть идентифицирована URI (например, http://www.example.org/tea.owl). Этот пример дает представление о синтаксисе. Для экономии места ниже преамбулы и определения префиксов были пропущены.

Функциональный синтаксис OWL2
Ontology(<http://example.org/tea.owl>
  Declaration( Class( :Tea ) )
)
OWL2 XML-синтаксис
 <Ontology ontologyIRI="http://example.org/tea.owl" ...>
   <Prefix name="owl" IRI="http://www.w3.org/2002/07/owl#"/>
   <Declaration>
     <Class IRI="Tea"/>
   </Declaration>
 </Ontology>
Манчестерский синтаксис
Ontology: <http://example.org/tea.owl>
Class: Tea
Синтаксис RDF / XML
<rdf:RDF ...>
    <owl:Ontology rdf:about=""/>
    <owl:Class rdf:about="#Tea"/>
</rdf:RDF>
RDF / Черепаха
 <http://example.org/tea.owl> rdf:type owl:Ontology .
 :Tea  rdf:type            owl:Class .

Семантика

Отношение к логике описания

Классы OWL соответствуют концепциям логики описания (DL) , свойства OWL - ролям DL , в то время как отдельные лица называются одинаково как в терминологии OWL, так и в терминологии DL.

Вначале IS-A был довольно простым. Сегодня, однако, эта связь наследования имеет почти столько же значений, сколько существует систем представления знаний.

-  Рональд Дж. Брахман , Что такое IS-A, а что нет

Ранние попытки построения больших онтологий сопровождались отсутствием четких определений. Члены семейства OWL обладают теоретико-модельной формальной семантикой и, таким образом, имеют прочную логическую основу.

Логики описания - это семейство логик, которые представляют собой разрешимые фрагменты логики первого порядка с привлекательными и хорошо понятными вычислительными свойствами. Семантика OWL DL и OWL Lite основана на DL. Они сочетают в себе синтаксис для описания и обмена онтологиями и формальную семантику, которая придает им смысл. Например, OWL DL соответствует логике описания, а OWL 2 соответствует логике. Для этих DL существуют надежные , полные, завершающие рассуждения (т. Е. Системы, которые гарантированно выводят все следствия знаний в онтологии).

Отношение к RDFS

OWL Full предназначен для совместимости со схемой RDF (RDFS) и расширения значений существующего словаря структуры описания ресурсов (RDF). Теория модель описывает формальную семантику для RDF. Эта интерпретация обеспечивает смысл словаря RDF и RDFS. Итак, значение онтологий OWL Full определяется расширением значения RDFS, а OWL Full является семантическим расширением RDF.

Предположение об открытом мире

Предположение [закрытого] мира подразумевает, что все, что мы не знаем, ложно , в то время как предположение открытого мира утверждает, что все, что мы не знаем, не определено .

-  Стефано Маццокки, « Закрытый мир против открытого мира: первая битва за семантическую паутину»

Языки семейства OWL используют допущение открытого мира . Согласно предположению открытого мира, если утверждение не может быть доказано с помощью текущих знаний, мы не можем сделать вывод, что утверждение ложно.

В отличие от других языков

Реляционная база данных состоит из наборов кортежей с теми же атрибутами . SQL - это язык запросов и управления для реляционных баз данных. Пролог - это логический язык программирования . Оба используют предположение о закрытом мире .

Терминология

Языки семейства OWL могут создавать классы, свойства, определять экземпляры и их операции.

Экземпляры

Экземпляр является объектом. Соответствует описанию логики индивидуума .

Классы

Класс представляет собой совокупность объектов. Класс может содержать лицо, экземпляры класса. У класса может быть любое количество экземпляров. Экземпляр может не принадлежать ни к одному, одному или нескольким классам.

Класс может быть подклассом другого, наследуя характеристики от своего родительского суперкласса . Это соответствует логической категоризации и DL концепции включения нотированы .

Все классы являются подклассами совы: Вещь ( обозначена сверху в DL ), корневой класс.

Все классы не подклассы совы: Nothing (DL Дно нотировано ), в пустом классе. Ни один экземпляр не является членом owl: ничего. Разработчики моделей используют owl: Thing и owl: nothing, чтобы утверждать факты обо всех или ни о каких экземплярах.

Класс и их члены могут быть определены в OWL либо расширение или интенция . Отдельному человеку может быть явно назначен класс с помощью утверждения Class , например, мы можем добавить утверждение, что Королева Элизабет является (n экземпляром) человека , или с помощью выражения класса с операторами ClassExpression каждый экземпляр человеческого класса, который имеет женское значение к свойству sex является экземпляром класса woman .

Пример

Давайте назовем человека классом всех людей в мире, который является подклассом совы: вещь. Класс всех женщин (скажем, женщин ) в мире - это подкласс человека . Тогда у нас есть

Можно отметить принадлежность некоторого человека к классу

ClassAssertion( human George_Washington )

и включение в классы

SubClassOf( woman human ) 

Первый означает «Джордж Вашингтон - человек», а второй «каждая женщина - человек».

Характеристики

Свойство - это характеристика класса - направленное бинарное отношение, которое определяет некоторый атрибут, который является истинным для экземпляров этого класса. Свойства иногда действуют как значения данных или ссылки на другие экземпляры. Свойства могут иметь логические особенности, например, быть транзитивными, симметричными, инверсными и функциональными. У свойств также могут быть домены и диапазоны.

Свойства типа данных

Свойства типа данных - это отношения между экземплярами классов и литералами RDF или типами данных схемы XML. Например, modelName (тип данных String) является свойством класса Manufacturer. Они сформулированы с использованием типа owl: DatatypeProperty .

Свойства объекта

Свойства объекта - это отношения между экземплярами двух классов. Например, ownBy может быть свойством типа объекта класса Vehicle и может иметь диапазон, который является классом Person. Они сформулированы с использованием owl: ObjectProperty .

Операторы

Языки семейства OWL поддерживают различные операции с классами, такие как объединение , пересечение и дополнение . Они также позволяют перечисление классов, мощность , непересекаемость и эквивалентность .

Метаклассы

Метаклассы - это классы классов. Они разрешены в OWL full или с функцией, называемой каламбуром класса / экземпляра.

Публичные онтологии

Библиотеки

Биомедицинские

Стандарты

Браузеры

Следующие инструменты включают браузеры общедоступных онтологий:

Поиск

Ограничения

  • Нет прямой языковой поддержки для русских отношений. Например, разработчики моделей могут захотеть описать качества отношения, связать более двух человек или связать одного человека со списком. Это невозможно сделать в OWL. Вместо этого им может потребоваться принять шаблон, который кодирует значение вне формальной семантики.

Смотрите также

использованная литература

дальнейшее чтение