RDF et OWL :
Le Web Sémantique :
Selon la définition de Tim Berners- Lee, créateur du web, le projet du Web Sémantique consiste à introduire dans la Toile certaines « indications de sens » afin de faciliter la recherche de documents et leur traitement automatisé.
Le Web sémantique, projet lancé en 1998 par Tim Berners-Lee (créateur des standards du W3C) a pour objectif d’améliorer nos rapports avec le Web en rendant justement l’information, qui y est contenue, utilisable par la machine.
« Une extension du web actuel, visant à définir précisément l’information, afin d’aider les ordinateurs et les personnes à mieux coopérer » Tim Berners-Lee, mai 2001, revue Scientific American.
Ambition du WS : définir et indexer l’information que contiennent les pages web.
Objectif : transformer les moteurs de recherche en agents intelligents capables d’interpréter les requêtes et de rendre des services les plus variés.
Le Web Sémantique dépend en grande partie de ses métadonnées.
Les outils :
Le format RDF (Resource Description Framework) :
Permet d’introduire des métadonnées aux données contenues dans une ressource textuelle normalisée au format XML.
Permet de définir des associations entre termes et concepts.
Le format XHTML : format HTML normalisé en XML :
Structuration logique des documents.
Marqueurs sémantiques pour décrire les documents.
Métadonnées :
Le terme de « méta-données », principalement employé par les informaticiens, est utilisé pour désigner des données qui aident à la classification ou à la compréhension du document électronique. Par exemple, des mots clés définissant son contenu, le nom de l’auteur ou encore sa date de création.
« Les méta-données sont utilisées par les machines comme par les hommes, et permettent des applications comme le classement automatique des documents, facilitant la recherche par la suite », Jean Delahousse, PDG de Mondeca, éditeur de logiciels spécialisé dans les technologies XML.
Sur le plan technique, les métadonnées peuvent être contenues dans un fichier XML séparé, ou directement intégrées dans le document.
Un cadre standard a ainsi été défini par le W3C et dénommé RDF (Resource Description Framework).
RDF :
RDF (Resource Description Framework) est un moyen d’encoder, échanger et réutiliser des métadonnées structurées. C’est un idiome XML développé par le W3C et ayant fait l’objet d’une Recommandation en 1999.
RDF ne précise pas la sémantique des ressources décrites par les différentes communautés d’utilisateurs de métadonnées. À l’instar d’XML, RDF est un langage extensible, un métalangage; c’est un cadre [framework] de description des ressources applicable à n’importe quel domaine d’application.
Le modèle RDF définit trois types d’objets :
Des ressources : les ressources sont tous les objets décrits par RDF. Généralement, ces ressources peuvent être aussi bien des pages Web que tout objet ou personne du monde réel. Les ressources sont alors identifiées par leur URI (Uniform Resource Identifier) ;
Des propriétés : une propriété est un attribut, un aspect, une caractéristique qui s’applique à une ressource. Il peut également s’agir d’une mise en relation avec une autre ressource ;
Des valeurs : les valeurs en question sont les valeurs particulières que prennent les propriétés.
Ces trois types d’objets peuvent être mis en relation par des assertions, c’est à dire des triplets (ressource, propriété, valeur), ou encore (sujet, prédicat, objet). Une description RDF est une suite d’assertions.
Exemple1 :
« Le chat mange la souri s ». Triplet (sujet=chat, objet=souris, prédicat=mange)
EN RDF/XML :
<rdf:Description rdf:about=« http://animal.org#chat »>
<mange>
<rdf:Description rdf:about=« http://animal.org#souris »>
</mange>
</rdf:description>
Il est possible de représenter les descriptions RDF par des graphes :
Dans un graphe RDF, on représente par des ellipses les ressources nommées (i.e. les objets qui possèdent des URI), et par des rectangles les littéraux (i.e. les constantes, qui ne possèdent pas d’URI).
En résumé :
-Le RDF peut être utilisé pour représenter tout objet, tant un site web qu’un individu.
-Le RDF peut être traité par une machine.
-Le RDF est composé de triplets : sujet/verbe/objet.
-Le sujet est toujours identifié par un URI : mais dans certains cas, on peut omettre l’URI, un URI factice sera généré dynamiquement.
-Le verbe est toujours identifié par un URI, sans aucune exception.
-L’objet est soit un URI, soit une valeur explicite (Exemple : une chaîne de caractères).
-Le RDF peut être représenté en XML.
Schémas RDF :
Les déclarations RDF définissent des relations entre des objets (nœud d’un graphe) qui appartiennent à un univers sémantique. Rien ne précise les mots-clés à utiliser dans la description des données. Pour comprendre les informations décrites, il faut que les termes employés appartiennent à des normes.
RDFS (pour « RDF Schema ») offre les moyens de définir un modèle (ou bien encore un schéma) de méta données qui permet de :
– Donner du sens aux propriétés associées à une ressource ;
– Formuler des contraintes sur les valeurs associées à une propriété afin de lui assurer aussi une signification.
RDF a ses propres schémas : Dublin Core pour les bibliothécaires, FOAF pour catégoriser les personnes, RSS utilisé en particulier pour la publication de news…
Dublin Core est un schéma de métadonnées générique défini par le Dublin Core Metadata Initiative et il est utilisé pour décrire de façon simple des ressources électroniques. C’est un ensemble standard de 15 informations avec une sémantique précise reflétant le type de données que l’on retrouve dans les catalogues ou les bibliogaphies.
RDFS est un format de catalogage né dans le contexte XML.
OWL :
OWL ( Web Ontology Language ) est conçu pour étendre les RDF et préciser les « ontologies ».
Trois versions disponibles : LITE, difficulté intermédiaire: DL et FULL : OWF FULL.
OWL fournit un grand nombre de constructeurs permettant d’exprimer de façon très fine les propriétés des classes définies.
OWL est un langage d’ontologie, il intègre des outils de comparaison des propriétés et des classes : identité, équivalence, contraire, cardinalité, symétrie, transitivité, disjonction, etc.
OWL offre aux machines une plus grande capacité d’interprétation du contenu web que RDF et RDFS, grâce à un vocabulaire plus large et à une vraie sémantique formelle.
Référence bibliographiques :
Anfana Traoré, Danièle Hérin, OWL et la description de ressources pédagogiques, Université de Montpellier II, Mars 2004.
Florence Amardeilh, Philippe Laublet, Jean-Luc Minel, Annotation documentaire et peuplement d’ontologie à partir d’extractions linguistiques, Laboratoire LaLICC, Université Paris IV
Patrice BUCHE, Les langages du web sémantique, UFR Informatique de l’INA P-G, 2006.
Jérôme Euzenat1, Raphaël Troncy, Web sémantique et pratiques documentaires, INRIA Rhône-Alpes, INA Bry-sur-Marne.
Serge FLEURY, Documents structurés, ILPGA, Paris, 2006.
Xavier Lacot , Introduction à OWL, un langage XML d’ontologies Web, Juin 2005.
Shelley Powers, Création d’un vocabulaire RDF (chapitre 6), O’Reilly, 2003
Liens internet:
Définir une ontologie avec OWL
Une introduction au web sémantique
What is an Ontology?
Introduction à OWL,un langage XML d’ontologies Web
Introduction à RDF
RDF
Web sémantique
SKOS
Ontologie
Ontologie
Boualem.