Thésaurii et ontologies (similitudes, différences et conversion)

Similitudes entre un thésaurus et une ontologie

  • décrivent un domaine
  • contiennent des termes et les relations parmi ces termes,
  • se servent des hiérarchies
  • utilisées par des humains dans des applications de gestion de l’information pour cataloguer et rechercher l’information,
  • nécessitent un maintien et une mise à jour continuelle.

      Différences

      • thesaurii : nombre limité de relations possibles
      • Ambiguïtés entre termes homonymes (ajout d’un terme restrictif) ex.: tiredness (physiology) et tiredness (physics)
      • ontologies : plus de relations possibles que dans un thésaurus.

      Méthodologie de conversion (selon Soergel)

      1. Analyse du thésaurus existant et définition de la structure de l’ontologie
      • désambiguïser les relations : Ex.: TG et TS (thésaurus) correspondent à la relation IS A(ontologie)
      • élaboration de cartes de thèmes (mapping)
      • décider sur le format d’ontologie :
      • KOS (moins stricte)
      • SKOS (moins stricte)
      • OWL (sémantique stricte)
      • XTM
      • Zthes XML Schema

      2. Alimenter l’ontologie avec les termes (valeurs) du thésaurus

      3. Editer manuellement avec un éditeur d’ontologies (par ex. : Protégé)

      • rendre l’information existante plus précise
      • ajouter de nouvelles informations

      Expériences de conversion :

      FAO : Organisation des Nations Unis pour l’alimentation et l’agriculture

      L’objectif de ce projet open source de conversion du thésaurus d’agriculture en ontologie est d’élaborer une plateforme multilingue de concepts dans le domaine agricole. Pour cela, le langage OWL a été choisi pour représenter le modèle d’ontologie. Avec la conversion, les termes ne seront plus arrangés dans une hiérarchie. Chaque terme devient une entité séparée (par langue(s)) , qui peut être liée à des concepts ou à d’autres termes. Le groupe de projet a développé le modèle OWL, sans l’avoir encore alimenté avec des contenus.

      European Centre for Ontological Research, Universität des Saarlandes, Allemagne

      Ce projet avait pour but d’évaluer si le thésaurus bio-médical ‘NCI’ (version en-ligne) était conforme aux principes d’une ontologie. Il existait déjà une représentation du thésaurus en ontologie (langage OWL). Le groupe projet a trouvé des erreurs et des contradictions en ce qui concerne les principes de création des termes et de la représentation de la connaissance ainsi que des définitions verbales et formelles incorrectement attribuées.

      Mark van Assem, Maarten R. Menken, Guus Schreiber, Jan Wielemaker, Bob Wielinga

      Cet article décrit une méthode pour convertir les thesaurii existants en RDF et OWL. La méthode identifie quatre étapes dans le processus de conversion. Dans chaque étape, des décisions doivent être prises concernant la syntaxe ou la sémantique de la représentation résultante. Chaque étape est soutenue par un certain nombre de directives. La méthode est illustrée par des conversions de deux grands thesaurii : MeSH et WordNet.

      Chang Chun and Lu Wenlin, Scientech Documentation and Information Center (SDIC), Beijing, Chine

      Le projet propose une méthodologie pour convertir un sous-ensemble de termes et de relations d’un thésaurus agricole d’une base de données vers RDF avec l’outil KAON.

      Mona

      Publicités

      Laisser un commentaire

      Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

      Logo WordPress.com

      Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

      Photo Google+

      Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

      Image Twitter

      Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

      Photo Facebook

      Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

      Connexion à %s

      %d blogueurs aiment cette page :