LODEX LOV

LODEX est un outil conçu et maintenu par l’équipe LODex (Link Open Data experimentation). La finalité est de sélectionner des jeux de données à partir des travaux des équipes ISTEX à l’INIST-CNRS pour les publier sur le web. Linked Open Vocabulary (LOV) offre une pléiade de vocabulaires, le “lovely cloud”, dans lequel il est nécessaire d’identifier les vocabulaires pertinents par rapport à la thématique étudiée.

Le  périmètre du “réservoir doc” ou ISTEX est une source intéressante pour explorer et tester l’alignement avec des ressources disponibles sur le web. Ceci dans le respect des formats et normes en vigueur.

À ce jour, il n’y a pas de modèle ou de préconisation ou d’automatisation clairs des standards pour décrire un ensemble de données (jeu) disponible sur le Web. Chaque établissement ou équipe de travail explore et tente d’identifier les vocabulaires du LOV qui sont spécifiques aux applications et objectifs particuliers. Ceci nécessite une phase préliminaire pour détecter, argumenter et justifier des choix. Nous avons pris le parti de faire confiance à ce que l’éditeur de vocabulaire déclare, si elle est la définition est cohérente.

Pour exprimer des données dans un format “pivot” du web sémantique, il est préférable d’utiliser autant que possible des classes et des propriétés déjà définies dans des vocabulaires existants. En effet, les ressources ou données appartiennent généralement à des classes  qualifiées grâce à des propriétés ou prédicats qui les définissent selon un certain nombre de critères comme : attribut ou relation spécifique de ces ressources. Les classes et les propriétés sont elles même décrites dans des vocabulaires qui permettent ensuite aux machines de les comprendre et de les exploiter. Ces vocabulaires permettent dans la phase de “curation”  (ingestion itérative le cas échéant) d’affecter et composer de façon automatique des Uniform Resource Identifier (URI) pour chaque ressource.