Posts Tagged: alignement

Ce sixième sprint d’ISTEX LOD, nommé « elles arrivent » en informations bibliographiques présente le script de transformation d’un flux de notices JSON en triplets contenant les informations bibliographiques de base des notices. Pour faire ça, nous avons ajouté des propriétés à l’ontologie ISTEX. C’est aussi l’occasion de présenter un schéma global du modèle des données chargées dans le triple store. Nous utilisons les corpus étiquetés de la tâche 12 de SemEval 2019 pour évaluer nos programmes de désambiguïsation et d’alignement vers GeoNames. Le triple store ISTEX est maintenant déclaré auprès de WikiData, ce qui devrait permettre les requêtes SPARQL fédérées à partir de notre endpoint.

Le web des données est censé être ouvert et lié (Linked Open Data). Mais en pratique, nous avons rencontré des obstacles imprévus. En cherchant à compléter nos données locales avec des données distantes, normalement accessibles par des interrogations SPARQL, nous avons recensé plusieurs sortes d’écueils, afin de pouvoir les éviter.

Le jeu de données :   http://inist-category.lod.istex.fr/ark:/67375/JPB-00000000-0.html     Description : Cette table correspond au choix de documenter des données ISTEX et plus particulièrement les catégories INIST. Il s’agit des codes de classement (tronqués à 3 niveaux) utilisés lors de l’indexation pour constituer les bases de données PASCAL et FRANCIS. Ces catégories ont fait l’objet…

Read More