Pour l’attribution d’un identifiant ARK, l’équipe  LODex a adopté une solution non centralisée. Ce choix conduit à s’interroger sur la notion de subpublisher et sur la génération de cette composante de l’ARK.

D’un point de vue intellectuel et institutionnel, un organisme comprenant plusieurs départements, services ou équipes peut vouloir permettre à chaque entité de conserver une “autonomie” et donc une responsabilité sur l’attribution des ARK. Aussi il devra pouvoir être reconnu et actif. À partir de l’enregistrement de chaque subpublisher dans le registre ARK installé à cet effet, chacun sera autorisé, pour chaque jeu de données qu’il aura créé, à réserver une séquence qui viendra construire la partie fixe de l’ARK après l’autorité nommante ou NAAN.

Comment LODex envisage la génération d’ARK ?

Il faut définir des règles de création et d’utilisation des identifiants : que souhaite-t-on identifier  avec des ARK ? De quelles ressources s’agit-il ? Si on souhaite l’utiliser pour plusieurs types de ressources, l’utilisation de préfixes correspondant à des sous-ensembles est recommandée : les subpublishers.
Par exemple,  les identifiants commençant par “XXX” (code du subpublisher) et correspondraient aux ressources d’un jeu de données / d’un projet / d’une équipe / …

Quel logiciel pour générer des identifiants ARK avec LODEX ?

Il est possible d’utiliser une application permettant de générer des identifiants conformes à la spécification ARK et uniques au sein de son NAAN. Cela peut être un outil développé en interne, c’est le cas pour LODEX, sachant qu’un logiciel open source existe  pour cela : NOID (Nice Opaque Identifiers). Ce logiciel a pour vocation de générer des identifiants uniques, et peut générer des identifiants ARK en utilisant un paramétrage spécifique.

Un service récemment mis en place par la CDL permet, moyennant une inscription, de générer des identifiants ARK et de les maintenir : EZID. Ce service existe à la fois sous forme d’une interface en ligne, et sous la forme d’une API qui permet d’automatiser la génération en masse d’identifiants. Ce service est gratuit dans la mesure où l’institution utilise ARK (ce service fonctionne aussi pour les identifiants DOI).

L’équipe LODex a quant à elle choisi un outil développé en interne : ezArk. Il a deux fonctionnalités principales :

  1. gérer les codes des subpublishers (création, restitution)
  2. générer des identifiants uniques

Dans le cadre de l’expérimentation, seule la fonction de registre de subpublisher est utilisée (surtout pour de gros corpus).

Résoudre des identifiants ARK dans LODEX

Il faut ensuite un logiciel permettant de transformer un ARK en l’URI de la ressource qui y correspond.

La troisième fonctionnalité d’ezArk est la résolution d’ARK.

Par exemple, si on a créé un subpublisher pour le jeu de données “example”, ezARK peut créer un code “DHJ”, et y associer l’URL “http://example.lod.istex.fr/=/” et rediriger “http://ark.inist.fr/ark:/67375/DHJ-123456789” (exemple fictif) vers “http://example.lod.istex.fr/=/ark:/67375/DHJ-123456789”.