Qu’est-ce qu’un identifiant ARK?

ARK (Archival Resource Key) est un système d’identification qui peut identifier tout type d’objet numérique mais aussi physique. La California Digital Library, CDL, est à l’origine du système et elle le maintient. La CDL affecte gratuitement un NAAN, Name Assigning Authority Number aux organisations qui en font la demande, et le stocke dans son registre. Ensuite l’organisation attribue les autres constituants.

On transforme cet identifiant pour en faire une URL en ajoutant le nom du serveur qui va donner accès à l’objet avec l’identifiant ARK, serveur qui est appelé NMA, Name Mapping Authority. Par conséquent, un identifiant ARK a la structure suivante :

L’autorité d’adressage (NMAH : Name Mapping Authority Host) est le service qui se charge de résoudre les identifiants ARK, c’est-à-dire de rendre un identifiant ARK “actionnable” en permettant l’accès à l’objet qu’il identifie et/ou à sa description.
La partie pérenne de l’identifiant est constituée du type d’identifiant, du numéro d’autorité nommante (NAAN) et du nom ARK proprement dit. Dans notre exemple il s’agit de la chaîne de caractères “ark:/12148/bpt6k107371t” :

  • Le type, ou schème, d’identifiant “ark:” déclare qu’il s’agit d’un identifiant ARK
  • Le numéro d’autorité nommante (NAAN : Name Assigning Authority Number) identifie une institution habilitée à attribuer des ARK.
    Ce numéro sur 5 caractères, unique au sein du schème “ark:” correspond, dans notre exemple, à la BNF.
  • Le nom ARK est un identifiant non signifiant attribué par l’autorité nommante. Il peut être composé de préfixes, qui permettent de regrouper de grands ensembles de ressources selon des critères laissés à l’appréciation de l’autorité nommante. Le nom ARK est composé d’une chaîne de caractères alphanumériques à l’exclusion des voyelles. Il est recommandé, bien que non obligatoire, de terminer le nom ARK par un caractère de contrôle.
  • Ce schéma simple à 3 composants peut être complété d’un suffixe optionnel (qualificatif), qui permet d’adresser hiérarchiquement un composant au sein de la ressource (par exemple une illustration dans un document).

Les identifiants ARK à l’Inist-cnrs

La CDL a attribué à l’Inist-CNRS le numéro 67375 pour NAAN.

Comme nous l’avons vu précédemment, la structure de la partie identifiant de l’ARK peut contenir un préfixe, que nous nommons « subpublisher » à l’Inist-CNRS. Ce dernier est une suite de 3 caractères alphanumériques et ce pour augmenter les combinaisons possibles ; il est incrémenté de manière automatique sur la base d’un algorithme (https://github.com/Inist-CNRS/node-inist-ark).

Dans le contexte de l’Inist-CNRS, il a été décidé de ne pas mémoriser de qualificatif. Le « subpublisher » a pour fonction de caractériser toutes les ressources d’un même jeu de données ou projets.

Il a été décidé de créer un registre de « subpublisher » pour garantir l’unicité et la cohérence du système d’identification. Pour un NAAN donné, chaque « subpublisher » est caractérisé par 4 éléments qui définissent le registre :

  • Nom (ou titre)
  • Sujet (absent du registre mais présent dans la fenêtre de dialogue)
  • Description
  • URL

Qu’est-ce que l’application ezArk

https://github.com/Inist-CNRS/ezark

C’est un outil  pour générer des identifiants ARK et pour résoudre des identifiants ARK.

Le cœur de cet outil est le registre ARK, il permet pour un NAAN donné de générer, recenser et garantir l’unicité des “préfixes” (sub publisher).

EzARK offre également la possibilité de générer des identifiants.

 

Génération d’ARKs : comment s’y prendre ?

Destination ARK : vos papiers