Attribuer un identifiant numérique DOI à une plateforme scientifique

3 - DOI et métadonnées enregistrés auprès de l’agence DataCite

Le consortium à but non lucratif DataCite est une agence spécialisée dans l’enregistrement d’identifiants pérennes DOI attribués à des données scientifiques (jeux et bases de données) et à d’autres types de produits issus de la recherche (audiovisuel, carte, image, logiciel, modèle, objet physique, service…). Les plateformes ou infrastructures scientifiques sont également concernées.
Le service DataCite Commons permet à tout public de rechercher et d’afficher les DOI avec les métadonnées associées enregistrés auprès de DataCite.
Le service Assign DOIs de DataCite s’adresse spécifiquement aux organisations attribuant des DOI. DataCite fournit une documentation détaillée sur les métadonnées à renseigner pour décrire l’objet auquel est attribué un DOI. Cette documentation est le schéma de métadonnées (en mai 2021, version 4.4 du 30 mars 2021).
Ce schéma accessible en téléchargement (pdf) présente les 20 métadonnées utilisées par DataCite pour enregistrer un DOI, avec six métadonnées obligatoires (Mandatory), six recommandées (Recommanded) et huit facultatives (Optional).

Métadonnées obligatoires :

  • Identifier : identifiant de la ressource, c’est-à-dire le DOI attribué par l’institution, qui sera enregistré avec ses métadonnées auprès de DataCite
  • Creator : auteurs ou collectivités-auteurs impliqués dans la production de données, ou auteurs de la publication (nom et identifiant de l’auteur – ex. : ORCID ID, nom et identifiant de l’affiliation de l’auteur…)
  • Title : titre de la ressource à laquelle est attribuée le DOI
  • Publisher : l’organisation qui produit ou émet ou publie ou distribue ou diffuse ou détient ou archive ou imprime la ressource
  • Publication Year : date de publication c’est-à-dire de mise à disposition de la ressource au public
  • Resource Type : type de la ressource, constitué d’un type spécifique libre (ex. : Infrastructure) et d’un type général issu d’une liste contrôlée de valeurs fournie par Datacite (ex. : Service)

Métadonnées recommandées :

  • Subject : thématique, mots-clés ou expressions décrivant le contenu intellectuel de la ressource
  • Contributors : tous les contributeurs physiques ou moraux de la ressource, associé chacun à un type (ContactPerson, DataCollector, DataCurator, Editor…) à sélectionner dans une liste de valeurs
  • Date : différentes dates possibles d’activités associées à la ressource, avec pour chacune un type (created, updated…) selon une liste contrôlée de valeurs
  • RelatedIdentifier : identifiants de ressources liées à la présente ressource, à associer chacun à un type issu d’une liste contrôlée de valeurs (ISBN, DOI, URL…), et à un type de relation sur liste contrôlée (IsPartOf, IsNewVersionOf, IsReviewedBy, IsDocumentedBy…)
  • Description : toute information complémentaire en texte libre décrivant la ressource, associée à un type de description sur liste (Abstract, Methods…)
  • Geolocation : région spatiale ou lieu précis de la ressource ou de ce sur quoi elle porte (longitude, latitude, emprise, texte libre descriptif…)

Métadonnées facultatives :

  • Language : langue principale de la ressource selon un code de langue international en 2 ou 3 caractères (norme ISO)
  • AlternatedIdentifier : autre identifiant de la ressource, libre, par exemple propre à un domaine ou une organisation
  • Size : dimensions d’une ressource (volume, temps, pages…)
  • Format : format numérique de la ressource (pdf, XML, txt, jpeg, mpg…)
  • Version : numéro de version de la ressource lors de changements majeurs
  • Rights : toute information relative aux droits associés à la ressource (mentions légales, copyright, licence d’utilisation de la ressource…) avec le lien internet (URL, URI…) vers sa licence d’utilisation
  • FundingReference : données de financement de la ressource (nom du bailleur, nom du programme et/ou projet de la subvention, identifiant associé au bailleur, code du programme et/ou du projet)
  • RelatedItem : informations (type, identifiant, auteurs…) sur chacune des ressources liées à la ressource (ex. : publications, jeux de données)