Mesurer l’impact des données de la recherche

1 - Comprendre la notion d’impact des données de la recherche

Les données issues de travaux scientifiques, ou données de la recherche (voir fiche CoopIST : S’initier en ligne aux données de la recherche et à leur gestion), sont des produits de la recherche comme le sont les publications ou les brevets.
La réutilisation de données scientifiques produites peut se faire pour conduire de nouveaux travaux de recherche, ou pour intégrer et constituer des collections plus vastes de données. Dans tous les cas, il est utile de suivre l’usage de ces données et d’évaluer leur impact dans la durée en termes de bénéfices pour les scientifiques, les politiques, les acteurs économiques et plus largement les citoyens.
La mesure d’impact nécessite de préciser au préalable les objets évalués, les critères de mesure, les indicateurs et les outils de mesure. Les indicateurs calculés seront interprétés avec précaution en tenant compte des limites de ces choix (voir rubrique CoopIST : Évaluer les publications).

Les jeux, ou collections, de données (datasets) collectés sur le terrain, obtenus en laboratoire ou recueillis au cours d’enquêtes sont un objet possible de mesure d’impact lorsqu’ils entrent dans un processus de publication.
Le processus de publication peut être traditionnel (revue scientifique) :

  • cas d’un jeu de données inséré dans l’article sous forme de tableaux ou de graphiques, ou joint en annexe de l’article dans une rubrique dédiée (Supplementary Material), ou mentionné dans l’article avec un lien vers un site externe à la revue où le jeu est accessible ;
  • cas d’un jeu de données dont la description est l’objet même d’un article spécial, ou data paper (voir fiche CoopIST : Rédiger et publier un data paper dans une revue scientifique).

Le processus de publication peut être particulier :

  • cas d’une base de données rendue publique sur un site internet ;
  • cas d’un fichier textuel de données (un tableur Excel par exemple) déposé et accessible dans un entrepôt de données (data repository).

Dans tous les cas, la mesure d’impact implique que le jeu de données obéisse à certaines conditions :

  • accessible pour être consulté, téléchargé, utilisé, ou obtenu sur demande à l’auteur ;
  • décrit précisément pour pouvoir être interprété et exploité. Des recommandations comme celles du consortium international DataCite guident la description de données scientifiques ;
  • identifié sans équivoque pour être citable, via l’attribution d’un identifiant numérique pérenne tel que le DOI (Digital Object Identifier) (voir fiche CoopIST : Citer un jeu de données scientifiques) ;
  • localisé pour être retrouvé dans la sphère internet par exemple.