Déposer des données de recherche dans un entrepôt

4 - Les questions à se poser avant de déposer des données dans un entrepôt

Le dépôt de données dans un entrepôt a pour objectif de partager des données, c’est-à-dire de les rendre accessibles pour qu’elles puissent être réutilisées par d’autres, que ce soit des scientifiques, des entreprises, des décideurs, ou des citoyens.

La décision de rendre publiques des données de recherche (Voir la fiche CoopIST : Rendre publics ses jeux de données scientifiques) s’appuie sur des critères scientifiques, réglementaires, juridiques, humains, économiques et techniques et implique l’ensemble des contributeurs et partenaires d’un projet.

Les questions à se poser sont notamment :

  • Quelles sont les obligations d’ouverture des données qui s’appliquent ? L’obligation peut être imposée par le financeur du projet, par une loi nationale, européenne ou internationale, par la politique des données de certains partenaires, par la revue dans laquelle vous publiez, etc. 
  • Quelle est la valeur scientifique des données et leur potentiel de réutilisation ? L’intérêt et l’utilité actuelle ou future, scientifique, environnementale, économique, ou sociale, des données peuvent guider le choix. La question du potentiel stratégique ou commercial des données peut aussi influencer la décision. Les agences de financement appliquent la recommandation « Aussi ouvert que possible, aussi fermé que nécessaire » pour la diffusion des données produites dans le cadre d’un projet financé.
  • Avez-vous le droit de rendre publiques ces données ? En d’autres termes, avez-vous respecté :
    les droits de propriété intellectuelle ?
    Ex : données obtenues en partenariat ou contenant des images protégées par le droit d’auteur
    les obligations contractuelles ?
    Ex : utilisation de données préexistantes, issues d’un projet précédent ou téléchargées à partir d’un entrepôt (ex : FAOSTAT, GBIF, Centre for Ecology & Hydrology), éventuellement protégées par des droits spécifiques ou des licences
    les réglementations éthiques ?
    Ex : données personnelles collectées lors d’enquêtes et qui doivent être supprimées (anonymisation) pour respecter les droits des personnes
    Ou données issues de ressources génétiques ou de savoirs traditionnels associés qui nécessitent de respecter la Réglementation APA sur l’accès et le partage des avantages
    Ou données qui soulèvent des questions éthiques (ex : expérimentation animale, essais cliniques chez l’homme, recherches ayant un impact sur l’environnement, etc.) et requièrent la validation par un comité d’éthique
  • Avez-vous obtenu l’accord de tous les contributeurs ?
  • Avez-vous évalué le temps et l’effort nécessaires à la mise en forme des données et des métadonnées pour répondre aux exigences de l’entrepôt ? Si votre projet a fait l’objet d’un Plan de gestion des données (Voir la fiche CoopIST : Rédiger un Plan de Gestion des Données) alors vos données sont quasi prêtes et leur dépôt en sera facilité.
  • Avez-vous défini les conditions de réutilisation des données que vous avez produites ? Le mouvement « Open data » incite à « ouvrir » les données à tous, sans restriction aucune. En tant que chercheur, vous avez tout intérêt à imposer l’obligation de citer les créateurs des données lorsque celles-ci seront réutilisées. Ceci est possible par le choix de l’entrepôt et de la licence de diffusion (Voir la fiche CoopIST : Connaître et utiliser les licences Creative Commons) que vous attribuerez à vos données.