Rédiger un Plan de Gestion des Données

6 - Garantir la compréhension et l’accessibilité des données

La 3eme étape consiste à expliquer comment les données seront documentées, décrites, organisées et formatées. L’objectif est d’assurer la compréhension des données, de faciliter la reproductibilité des recherches et de permettre l’accès et la réutilisation des données. Vous devez utiliser, autant que possible, des méthodes, formats, unités et standards de description qui sont classiques de la discipline et seront donc compris par la communauté scientifique concernée (et si possible au-delà).

Pour trouver les normes et standards disciplinaires qui existent :
Data Curation Center ; Research Data Alliance ; FAIR Sharing ; Elixir

Pour être sûr de bien documenter vos données, mettez-vous à la place d’un futur utilisateur et demandez-vous si vous avez fourni toutes les informations indispensables pour que vos données soient accessibles, lisibles, compréhensibles et réutilisables.

Dans le PGD, vous devrez :

  • décrire les méthodes qui sont utilisées (Ex : protocoles d’échantillonnage, de collecte, de production des données, protocole d’enquête, types d’équipement, explication des variables étudiées, etc.) et préciser s’il s’agit de méthodes classiques dans la discipline.
  • mentionner les processus de contrôle qualité pour montrer la rigueur des méthodes et la qualité des données (Ex : processus de calibration, mesures répétées, contrôles standards positifs/négatifs, contrôle des données en double aveugle ou par évaluateur externe, etc.).

    Préciser tous les documents qui seront associés aux fichiers de données (Ex : questionnaires d’enquête, protocoles, dictionnaires des variables, abréviations, codes, versions des logiciels de lecture, fichier « Lisez-  moi », …). L’objectif est que chaque fichier de données soit accompagné de toutes les informations nécessaires pour que les données puissent être comprises et interprétées par quelqu’un qui n’a pas participé à l’étude.  Préciser également si des articles associés à ces données ont déjà été publiés et si oui, donner les références.

  • montrer que vous utilisez les normes et standards de description des données (métadonnées) pratiqués dans la discipline, lorsque ceux-ci existent (Ex : norme ISO 8601 pour les dates (AAAA/MM/JJ) ; norme ISO 19115 pour une géolocalisation ; standard EML pour des données en écologie ; norme DDI pour des données d’enquêtes, standard MIAPPE pour du phénotypage de plantes ; MIxS pour les séquences ADN ; etc.). Dans le cas où ces standards n’existent pas dans votre discipline, expliquez quels éléments descriptifs (métadonnées) vous utilisez et comment ils sont produits (Ex : cahier de laboratoire, GPS, autre type d’instrument, entrée manuelle) ?
  • préciser l’organisation, les règles de nommage et le format des fichiers. Privilégier les formats usuels de la discipline (Ex : Excel, csv, FASTA, BAM, JPEG, SPSS, Gis, etc.) et surtout les formats « ouverts » pour faciliter l’accès et la réutilisation des données. Si des logiciels ou outils sont nécessaires pour lire les données, précisez-le (Ex : Excel, R, Matlab, Nesstar, etc.).