Rédiger un Plan de Gestion des Données

1 - Qu’est ce qu’un PGD

Un PGD est un document qui explicite, dans un projet ou une thèse, la manière dont sont obtenues et traitées les données tout au long de leur cycle de vie, de la collecte à l’archivage. C’est un document formalisé, assez court.

L’enjeu n’est pas de décrire toutes les étapes mais de montrer que les données sont gérées selon des « bonnes pratiques » (de collecte, organisation, stockage, description, documentation, etc.), dans le respect d’un « cadre éthique et juridique », pour produire des données « Faciles à trouver, Accessibles, Interopérables and Réutilisables » (Principes FAIR : Findable, Accessible, Interoperable and Reusable), selon le principe « aussi ouvert que possible aussi fermé que nécessaire ».

Dans un projet, un seul PGD doit être rédigé pour donner une vue d’ensemble sur la gestion de toutes les données produites dans le projet. Le PGD doit donc résulter d’un travail collectif puisqu’il concerne tous les partenaires du projet qui collectent ou produisent des données. L’idéal est de nommer un responsable pour animer et coordonner la rédaction du PGD au sein du collectif. Le PGD implique une réflexion collective sur les dimensions juridiques et éthiques de la production et du partage des données et sur les conditions techniques de leur stockage, archivage et diffusion. Pour le porteur de projet et le collectif, le PGD représente, à la fois :

  • une démarche de mise en œuvre de bonnes pratiques et de transparence des recherches 
  • un outil d’animation facilitant l’harmonisation des données et les échanges entre partenaires et assurant un gain de temps pour publier et valoriser les données et les résultats.

Le PGD décrit les jeux de données qui seront produits dans un projet. La définition du jeu de données est :

  • un lot techniquement homogène (Ex : données de granulométrie, mesures de CO2, séquences)
  • un lot intellectuellement cohérent même si composé de lots techniquement hétérogènes.

    Il n’y a pas de règle imposée : c’est le collectif du projet qui détermine ce qui constitue un jeu de données homogène ou cohérent. Les jeux de données peuvent être bruts ou traités, disciplinaires (Ex : données économiques, de phénotypage, écologiques) ou techniques (Ex : données NIRS, données de séquençage, GPS, données issues de drones), par espèce (Ex : riz, sorgho, zébus), localisation (Ex : Cameroun, Vietnam, Nicaragua), ou work package, etc.

Le PGD est un document évolutif, il y aura donc plusieurs versions au cours d’un projet.

  • La première version : dans les projets financés par H2020 ou l’ANR, par exemple, la V1 doit être soumise au mois 6 du projet. Dans la V1, vous n’êtes pas obligé de répondre à toutes les questions. En effet, d’une part vous n’avez pas encore toutes les réponses et d’autre part la stratégie du projet en matière de conservation, publication et partage de certains jeux de données n’est pas complètement définie. Néanmoins, la V1 pose certaines questions pour vous aider à anticiper des problèmes d’ordre juridique, éthique ou technique dont la prise en compte et le traitement faciliteront la bonne gestion et la publication future des données.
  • Les versions ultérieures (à mi-parcours pour l’ANR et H2020) seront complétées en fonction de l’évolution du projet et de sa stratégie pour les données produites.
  • La version finale mentionnera les actions concrètes prévues par le consortium du projet pour respecter les principes FAIR et faciliter l’accès aux données et leur réutilisation éventuelle.