Ouvrir ses jeux de données scientifiques

1 - Qu’est-ce qu’un jeu de données scientifiques ?

Selon l’OCDE, les données scientifiques (ou données de la recherche, research data) sont « des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche. Ce terme ne s’applique pas aux éléments suivants : carnets de laboratoire, analyses préliminaires et projets de documents scientifiques, programmes de travaux futurs, examens par les pairs, communications personnelles avec des collègues et objets matériels (par exemple, les échantillons de laboratoire, les souches bactériennes et les animaux de laboratoire tels que les souris).

Pour vous familiariser avec le concept de données de la recherche (voir la fiche CoopIST : S’initier en ligne aux données de la recherche et à leur gestion).

Un jeu de données de recherche (research dataset) est l’agrégation d’enregistrements de données organisés pour former un ensemble cohérent. Il est mis en forme de façon à ce qu’il puisse être diffusé et soit compréhensible et réutilisable par les humains et les machines. Pour être facilement découvert et correctement interprété, un jeu de données doit être accompagné de métadonnées (informations sur les données elles-mêmes) : titre du jeu de données, producteurs, lieu de collecte, année, méthodes de collecte et de traitement des données, etc. qui précisent le contexte et les conditions d’obtention du jeu de données.