Ouvrir ses jeux de données scientifiques

4 - Quelles sont les options pour diffuser ses données de recherche ?

Pour diffuser vos jeux de données scientifiques, vous devez les déposer dans un entrepôt de données de recherche (Research data repository), selon une procédure d’enregistrement des fichiers et des métadonnées associées propre à l’entrepôt. Privilégiez un entrepôt de confiance, disciplinaire ou thématique, c’est-à-dire qui est largement reconnu par la communauté scientifique qu’il dessert et qui possède un processus de curation.

On désigne par curation le processus de mise en forme, relecture et documentation du jeu de données. La curation scientifique (mise en forme des données, nettoyage, traitements appliqués aux données etc.) reste le plus souvent à la charge seule des auteurs du jeu de données. La curation documentaire peut être conjointe avec l’entrepôt. Elle consiste à s’assurer du niveau suffisant de description des données pour leur découverte, leur compréhension et leur réutilisation. L’existence d’un processus de curation sur l’entrepôt signifie qu’une exigence de qualité des données et/ou des métadonnées peut conditionner l’acceptation du dépôt sur l’entrepôt.

Une certification internationale (CoreTrustSeal) peut être attribuée à un entrepôt s’il répond à des critères de qualité et de transparence. Le répertoire international des entrepôts de données de recherche Re3data permet de recherche et d’identifier un entrepôt correspondant à vos données. A défaut d’un entrepôt disciplinaire ou thématique adapté, vous pouvez vous tourner vers l’entrepôt institutionnel de votre établissement ou vers un entrepôt national, s’ils existent. Certains entrepôts généralistes ont une vocation internationale, comme Zenodo (https://zenodo.org/) soutenu par l’Union européenne, mais sont dépourvus de processus de curation.

S’il était autrefois possible de publier les données sous-tendant une publication (underlying data) sous forme de fichiers supplémentaires (supplementary files) associés à l’article (article de recherche, étude de cas, etc.) sur les sites des éditeurs, cette pratique n’est plus recommandée et de moins en moins pratiquée par les éditeurs.

Pour valoriser les données déposées dans un entrepôt, vous pouvez publier un article scientifique, notamment un article de type Data paper qui informe la communauté scientifique de l’existence, de la disponibilité, de la qualité et du potentiel de ces données pour la recherche et l’innovation (voir la fiche CoopIST : Publier un data paper). Vérifiez les instructions de la revue dans laquelle vous souhaitez publier : elle peut imposer une liste d’entrepôts.