Rendre publics ses jeux de données scientifiques

6 - Les principales licences de diffusion des jeux de données

Pour favoriser la réutilisation des jeux de données que vous rendez publics, privilégiez des licences largement utilisées.
Les principales licences utilisées pour la publication des jeux de données sont les suivantes :

Les licences Creative Commons

Les licences Creative Commons ont été créées en 2002 pour la diffusion de contenus numériques  comme le texte, les images et les films. Elles permettent aux auteurs d’indiquer facilement les droits qu’ils veulent conserver et les droits auxquels ils renoncent afin de permettre à d’autres de réutiliser leur œuvre. Elles permettent de combiner quatre clauses, à associer selon ses besoins :

    by Attribution (sigle BY) : paternité, c’est-à-dire citation de l’auteur initial (obligatoire).

    NC Non Commercial (sigle NC) : interdiction de tirer un profit commercial de l’œuvre sans autorisation de l'auteur.

    ND No Derivative Works (sigle ND) : impossibilité d’intégrer tout ou partie dans une œuvre composite.

    SA Share Alike (sigle SA) : partage de l’œuvre, avec obligation de rediffuser selon la même licence ou une licence similaire.

Depuis la version 4.0 (novembre 2013), les licences Creative Commons  prennent en compte le droit sui generis des bases de données. Il est donc désormais possible de les utiliser pour publier des jeux de données et de choisir d’attribuer une même licence Creative Commons pour l’article et les jeux de données liés, ou une licence pour l’article et  une autre pour les données.

Toutefois, Creative Commons recommande de ne pas utiliser les clauses NC (pas d’utilisation commerciale) ou ND (pas de modification) pour des jeux de données ou des bases de données destinés à une utilisation scientifique car elles restreignent les possibilités de réutilisation.

De même, il est conseillé de ne pas utiliser la clause SA (partage à l’identique) car elle impose la licence de rediffusion et réduit donc l’interopérabilité des données.

La licence CC-by 4.0 (Creative Commons Attribution)

https://creativecommons.org/licenses/by/4.0/
La licence CC-by 4.0 permet de partager, copier, distribuer et communiquer les données par tous moyens et sous tous formats, de les réutiliser pour créer de nouveaux jeux de données. Toutes les utilisations, y compris commerciales, sont possibles, sous réserve de créditer les données à leurs créateurs (obligation d’attribution).
Cette licence est préconisée par un certain nombre d’entrepôts de données.

La licence CC0 (Creative Commons Public Domain Dedication)

http://creativecommons.org/publicdomain/zero/1.0/deed.fr
La licence CC0 a été créée en 2009 pour faciliter la réutilisation des jeux de données. Elle permet aux producteurs de données de les placer dans le domaine public, sans aucune restriction de réutilisation.
La citation du producteur du jeu de données n’est pas obligatoire, même si, d’un point de vue éthique et scientifique, il est conseillé aux utilisateurs de citer les créateurs originels des données lors de la réutilisation. Cela permet de certifier leur origine  et la  méthodologie associée à leur production.
La licence CC0 est imposée par quelques entrepôts de données, comme l’entrepôt pluridisciplinaire Dryad. Elle est aussi imposée par certains éditeurs de revues scientifiques, comme BioMed Central ou Nature Publishing Group. En conséquence, si vous publiez un article chez ces éditeurs en lien avec des jeux de données, vous devez les déposer dans un entrepôt sous licence CC0.

Les licences de l’Open Knowledge Fondation (OKF)

Résultats du projet Open data commons, lancé en 2007 au Royaume-Uni par l’Open knowledge Foundation, ces licences, basées sur le droit anglo-saxon et orientées bases de données, peuvent être appliquées aux bases de données et aux données qu’elles contiennent prises isolément.
Ces licences autorisent a minima la copie, l’utilisation, la redistribution, la modification des données, la réalisation de travaux dérivés de la base de données.

ODC-by (Open Database Commons)

http://opendatacommons.org/licenses/by/
La licence ODC-by impose d’indiquer le nom de l’auteur/créateur de la base de données originale (obligation d’attribution).
Cette licence se rapproche de la licence CC-by et est utilisée par de nombreux éditeurs scientifiques dont Pensoft.

ODC-ODBL (Open database License)

http://opendatacommons.org/licenses/odbl/
La licence ODC-ODBL impose d’indiquer le nom de l’auteur/créateur de la base de données originale  et de la redistribuer sous les mêmes conditions (obligations d’attribution et de partage à l’identique).
Très utilisée en France, cette licence se rapproche de la licence CC-by-sa.

PDDL (Public domain dedication and license)

http://opendatacommons.org/licenses/pddl/
La licence PDDL est une licence libre de tout droit, de type domaine public, par laquelle l’auteur ou le créateur abandonne son droit d’auteur moral.
Cette licence se rapproche de la licence CC0.

La Licence ouverte (LO)

https://www.etalab.gouv.fr/licence-ouverte-open-licence
Créée par EtatLab pour la diffusion des données publiques françaises, la Licence ouverte autorise la réutilisation, la reproduction, la modification, la redistribution des données et leur exploitation à titre commercial sous réserve de mentionner a minima le nom du producteur et la date de dernière mise à jour.
Elle est compatible avec toute licence qui exige a minima la mention de paternité, notamment avec les licences ODC-by et CC-by.
Cette licence est utilisée notamment sur la plate-forme de mise à disposition des données publiques data.gouv.fr.