Nous souhaitons initier une série d’articles sur la gestion et le partage des données de la recherche. C’est un sujet qui avait fait l’objet de plusieurs discussions lors de notre workshop sur l’integrité scientifique de 2017.1 Un sujet que s’est depuis approprié le ministère, via la publication d’un plan national pour la recherche ouverte,2 en juillet 2018, et l’organisation des premières journées nationales de la science ouverte,3 en décembre 2018.
On s’intéresse dans cet article aux données plutôt qu’aux publications. En 2016, l’initiative « FAIR data » expose quatre principes fondateurs : Findable, Accessible, Interoperable and Reusable (ça marche aussi en français : Facile à trouver, Accessible, Interopérable, Réutilisable).4 Ces principes sont édictés avec l’idée d’une mise à disposition de données permettant leur ré-utilisation, éventuellement automatisée. Cependant FAIR data n’est pas strictement équivalent à Open data : on rend des données accessibles, mais pas forcément à tous. C’est le législateur, qui, de plus en plus, tend à faire de l’accès ouvert le principe par défaut pour toutes les données produites par la recherche publique : « Public money? Public data! » La France a d’ailleurs chargé le CNRS de développer le noeud national de la Research Data Alliance (RDA),5 réseau international définissant les bonnes pratiques dans le domaine des données de la recherche.
Pour répondre aux nombreuses questions des chercheurs (dont la première : « moi je veux bien être open, mais d’abord est-ce que j’ai bien le droit ? »), un groupe de travail inter-organismes animé par l’INRA a publié en 2016 et mis à jour en 2017 un excellent « Guide d’analyse du cadre juridique en France » (largement plagié ici).6 Il est accompagné d’un logigramme de communicabilité d’une donnée, et d’un outil en ligne « Puis-je diffuser mes données de recherche ? ».7 En bref, nos données brutes, élaborées et métadonnées ont la qualification de documents administratifs, et doivent par conséquent être libres d’accès et si possible diffusées en ligne. Cependant cette injonction issue de la loi « CADA »8 s’applique aux documents « achevés », et non aux documents préparatoires (comme les cahiers de labo). Pour amplifier le mouvement vers l’Open Data, la loi mentionne également une possibilité de réutilisation gratuite de certaines données, notamment lorsqu’elles sont issues d’une recherche financée au moins pour moitié par des fonds publics. Le guide détaille ensuite les cas de communication i) obligatoire (géographiques, environnementales), ii) interdite par principe (secret défense, médical, sécurité…), et iii) sous conditions (zones à régime restrictif, droit d’auteur et propriété intellectuelle, vie privée, collaboration industrielle…). N’hésitez à nous faire savoir si ce guide et les outils associés répondent à vos questions.
Enfin, le plan national pour la recherche ouverte annonce i) un appel « flash » de l’ANR afin de promouvoir les principes « FAIR » et ii) une éligibilité des dépenses de traitement des données dans les futurs appels à projets : préparez-vous à rajouter une ligne à vos budgets prévisionnels !
______________________
1https://ethics-crnl.sciencesconf.org/data/pages/CR_workshop_ethique_CRNL_2017.pdf
2https://www.ouvrirlascience.fr/
3https://jnso2018.sciencesconf.org/
4https://www.nature.com/articles/sdata201618
5https://www.rd-alliance.org/groups/rda-france
6https://www6.inra.fr/datapartage/Partager-Publier/Cadre-juridique
7http://www.bibliotheque-numerique.fr/DonneesDiffusables.php
8Commission d’Accès aux Documents Administratifs
Comments