FOIRE AUX QUESTIONS

Dernière mise à jour : 24/07/2019

Vous avez une question sur les activités proposées par DoRANum ou sur les données de la recherche ? Vous trouverez probablement une réponse ici ! Dans le cas contraire, vous pouvez contribuer au développement de cette FAQ en nous envoyant votre question.

DORANUM

  • Oui, toutes les ressources sont sous la licence Etalab ou Creative Commons et sont librement réutilisables. Vous pouvez les télécharger, les intégrer sur votre site, les modifier pour les adapter à vos propres ressources. Vous pouvez aussi imprimer des fiches synthétiques et autres supports pour vos formations présentielles.

  • Oui, nous proposons des formations en présentiel à la demande.

  • Oui, nous organisons régulièrement des webinaires de présentation de DoRANum. Le calendrier sera annoncé dans les actualités du site.

  • Oui, nous pouvons contribuer à la réalisation de vos ressources de formation sur les données de la recherche. Précisez-nous votre demande via notre formulaire de contact.

  • Nous vous encourageons à contribuer à l’activité de DoRANum !

    Votre avis compte

    N’hésitez pas à nous laisser vos retours sur nos ressources (commentaires, évaluations), cela nous permettra de les améliorer. Toutes les remarques et suggestions sont les bienvenues.

    Réutilisez et partagez

    Réutilisez les ressources, en les intégrant sur votre site, en distribuant les imprimés lors de vos formations, en mixant nos contenus avec vos propres ressources… et partagez-les sur les réseaux sociaux si vous le souhaitez !

    Partenariat

    Nous pouvons collaborer sur un projet de formation autour des données de la recherche : création de nouvelles ressources pour des formations en présentiel ou distanciel, intégration des ressources DoRANum dans votre dispositif de formation.

ENJEUX & BÉNÉFICES

  • Le contexte général tend vers l’ouverture des données. Vous pouvez ainsi être obligé de partager vos données de recherche dans certains cas, comme :

    • pour l’obtention de financement de projets, à l’image des projets issus du programme Horizon 2020;
    • pour la publication d’articles, à l’image de la revue PLOS ONE qui recommande, voire exige, l’accès aux données sous-jacentes des résultats rapportés dans l’article soumis.

    De nouvelles mesures vont être mis en place avec le Plan national pour la science ouverte, notamment une visant à « rendre obligatoire la diffusion ouverte des données de recherches issues de programmes financés par appels à projets sur fonds publics ».

  • Non, certaines données sont soumises à des exceptions définies par la loi, comme des données relevant du secret professionnel, des données personnelles ou encore protégées par le droit d’auteur.

  • Il s’agit des « […] données de la recherche nécessaires à la validation des résultats présentés dans les publications scientifiques […] ».
    Source : « Lignes directrices pour le libre accès aux publications scientifiques et aux données de la recherche dans Horizon 2020 » de la Commission européenne. (Titre original : Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 , Version 2.0, 30 October 2015, European Commission, Directorate General for Research and Innovation © Union européenne, 1995-2015)

ASPECTS JURIDIQUES, ÉTHIQUES, INTEGRITE SCIENTIFIQUE

  • Pour savoir si vous pouvez partager librement des données dont vous n’êtes pas l’auteur, il faut déterminer si elles sont communicables et diffusables. Afin de vous aider dans cette tâche, vous pouvez vous appuyer sur  l’outil d’analyse des données. Cet outil vous permettra d’analyser leur nature juridique et éthique.

    Si l’auteur a attribué une licence à ses données, celle-ci vous engage à respecter l’intégrité de ses données, à faire mention de la source des données et à indiquer la date de la dernière mise à jour.

  • Il vaut mieux ne pas parler de « propriété des données » à propos des données de recherche. La loi République numérique de 2016 a en effet instauré un principe d’ouverture par défaut des données, ce qui rend la notion de propriété globalement peu pertinente.

    La première étape consiste à identifier précisément ce que l’on appelle « données », car ce terme peut recouvrir des réalités très différentes.

    SI les « données » correspondent à des œuvres de l’esprit (c’est-à-dire des créations originales : textes, photos, interviews, etc.), alors elles sont couvertes par un droit d’auteur qui appartient aux chercheurs (si ce sont eux qui ont créé les contenus) ou à des tiers. La diffusion n’est alors possible qu’avec l’accord de ces chercheurs (ou des tiers en question).

    Si les « données » ne sont pas des œuvres de l’esprit, il s’agira alors vraisemblablement d’informations publiques (tableaux de chiffres, mesures, statistiques, etc.). Dans ce cas, les établissements de tutelle seront considérés comme les « producteurs » de ces informations (et non les chercheurs). Mais cela ne signifie pas pour autant que les établissements en sont « propriétaires ». D’après la loi pour une République numérique, les établissements ont en effet l’obligation de rendre ces données librement accessibles et réutilisables.

    Dans le cadre d’un projet ANR impliquant plusieurs partenaires, il vaut mieux en effet conclure un accord de consortium pour déterminer le statut des données produites et la répartition des responsabilités. Ce genre de questions doit normalement être analysés dans un Plan de Gestion de Données (Data Management Plan) dont l’ANR demande la production aux lauréats de ces appels depuis 2019.

    Pour résumer, soit les données sont des œuvres et les chercheurs gardent leurs droits dessus ; soit les données sont des informations publiques et la responsabilité passe aux établissements qui sont obligés de procéder à une libre diffusion.

PLAN DE GESTION DE DONNÉES (DMP DATA MANAGEMENT PLAN)

  • Il n’existe pas à proprement parler de recommandations concernant le choix d’un outil.
    En France, DMP OPIDoR vous accompagne à travers l’élaboration et la mise en pratique de plans de gestion de données et de logiciels. Il suffit de créer un compte pour rédiger son (ses) plan(s) de gestion des données. Vous pouvez créer, exporter et partager votre DMP. C’est un outil collaboratif qui facilite les échanges entre les partenaires d’un même projet et les services d’accompagnement.
    DMP OPIDoR est également personnalisable par tout organisme de recherche pour la mise en place de sa politique de données. Il est possible d’ajouter des modèles et des recommandations de DMP, des exemples ou des réponses par défaut.
    Vous avez aussi la possibilité de rédiger votre DMP à partir d’un outil bureautique.

  • Il vous est demandé d’évaluer la volumétrie de vos données et métadonnées associées et de l’indiquer dans la 2eme partie de votre MP (Data Management Plan également appelé PGD ou Plan de gestion des données). Cette évaluation peut en effet s’avérer difficile en début de projet. Il faut savoir que le DMP est un document évolutif qui peut être complété tout au long de votre projet. C’est la version finale qui devra indiquer la volumétrie exacte des données et métadonnées en lien avec votre projet.

MÉTADONNÉES

IDENTIFIANTS PÉRENNES

  • Chaque jeu de données (fichiers de données + métadonnées) publié est associé à un DOI et une empreinte digitale permettant d’attester de la fiabilité (authenticité et intégrité) des données.

    • En cas de changements mineurs (ajout ou modification de métadonnées qui ne changent pas la citation), une version mineure du jeu de données est créée
    • En cas de changement majeur (ajout ou modification de métadonnées qui changent la citation, ajout ou suppression de fichiers de données), une version majeure du jeu de donnée est créée et est associée à une nouvelle empreinte digitale
    • Dans tous les cas, le DOI ne change pas et renvoie vers la page descriptive de la version la plus récente du jeu de données ; l’entrepôt offrant la possibilité d’accéder aux versions antérieures du jeu de données à partir de cette page
    • Exemple sur le portail Dataverse de Harvard

ENTREPÔTS

  • Oui, il est tout à fait possible de faire évoluer un jeu de données déposé dans un entrepôt. Certains entrepôts de données proposent un suivi de versions des jeux de données. C’est par exemple le cas des entrepôts de données réalisés avec la technologie Dataverse.

    Chaque jeu de données (fichiers de données + métadonnées) publié est associé à un DOI et une empreinte digitale permettant d’attester de la fiabilité (authenticité et intégrité) des données.

    • En cas de changements mineurs (ajout ou modification de métadonnées qui ne changent pas la citation), une version mineure du jeu de données est créée
    • En cas de changement majeur (ajout ou modification de métadonnées qui changent la citation, ajout ou suppression de fichiers de données), une version majeure du jeu de donnée est créée et est associée à une nouvelle empreinte digitale
    • Dans tous les cas, le DOI ne change pas et renvoie vers la page descriptive de la version la plus récente du jeu de données ; l’entrepôt offrant la possibilité d’accéder aux versions antérieures du jeu de données à partir de cette page
    • Exemple sur le portail Dataverse de Harvard
  • Selon les entrepôts, différentes fonctions peuvent être proposées pour contrôler l’accès aux données et offrir des statistiques d’usage.

    • Dans Zenodo, il est possible de demander que l’accès à un jeu de données spécifique soit soumise à l’approbation du déposant. Pour cela, il faut choisir la valeur “Restricted access” pour la métadonnée “Access Right” dans le formulaire de dépôt.
    • Dans les entrepôts de type Dataverse, il existe deux possibilités pour obtenir des informations sur les utilisateurs qui accèdent aux données :
      • Choisir la valeur “Available on request” pour la métadonnée “Access Right” de sorte que toute demande d’accès aux données soit soumise à approbation du déposant
      • Activer la fonction “Guestbook”. Avec la fonction “Guestbook”, l’utilisateur doit accepter de transmettre les informations le concernant au contact du dataset. Les informations requises dépendent du paramétrage fait lors de l’activation de la fonction “Guestbook”.

    Le choix par le déposant d’utiliser ou non une des ces fonctions pour contrôler l’accès aux données devrait faire l’objet d’une réflexion amont, dans la phase de préparation – gestion des données : quelles données peut-on envisager de partager ? quelles données seraient éligibles au partage ?

    La plupart des entrepôts de données proposent des statistiques d’usage (nombre d’accès, nombre de téléchargements) pour les données en accès ouvert.

STOCKAGE & ARCHIVAGE

  • Pour des raisons de sécurité, il est déconseillé de conserver ses données uniquement sur son ordinateur. Il est préférable de stocker sur le serveur de l’institution dont on dépend, un back-up pourra être effectué par l’équipe informatique.

    Pour que vos données soient accessibles et réutilisables, il convient de bien les documenter et de les déposer dans un entrepôt.

  • Oui, vous pouvez déposer vos données à la fois sur un site d’archivage pérenne et dans un entrepôt. Ces deux dépôts offrent des services complémentaires.
    Un entrepôt de données est une base de données structurée qui collecte et diffuse des jeux de données et leurs métadonnées.
    L’archivage pérenne du document numérique a pour objectifs principaux de conserver le document, le rendre accessible, et en préserver l’intelligibilité et ce sur du long terme à savoir plus de 30 ans.
    Les entrepôts n’ont pas vocation à assurer la pérennité des données sur le long terme ni d’assurer l’évolution technologique (disparition des formats de fichiers et/ou des logiciels assurant leurs lectures/exploitation).

DATA PAPERS

  • « Selon la revue et ses exigences, le contenu et la taille du Data paper peuvent varier considérablement entre une forme très synthétique et un article très complet »
    Extrait de : « Revues publiant des Data papers ». Laurence Dedieu, octobre 2016

  • On peut publier un Data paper basé sur un jeu de données dynamique. Dans le cas où l’objectif du Data paper est de décrire une version précise du jeu de données (exemple : cas d’un jeu de données soutenant un article classique), il convient de s’assurer que le lien indiqué dans le Data paper permette à tout moment d’accéder soit directement, soit indirectement au jeu de données original cité dans le Data paper.

    Le Data paper peut aussi avoir pour objet de décrire un jeu de données dynamique en temps qu’objet conceptuel (schéma, types de données, modes de requêtage, etc.).

    Le cas le plus fréquent est effectivement de pointer vers un jeu de données stable.

  • A priori, tous les types de données sont recevables. Vérifier néanmoins les instructions aux auteurs.

ACCÈS VISUALISATION

  • Oui, vous pouvez utiliser :

    • Les moteurs de recherche intégrés sur les sites des entrepôts de données ;
    • Les méta-moteurs de recherche (catalogue de données) permettant de rechercher des données dans plusieurs entrepôts.
  • Il n’y a pas de liste à proprement parlé. Toutefois voici quelques outils :

    • Outils de visualisation pour l’accès aux données depuis un entrepôt :
    • Outils de visualisation pour une meilleure manipulation et appréhension des données :
      • Gephi (logiciel libre d’analyse et de visualisation de réseaux)
      • D3js (bibliothèque JavaScript pour créer des visualisations dynamiques)
      • Gargantext (plateforme web pour explorer des données textuelles)
      • QGIS (Système d’Information Géographique Libre et Open Source)

Votre question n’apparaît pas dans cette FAQ ?

Laissez-nous un message, nous vous répondrons au plus vite !