FOIRE AUX QUESTIONS

Dernière mise à jour : 28/05/2018

Vous avez une question sur les activités proposées par DoRANum ou sur les données de la recherche ? Vous trouverez probablement une réponse ici ! Dans le cas contraire, vous pouvez contribuer au développement de cette FAQ en nous envoyant votre question.

DORANUM

  • Oui, toutes les ressources sont sous la licence Etalab ou Creative Commons et sont librement réutilisables. Vous pouvez les télécharger, les intégrer sur votre site, les modifier pour les adapter à vos propres ressources. Vous pouvez aussi imprimer des fiches synthétiques et autres supports pour vos formations présentielles.

  • Oui, nous proposons des formations en présentiel à la demande.

  • Oui, nous organisons régulièrement des webinaires de présentation de DoRANum. Le calendrier sera annoncé dans les actualités du site.

  • Oui, nous pouvons contribuer à la réalisation de vos ressources de formation sur les données de la recherche. Précisez-nous votre demande via notre formulaire de contact.

  • Nous vous encourageons à contribuer à l’activité de DoRANum !

    Votre avis compte

    N’hésitez pas à nous laisser vos retours sur nos ressources (commentaires, évaluations), cela nous permettra de les améliorer. Toutes les remarques et suggestions sont les bienvenues.

    Réutilisez et partagez

    Réutilisez les ressources, en les intégrant sur votre site, en distribuant les imprimés lors de vos formations, en mixant nos contenus avec vos propres ressources… et partagez-les sur les réseaux sociaux si vous le souhaitez !

    Partenariat

    Nous pouvons collaborer sur un projet de formation autour des données de la recherche : création de nouvelles ressources pour des formations en présentiel ou distanciel, intégration des ressources DoRANum dans votre dispositif de formation.

ENJEUX & BENEFICES

  • Le contexte général tend vers l’ouverture des données. Vous pouvez ainsi être obligé de partager vos données de recherche dans certains cas, comme :

    • pour l’obtention de financement de projets, à l’image des projets issus du programme Horizon 2020;
    • pour la publication d’articles, à l’image de la revue PLOS ONE qui recommande, voire exige, l’accès aux données sous-jacentes des résultats rapportés dans l’article soumis.

    De nouvelles mesures vont être mis en place avec le Plan national pour la science ouverte, notamment une visant à « rendre obligatoire la diffusion ouverte des données de recherches issues de programmes financés par appels à projets sur fonds publics ».

  • Non, certaines données sont soumises à des exceptions définies par la loi, comme des données relevant du secret professionnel, des données personnelles ou encore protégées par le droit d’auteur.

ASPECTS JURIDIQUES & ÉTHIQUES

  • Pour savoir si vous pouvez partager librement des données dont vous n’êtes pas l’auteur, il faut déterminer si elles sont communicables et diffusables. Afin de vous aider dans cette tâche, vous pouvez vous appuyer sur  l’outil d’analyse des données. Cet outil vous permettra d’analyser leur nature juridique et éthique.

    Si l’auteur a attribué une licence à ses données, celle-ci vous engage à respecter l’intégrité de ses données, à faire mention de la source des données et à indiquer la date de la dernière mise à jour.

PLAN DE GESTION DE DONNÉES (DMP DATA MANAGEMENT PLAN)

MÉTADONNÉES

IDENTIFIANTS PÉRENNES

  • Chaque jeu de données (fichiers de données + métadonnées) publié est associé à un DOI et une empreinte digitale permettant d’attester de la fiabilité (authenticité et intégrité) des données.

    • En cas de changements mineurs (ajout ou modification de métadonnées qui ne changent pas la citation), une version mineure du jeu de données est créée
    • En cas de changement majeur (ajout ou modification de métadonnées qui changent la citation, ajout ou suppression de fichiers de données), une version majeure du jeu de donnée est créée et est associée à une nouvelle empreinte digitale
    • Dans tous les cas, le DOI ne change pas et renvoie vers la page descriptive de la version la plus récente du jeu de données ; l’entrepôt offrant la possibilité d’accéder aux versions antérieures du jeu de données à partir de cette page
    • Exemple sur le portail Dataverse de Harvard

ENTREPÔTS

  • Oui, il est tout à fait possible de faire évoluer un jeu de données déposé dans un entrepôt. Certains entrepôts de données proposent un suivi de versions des jeux de données. C’est par exemple le cas des entrepôts de données réalisés avec la technologie Dataverse.

    Chaque jeu de données (fichiers de données + métadonnées) publié est associé à un DOI et une empreinte digitale permettant d’attester de la fiabilité (authenticité et intégrité) des données.

    • En cas de changements mineurs (ajout ou modification de métadonnées qui ne changent pas la citation), une version mineure du jeu de données est créée
    • En cas de changement majeur (ajout ou modification de métadonnées qui changent la citation, ajout ou suppression de fichiers de données), une version majeure du jeu de donnée est créée et est associée à une nouvelle empreinte digitale
    • Dans tous les cas, le DOI ne change pas et renvoie vers la page descriptive de la version la plus récente du jeu de données ; l’entrepôt offrant la possibilité d’accéder aux versions antérieures du jeu de données à partir de cette page
    • Exemple sur le portail Dataverse de Harvard
  • Selon les entrepôts, différentes fonctions peuvent être proposées pour contrôler l’accès aux données et offrir des statistiques d’usage.

    • Dans Zenodo, il est possible de demander que l’accès à un jeu de données spécifique soit soumise à l’approbation du déposant. Pour cela, il faut choisir la valeur “Restricted access” pour la métadonnée “Access Right” dans le formulaire de dépôt.
    • Dans les entrepôts de type Dataverse, il existe deux possibilités pour obtenir des informations sur les utilisateurs qui accèdent aux données :
      • Choisir la valeur “Available on request” pour la métadonnée “Access Right” de sorte que toute demande d’accès aux données soit soumise à approbation du déposant
      • Activer la fonction “Guestbook”. Avec la fonction “Guestbook”, l’utilisateur doit accepter de transmettre les informations le concernant au contact du dataset. Les informations requises dépendent du paramétrage fait lors de l’activation de la fonction “Guestbook”.

    Le choix par le déposant d’utiliser ou non une des ces fonctions pour contrôler l’accès aux données devrait faire l’objet d’une réflexion amont, dans la phase de préparation – gestion des données : quelles données peut-on envisager de partager ? quelles données seraient éligibles au partage ?

    La plupart des entrepôts de données proposent des statistiques d’usage (nombre d’accès, nombre de téléchargements) pour les données en accès ouvert.

STOCKAGE & ARCHIVAGE

  • Pour des raisons de sécurité, il est déconseillé de conserver ses données uniquement sur son ordinateur. Il est préférable de stocker sur le serveur de l’institution dont on dépend, un back-up pourra être effectué par l’équipe informatique.

    Pour que vos données soient accessibles et réutilisables, il convient de bien les documenter et de les déposer dans un entrepôt.

  • Oui, vous pouvez déposer vos données à la fois sur un site d’archivage pérenne et dans un entrepôt. Ces deux dépôts offrent des services complémentaires.
    Un entrepôt de données est une base de données structurée qui collecte et diffuse des jeux de données et leurs métadonnées.
    L’archivage pérenne du document numérique a pour objectifs principaux de conserver le document, le rendre accessible, et en préserver l’intelligibilité et ce sur du long terme à savoir plus de 30 ans.
    Les entrepôts n’ont pas vocation à assurer la pérennité des données sur le long terme ni d’assurer l’évolution technologique (disparition des formats de fichiers et/ou des logiciels assurant leurs lectures/exploitation).

DATA PAPERS

  • « Selon la revue et ses exigences, le contenu et la taille du Data paper peuvent varier considérablement entre une forme très synthétique et un article très complet »
    Extrait de : « Revues publiant des Data papers ». Laurence Dedieu, octobre 2016

  • On peut publier un Data paper basé sur un jeu de données dynamique. Dans le cas où l’objectif du Data paper est de décrire une version précise du jeu de données (exemple : cas d’un jeu de données soutenant un article classique), il convient de s’assurer que le lien indiqué dans le Data paper permette à tout moment d’accéder soit directement, soit indirectement au jeu de données original cité dans le Data paper.

    Le Data paper peut aussi avoir pour objet de décrire un jeu de données dynamique en temps qu’objet conceptuel (schéma, types de données, modes de requêtage, etc.).

    Le cas le plus fréquent est effectivement de pointer vers un jeu de données stable.

  • A priori, tous les types de données sont recevables. Vérifier néanmoins les instructions aux auteurs.

ACCÈS VISUALISATION

  • Oui, vous pouvez utiliser :

    • Les moteurs de recherche intégrés sur les sites des entrepôts de données ;
    • Les méta-moteurs de recherche (catalogue de données) permettant de rechercher des données dans plusieurs entrepôts.
  • Il n’y a pas de liste à proprement parlé. Toutefois voici quelques outils :

    • Outils de visualisation pour l’accès aux données depuis un entrepôt :
    • Outils de visualisation pour une meilleure manipulation et appréhension des données :
      • Gephi (logiciel libre d’analyse et de visualisation de réseaux)
      • D3js (bibliothèque JavaScript pour créer des visualisations dynamiques)
      • Gargantext (plateforme web pour explorer des données textuelles)
      • QGIS (Système d’Information Géographique Libre et Open Source)

Votre question n’apparaît pas dans cette FAQ ?

Laissez-nous un message, nous vous répondrons au plus vite !