Recherche Data Gouv, un entrepôt au service du partage et de l’ouverture des données de recherche

Publié le jj/mm/2022 | DOI : 10.13143/xxxx-xxxx

AUTEURS

Ministère de l’Enseignement Supérieur et de la Recherche

Inist – CNRS

Catégories – Tags

La recherche est face à un défi majeur : préserver, partager et ouvrir les données pour favoriser une science ouverte, plus transparente et plus cumulative au service de tous, les équipes de recherche et de la société dans son ensemble.
La gestion des données de recherche est un sujet critique et une charge de travail supplémentaire complexe pour les équipes de recherche. Aujourd’hui, la valeur des données de recherche n’est pas suffisamment exploitée. Pire, ces données sont trop souvent perdues ou inexploitables.

Pour soutenir les équipes de recherche

Recherche Data Gouv a été pensé pour soutenir les équipes de recherche dans leur travail de structuration des données pour les rendre Faciles à trouver, Accessibles, Interopérables, Réutilisables, c’est-à-dire conformes aux principes « FAIR ».

L’ambition de Recherche Data Gouv : devenir un service de l’European open science cloud (EOSC), offrant un accès au patrimoine des données partagées et ouvertes de la recherche pour favoriser leur réutilisation !

Les principes de l’entrepôt Recherche Data Gouv

Multidisciplaire

Toutes les thématiques de la recherche sont concernées

Confiance

Modération et objectif de certification Core Trust Seal (certification pour garantir la fiabilité et la durabilité des dépôt de données ainsi que l’archivage et le partage à long terme des données)

Visibilité

Reconnaissance des productions et des acteurs et meilleure visibilité internationale des données de la recherche française

Accompagnement

Les ateliers de la donnée sont en proximité géographique des équipes de recherche pour leur apporter une première expertise dans la gestion de leurs données de recherche

Pourquoi un entrepôt Recherche Data Gouv ?

Gestion des données de la recherche : une situation critique

La situation en matière de gestion des données de recherche est à l’heure actuelle relativement critique. Les consultations menées auprès des chercheurs dans le cadre des études préparatoires à ce projet font apparaître les difficultés qu’ils rencontrent : pratiques de stockage sur un support individuel (disque dur, clé USB…), perte des données au moment où un chercheur quitte le laboratoire, absence de solution pour stocker et ouvrir de manière pérenne des données collectées lors d’un projet de recherche, impossibilité de reproduire les résultats d’une recherche scientifique car les données et le code ne sont pas accessibles ou sont mal documentés et non réutilisables. Ce projet abouti n’est pas seulement le résultat d’une volonté politique, mais vise à répondre aux difficultés quotidiennes des chercheurs.

Une prolifération des entrepôts de données en France et dans le monde et pourtant une absence de solution pour de nombreuses communautés scientifiques.

Dans le cadre des travaux préparatoires à la nouvelle feuille de route des infrastructures de recherche, le questionnaire soumis aux infrastructures a fait apparaître que seulement 33% d’entre elles déclarent avoir une politique des données (qui ne couvre pas toujours l’entièreté du cycle de vie) et que seulement 28% d’entre elles pratiquent le dépôt de données dans un entrepôt. Or on observe paradoxalement une prolifération des entrepôts : on compte plus de 3 600 entrepôts dans le monde et au moins 110 en France, dont une demi-douzaine d’entrepôts institutionnels existant et plusieurs autres en cours de création. Cette prolifération réduit fortement la visibilité et la découvrabilité des données pour les chercheurs, et fait obstacle à la fertilisation croisée des données entre disciplines. Le coût technologique de création d’un entrepôt pour un établissement est estimé à 1 million d’euros sur 4 ans, coût en réalité largement mutualisable.

Pour en savoir plus, consulter le site Recherche Data Gouv


Les guides de l’entrepôt

Les équipes de Recherche Data Gouv et de DoRANum se sont associées afin d’élaborer des guides afin d’appréhender toutes les étapes de la création d’un compte jusqu’à la gestion du dépôt.

  • Dans cette rubrique :
    Présentation de l’entrepôt, organisation des contenus, définition d’un jeu de données, d’une collection, la curation des jeux de données et l’organisation de l’accompagnement… lire la suite

  • La consultation et le téléchargement des jeux de données publiés et ouverts ne nécessitent aucune authentification. Toutes les autres opérations (dépôt, publication de données, consultation de fichiers en accès restreint, etc.) nécessitent d’être authentifié… lire la suite

  • Vérifier si les donnés sont partageables, préparer les fichiers et la documentation… lire la suite

  • Dans cette rubrique :
    1- Créer un jeu de données,
    2- Renseigner un premier lot de métadonnées
    3- Ajouter les fichiers associés au jeu de données
    4- Sauvegarder le jeu de données
    5- Préciser les conditions d’utilisation du jeu de données (licences, conditions d’accès etc.)… lire la suite

  • Qu’est-ce que cela implique ?
    Le jeu de données devient visible par tous les utilisateurs, authentifiés ou non. Les métadonnées sont publiques et favorisent la découverte et la réutilisation du jeu de données. Les fichiers de données sont en accès ouvert sauf si des restrictions sont appliquées par le déposant. Le DOI attribué au jeu de données ainsi que les DOI des fichiers sont enregistrés de façon définitive par l’agence Datacite et deviennent actifs… lire la suite

  • Publication d’un jeu de données avec ou sans curation… lire la suite sur le site Recherche Data Gouv 

  • Le déposant ou toute personne autorisée peut modifier un jeu de données publié :
    – Ajouter d’autres fichiers, supprimer ou remplacer des fichiers
    – Ajouter/modifier des métadonnées
    – Modifier les conditions d’utilisation (licence) et d’accès aux fichiers… lire la suite

  • Cette fonction, développée spécifiquement par INRAE, permet de générer une ébauche de data paper à partir d’un DOI existant sur le portail… lire la suite

  • Si le jeu de données est déjà publié, il n’est pas possible de le supprimer. Le curateur a la possibilité de retirer le jeu de données (ou certaines versions) de la diffusion… lire la suite

  • Dans cette rubrique :
    – Naviguer dans les collections
    – Chercher des données… lire la suite

TÉLÉCHARGER

Cette ressource et sa documentation sont disponibles pour réutilisation

ÉVALUER

Envoi
User Review
0 (0 votes)

PARTAGER