L'origine et la description des données de la recherche

Publié le 13/02/2017 | Mis à jour le 27/11/2018

Auteur

Inist-CNRS

Catégories – Tags

OBJECTIFS

Après avoir consulté cette ressource, vous devriez être capable de :

  • Savoir comment renseigner la partie du DMP consacrée à l’origine de vos données de recherche ;
  • Savoir comment renseigner la partie du DMP consacrée à la description de vos données de recherche ;
  • Citer 1 exemple de classification pour la description de vos données de recherche.

Dans votre DMP, vous devez préciser l’origine de vos données. S’agit-il de collecter des données ? D’en créer de nouvelles ? Ou de réutiliser des données existantes ?
Dans tous les cas, vous devez détailler la méthodologie de travail utilisée, et décrire le plus précisément possible vos données.

Origine des données

Vous devez spécifier pour chaque jeu de données :
– si vous allez collecter et utiliser des jeux de données existants ;
– ou bien créer de nouveaux jeux de données ;
– ou bien à la fois collecter des jeux de données existants et en créer de nouveaux.

Dans chacun des cas et pour chaque jeu de données, vous devez également détailler la méthodologie adoptée.

Concrètement, pour des données existantes, vous devez décrire le chemin d’accès à ces données, c’est-à-dire citer la source, les modalités d’accès et donner une description synthétique.
Pour des données nouvelles, créées ou générées, vous devez détailler le processus de création ou le mode opératoire mis en place.

Description des données

Chaque DMP doit comporter une description des données de recherche du projet. Il convient de décrire le plus précisément possible vos données pour qu’elles soient comprises et exploitées :
– par tous les acteurs liés au projet (partenaires, financeurs…)
– mais aussi par d’autres chercheurs dans le cadre du partage des données de recherche pour de nouveaux projets.
Il n’existe pas de méthodologie unique. En effet, de nombreux domaines scientifiques disposent de leur propre terminologie pour décrire leurs données de recherche.

Voici plusieurs pistes de classifications descriptives suffisamment généralistes pour être applicables à tout projet :
– en fonction de la source des données
– en fonction de la forme des données
– et en fonction de leur stabilité.

De quelle source proviennent les données ?

En fonction de leur provenance, vos données peuvent être :

© Cyril FRESILLON / LGP / CNRS Photothèque – Référence N° 20140001_1863

Les données d’observation sont capturées en temps réel. Elles sont habituellement uniques et donc impossible à reproduire.
C’est le cas de la neuroimagerie, de la photographie astronomique ou des données d’enquête.

© Jean-Claude MOSCHETTI / CNRS Photothèque
Référence N° 20110001_2399

Les données expérimentales sont obtenues à partir d’équipements de laboratoire. Elles sont souvent reproductibles mais cela peut s’avérer coûteux.
Les chromatographes et les puces à ADN relèvent de cette deuxième catégorie.

© CNRS photothèque
Référence N° 20020001_1486

Les données computationnelles ou de simulation sont générées par des modèles informatiques ou de simulation. Elles sont souvent reproductibles à condition que le modèle soit correctement documenté. On peut citer par exemple les modèles météorologiques, de simulation sismique ou encore les modèles économiques.

© Christian BRUNET / CNRS Photothèque
Référence N° 20060001_0895

Les données dérivées ou compilées sont issues du traitement ou de la combinaison de données brutes. Elles sont souvent reproductibles mais coûteuses.
C’est le cas pour la fouille de texte ou les bases de données compilées.

Sous quelle forme se présentent ces données ?

Il peut s’agir de :

© Jean-Loïc LE QUELLEC / CNRS Photothèque
Référence N° 20110001_0061

Notes de terrain ou de laboratoires, réponses d’enquête…

© Jean-Baptiste FILIPPI / Frédéric BOSSEUR / Univ. Corse / SPE / CNRS Photothèque
Référence N° 20130001_1135

Tableaux, comptes, mesures…

© Claude DELHAYE / CNRS Photothèque
Référence N° 20140001_1263

Images, sons, vidéos…

© CFEETK / Atm3d / CNRS Photothèque Référence N° 20090001_0239

© Didier COT / CNRS Photothèque
Référence N° 20000001_1414

Par exemple FITS en données spatiales ou CIF en cristallographie…

© Franck DONNADIEU / CNRS Photothèque
Référence N° 20040001_1050

Quelle est la stabilité de ces données ?

On peut distinguer trois niveaux :

Les données ne changent pas après avoir été recueillies ou produites.

De nouvelles données peuvent être ajoutées, mais les anciennes données ne sont jamais modifiées ou supprimées.

De nouvelles données peuvent être ajoutées et les anciennes données peuvent être modifiées ou supprimées.

Pour cette partie du DMP, quelle que soit la méthodologie adoptée, le plus important est de décrire les données de recherche du projet de façon précise et détaillée.
L’objectif est d’optimiser la gestion de vos données de recherche et leur partage dans le cadre de l’Open access.

ÉVALUER

Envoi
User Review
0 (0 votes)

PARTAGER

Dans la/les même(s) thématique(s)

Félicitations vous avez tout vu (pour l’instant) !

Dans le(s) même(s) format(s)

Félicitations vous avez tout vu (pour l’instant) !

Autres suggestions

Laisser un commentaire