Catégories – Tags
OBJECTIFS
Après avoir consulté cette ressource, vous devriez être capable de :
- Identifier les points que vous devez clarifier avant de déposer vos données de recherche;
- Identifier les personnes et ressources auxquelles vous référer pour préparer vos données au dépôt.
Les principes éthiques sont respectés
Vous devez être particulièrement vigilant sur les données à caractère personnel, c’est-à-dire les informations qui permettent d’identifier directement ou indirectement une personne physique (nom, prénom, numéro de téléphone, de sécurité sociale, etc.) selon l’article 2 de la loi « Informatique et libertés ».
Dans ce cas, référez-vous à la CNIL ou au CIL (Correspondant informatique et libertés) de votre organisme.
Les droits de diffusion des données sont vérifiés / obtenus
Dans le cadre d’un projet particulier, vous devez avoir la permission des autres chercheurs / collaborateurs avant de diffuser les données. Vous pouvez vous référer à l’accord de consortium, vos droits peuvent y être précisés.
Les modalités d'accès sont définies
Suivant l’entrepôt, il vous sera possible de choisir :
Vous pourrez également déposer vos données mais les rendre accessibles plus tard en décidant d’un embargo. La période d’embargo est à définir, toutefois vous pouvez être limité par ce que propose l’entrepôt.
Une licence appropriée est attribuée aux données
Une licence de diffusion est indispensable pour définir les conditions de réutilisation des données. Pour favoriser le partage, il est souhaitable de choisir une licence la plus ouverte possible, permettant une utilisation libre et sans restriction.
L’entrepôt peut vous proposer plusieurs licences au choix. Une licence précise peut également vous être imposée.
Les jeux de données à partager sont sélectionnés
Les fichiers sont organisés et nommés de façon explicite
Vérifiez avec un documentaliste et/ou un informaticien que vos données sont organisées correctement pour un traitement informatique ou une intégration dans une base de données.
Nommez de façon claire et cohérente vos dossiers et fichiers. Les dénominations doivent avoir du sens et refléter le contenu.
Vous pouvez suivre quelques règles pour éviter toute confusion, suppression accidentelle ou problème d’affichage (pas de caractères spéciaux, pas d’accents, pas d’espaces, pas de mots vides, etc.). Créez votre propre convention de nommage pour qu’elle convienne à votre contexte et à vos collaborateurs.
Les fichiers sont dans des formats pérennes et ouverts
Vous devez utiliser des formats de fichiers acceptés par l’entrepôt choisi. Dans tous les cas, il est préférable d’éviter les formats fermés et de privilégier les formats ouverts ou largement répandus, afin que vos données puissent être lues et réutilisées. Convertissez le format de vos fichiers si besoin, par exemple un format XLS (format Excel fermé) vers un format CSV (format ouvert).
Un cours en ligne sur les formats de fichiers est proposé par MANTRA, un service de l’Université d’Edimbourg. Et si vous souhaitez vérifier vos connaissances sur les formats de fichier, voici un petit jeu fait pour ça !
Le volume des fichiers ne dépasse pas la limite autorisée par l'entrepôt
Le volume des fichiers est contraint par l’entrepôt. Il y a une taille maximale que vous ne pourrez pas dépasser. Cette taille limite dépend des entrepôts. Par exemple, l’entrepôt Zenodo limite la taille d’upload à 2GB par fichier, l’entrepôt Figshare à 5GB.
Un identifiant pérenne et unique est attribué aux données
L’entrepôt attribue généralement un identifiant pérenne ou un accession number.
Il se peut aussi qu’un identifiant ait déjà été attribué à votre jeu de données (par votre institution par exemple).
Les données sont décrites et documentées
La description des données doit être suffisante pour assurer leur validation, reproductibilité, réutilisation.
Vos données doivent donc être bien décrites : titre explicite, description, technologie, organisme, mots clés, etc. Pour cela, il est recommandé d’utiliser les standards / terminologies de votre domaine.
Les formulaires de dépôt dans un entrepôt sont souvent simples et ne comportent que quelques champs à remplir pour la description des données. Ils s’appuient la plupart du temps sur des standards généralistes comme Dublin Core ou DataCite. Le dépôt dans les entrepôts spécialisés nécessite des informations plus précises qui utilisent des standards disciplinaires. Cependant, la plupart des entrepôts fournissent des outils d’aide pour décrire vos données suivant le standard recommandé.
Vous pouvez consulter ici les recommandations du DCC et de RDA sur les standards de métadonnées.
Il est également nécessaire de fournir la documentation qui permet la réutilisation de vos données. Un document (par exemple, un fichier Readme) expliquant le contexte, la méthodologie, les outils / logiciels utilisés et toutes les informations indispensables à la réutilisation de vos données peut être demandé.Un dictionnaire de données permettant d’expliciter les variables mesurées peut également être fourni séparément. Par exemple, pour un fichier tabulé, il peut être nécessaire de spécifier les entêtes des colonnes, les unités utilisées, les acronymes, etc.
TÉLÉCHARGER
ÉVALUER
User Review
( votes)PARTAGER
Laisser une réponse