Métadonnées, standards, formats : FICHE SYNTHÉTIQUE
Publié le 27/11/2017 | Mis à jour le 04/06/2024 | DOI : 10.13143/vbjs-6288
Objectifs
Après avoir consulté cette ressource, vous devriez être capable de :
- Expliquer ce que sont les métadonnées et leurs usages ;
- Citer 2 types ou exemples de standards de métadonnées ;
- Décrire le standard interdisciplinaire Dublin Core.
L’utilisation de métadonnées est ancienne : les bibliothèques utilisaient des fiches cartonnées pour décrire les documents. Avec le numérique, les métadonnées sont rendues interrogeables par les machines. Un enjeu majeur de la science ouverte est la description standardisée des données de recherche via leurs métadonnées, selon les besoins spécifiques des domaines scientifiques.
Métadonnées, des données sur les données
Principe
Les métadonnées permettent de décrire précisément les données. Si on imagine un jeu de données sous la forme d’une boite de conserve, alors les métadonnées équivalent à l’étiquette qui orne celle-ci et en décrit le contenu : date de fabrication, producteur, provenance, méthodologie, identifiant pérenne, etc.
Note
- Les métadonnées sont :
- soit embarquées : elles sont produites automatiquement par les appareils ou logiciels (exemples : date, format…).
- soit enrichies : elles sont ajoutées par l’auteur (exemples : mots-clés, nom du projet, licence…).
Utilité
Gérer et partager :
- Structurer, organiser et gérer l’ensemble de ses données.
- Tracer leurs traitements.
- Définir leurs usages.
- Préparer le partage et l’interopérabilité.
Rendre les données FAIR :
- Faciles à trouver
- Accessibles
- Interopérables
- Réutilisables
Le saviez-vous ?
Quand les données disparaissent, les métadonnées restent ! En effet, les métadonnées qui accompagnent un jeu de données devraient toujours rester accessibles. Elles fournissent des informations utiles lorsque les données ne peuvent pas être partagées (embargo, accès restreint) ou lors du retrait des données (données obsolètes, etc.).
Structuration des métadonnées
Les standards de métadonnées
Un standard est un schéma qui a été adopté comme modèle par un ensemble d’utilisateurs : il est reconnu, normalisé et utilisé à grande échelle.
Selon les disciplines ou le type de données, le standard peut être spécialisé.
Pour le renseigner, il est recommandé d’utiliser des vocabulaires dédiés (thesaurus, lexiques, taxonomies…).
Les formats d'échange
Le format est une représentation sous forme numérique du standard de métadonnées. Le format permet aux machines de lire et échanger les contenus. Parmi les formats ouverts courants, on peut citer XML, TXT et CSV.
Note
Il ne faut pas confondre les formats d’échange et les formats de fichier :
- Les formats de fichier résultent du travail de comités techniques qui produisent des spécifications librement accessibles (formats libres ou ouverts) ou protégées (formats propriétaires).
- Les formats d’échange servent au partage de contenus entre machines.
Zoom sur des exemples
de standards de métadonnées
DataCite Metadata Schema :
Attribution de DOI
Encoded Archival Description
(EAD) :
Description des archives
Darwin Core
(DwC) :
Domaine de la biodiversité
Data Documentation Initiative (DDI) :
Sciences sociales, comportementales et économiques
International Press Telecommunications Council (IPTC) :
Description d’une image par l’auteur
Exchangeable image file format
(EXIF) :
Description automatique d’un cliché
Exemple de standard interdisciplinaire : Dublin Core
Initialement composé de 15 éléments, le Dublin Core simple a été enrichi par une quarantaine d’éléments plus spécifiques : on parle du Dublin Core qualifié. Celui-ci s’inscrit dans l’architecture du web.
L’exemple ci-dessous illustre les précisions apportées aux éléments « Date » et « Relation » :
La version accessible des PDF de cette fiche synthétique, conforme aux normes d’accessibilité établies, est disponible dans le fichier ZIP téléchargeable, via le bouton “TÉLÉCHARGER” ci-dessous.
ÉVALUER
Laisser une réponse