Les métadonnées sont partout !

Publié le 21/06/2017 | Mis à jour le 08/08/2018 | DOI : 10.13143/rzep-gw09

Auteur

Urfist Méditerranée

OBJECTIFS

Après avoir consulté cette ressource, vous devriez être capable de :

  • Définir ce que sont les métadonnées embarquées;
  • Citer 1 exemple pour lequel les métadonnées embarquées sont utiles;
  • Expliquer en quoi les métadonnées embarquées peuvent représenter un risque;
  • Citer 2 outils permettant de vérifier et nettoyer les métadonnées embarquées dans les documents numériques.

Pour rappel, les métadonnées peuvent être présentes :

  • de manière embarquée, par exemple dans un fichier informatique (photo, logiciel, document, …);
  • de manière externe, par exemple dans un catalogue d’accompagnement d’un jeu de données ou dans un annuaire d’entrepôts.

Nous abordons ici des notions de base sur les métadonnées embarquées.

Si vous pensez ne pas connaître les métadonnées, détrompez-vous ! Vous les utilisez tous les jours, peut-être sans vous en rendre compte. Par exemple :

En rédigeant un texte sur le logiciel Word

En prenant une photo depuis votre smartphone

En envoyant un mail

Ces activités banales, que l’on fait quotidiennement sans arrière-pensée, laissent pourtant des traces pas vraiment visibles au premier abord. En effet, quelque soit leur format, tous les fichiers contiennent des données associées plus ou moins cachées : ce sont des métadonnées embarquées.

Ainsi, des métadonnées sont automatiquement générées :

  • lorsque vous créez un document sur le logiciel Word; auteur, date de création, taille, nombre de mots, etc.
  • lorsque vous prenez une photo sur votre appareil; date, marque de l’appareil, numéro de série, etc.
  • lorsque vous envoyez un mail; objet, expéditeur, destinataire, date d’envoi, personnes en copie (CC), etc.

Ces métadonnées sont très utiles pour automatiser des traitements de l’information (organiser, rechercher, catégoriser).

Les services de messagerie par exemple s’appuient sur les métadonnées pour filtrer la recherche d’un mail dans la boîte de réception.

Exemple de recherche de courrier dans Gmail.

Les métadonnées sont vraiment partout, et nos activités sur Internet n’y échappe pas bien au contraire. Nous laissons toujours une multitude de traces qu’il est possible de voir. Voici un exemple révélateur :

Le Massachusetts Institute of Technology (MIT) a développé une application, nommée Immersion, permettant de visualiser les métadonnées laissées sur les services de messagerie. A ce jour, ce service fonctionne pour Gmail, Yahoo et Exchange. Il suffit de rentrer son adresse mail, d’autoriser l’application à accéder à son compte et, au bout de quelques secondes, on voit se dérouler tout l’historique des mails envoyés.

zoomer

Visualisation fictive issue de la démo du site https://immersion.media.mit.edu/ 

Des bulles dynamiques liées entre elles apparaissent, de façon plus ou moins volumineuse selon le nombre d’échanges avec les correspondants. On peut retracer l’évolution de nos mails en faisant avancer ou reculer la barre de navigation correspondant aux différentes périodes.

Si vous êtes curieux de tester vous-même la visualisation des métadonnées de vos mails, cliquez sur le lien en dessous de l’image !

Des risques existent

Ce qu’il faut savoir, c’est que lorsque vous transmettez vos documents vous transmettez par là même les métadonnées associées. Ce qui peut représenter certains risques si les documents en question contiennent des informations que vous ne désirez pas partager.

Certains formats d’image (comme les formats TIFF ou JPEG) contiennent des métadonnées au format EXIF qui génère automatiquement les coordonnées GPS de l’image ainsi qu’une miniature de l’image originale. Ainsi, même si vous modifiez l’image en floutant un visage ou en la recadrant pour cacher certaines parties, les métadonnées permettent de retrouver l’image originale.

Il est de même possible de localiser l’endroit où la photo a été prise. Si par exemple vous diffusez des photos que vous avez prises de plantes en voie de disparition, n’importe qui peut à priori localiser les plantes, ce qui peut avoir de lourdes conséquences.

Un exemple de trahison par les métadonnées : l’histoire de John McAfee, le créateur de l’antivirus du même nom. Recherché par la police pour une histoire de meurtre, il fut retrouvé grâce aux métadonnées d’une photo publiée par le magazine Vice. Une personne sur Twitter a relevé les informations qui sont remontées ensuite à la police.

Comment vérifier et nettoyer ses métadonnées ?

Afficher les métadonnées : clic droit / propriétés

Les systèmes d’exploitation (Windows, Mac, Linux…) permettent déjà d’afficher les métadonnées de tous vos documents. Il suffit de faire un clic droit sur le fichier et d’aller dans les propriétés.

Exemple sur Windows.

Modifier les propriétés dans les logiciels de bureautique

Les logiciels de bureautique permettent de voir et de modifier les métadonnées des documents avec lesquels ils ont été conçus.

Exemple d’un document Word (version 2016) :

Zoomer
Zoomer

Pour en savoir plus, consultez le site de support de Microsoft Office.

Convertir ses documents en PDF

Si vos documents créés à partir de logiciels de bureautique contiennent des annotations ou commentaires, vous pouvez les imprimer au format PDF pour en faire des documents statiques. Ainsi, vous supprimerez les métadonnées liées aux modifications et commentaires.

Notez cependant que le format PDF contient plusieurs métadonnées (titre, sujet, auteur, etc.). Vous pouvez les voir et les modifier à partir de logiciels d’édition de PDF (Acrobat Writer, Foxit PhantomPDF sur Windows ou Mac, PDF mod sur Ubuntu) en allant dans les propriétés du document. Pour en savoir plus sur les logiciels manipulant les PDF, vous pouvez consulter cette page Wikipédia.

Ces logiciels permettent d’éditer et d’annoter des documents PDF. Si vous le faites, gardez en tête que vous générez des métadonnées !

Vérifier et modifier les métadonnées des images

Il existe des extensions pour navigateurs (Firefox, Google Chrome) qui permettent d’afficher les métadonnées d’images sur Internet. C’est le cas par exemple de l’extension Exif viewer. Notez que vous ne pouvez que consulter les métadonnées, pas les modifier.

Extensions proposées par Google Chrome.

Supprimer les métadonnées avec Gimp

En parallèle des extensions en ligne, vous pouvez aussi utiliser le logiciel libre Gimp afin de supprimer les métadonnées de vos images.

Vous pouvez télécharger Gimp ici et suivre la procédure de suppression des métadonnées sur cette page.

Nettoyer les métadonnées de tous types de documents avec MAT et ExifTool

Il existe enfin des outils qui suppriment les métadonnées de plusieurs types de documents (texte, photo, image, son et vidéo). Il y a entre autres Metadata Anonymisation Toolkit (GNU/Linux) et ExifTool (outil en ligne).

Vous pouvez télécharger MAT ici et ExifTool ici.

Vous connaissez d’autres outils ou moyens pour vérifier et nettoyer vos métadonnées ? Faites-nous en part dans la zone de commentaire !

ÉVALUER

Envoi
User Review
4 (1 vote)

PARTAGER

Dans la/les même(s) thématique(s)

Félicitations vous avez tout vu (pour l’instant) !

Dans le(s) même(s) format(s)

Félicitations vous avez tout vu (pour l’instant) !

Autres suggestions

Laisser un commentaire