Jeu de données (dataset)

Jeu de données (dataset) 150 150 Claire Sowinski

« La notion de « jeu de données » (dataset) peut être définie comme l’agrégation, sous une forme lisible, de données brutes ou dérivées présentant une certaine «unité», rassemblées pour former un ensemble cohérent.
Toutefois, l’échelle à laquelle ces données assemblées acquièrent leur unité pour former un « jeu » varie selon les disciplines, les types de données, les projets, les raisons pour lesquelles ces données sont agrégées. Sous l’angle spécifique de « l’ouverture » des données de recherche, on peut définir le jeu de données comme un enregistrement de données sous la forme d’un ou plusieurs fichiers électroniques, téléchargeables, citables (notamment par l’intermédiaire d’un DOI) et intelligibles – ce jeu étant accompagné des métadonnées descriptives suffisantes. »

Attention, dans le cas des logiciels, un jeu de données peut être le code source ainsi que la documentation associée.

Sources :
– Gaillard Rémi. De l’open data à l’open research data: quelle(s) politique(s) pour les données de la recherche. Janvier 2014. https://www.enssib.fr/bibliotheque-numerique/documents/64131-de-l-open-data-a-l-open-research-data-quelles-politiques-pour-les-donnees-de-recherche.pdf
– Foire aux questions du groupe de travail “Atelier Données”. https://gt-atelier-donnees.miti.cnrs.fr/faq.html#definir