GLOSSAIRE
Dernière mise à jour : 26/09/2024
A
Association des archivistes français
Association qui a pour objet l’étude des questions intéressant les archives et les archivistes, ainsi que la promotion et la défense des intérêts de la profession, par tous les moyens appropriés.
Source : AAF
Voir Libre accès
Site recensant des entrepôts de données, permettant de filtrer ses recherches par critère.
Agence Nationale de la Recherche
Établissement public français à caractère administratif, placé sous la tutelle du ministère de l’Enseignement supérieur et de la Recherche. L’Agence met en œuvre le financement de la recherche sur projets, pour les opérateurs publics en coopération entre eux ou avec des entreprises.
Source : ANR
Article Processing Charges
Frais de publication demandés aux auteurs par les éditeurs pour que leurs articles soient en libre accès dès leur publication. Ces frais sont fréquemment payés par l’université ou l’institut de recherche auquel l’auteur est rattaché, ou par l’organisme de financement soutenant ses recherches.
« L’archivage pérenne a pour fonction d’assurer la conservation à long terme des données, leur accessibilité tout en préservant leur intelligibilité, comme rendre accessible en lecture des données immuables (archives de documents administratifs, données de mesures expérimentales, résultats de simulations coûteuses à produire, etc.). Il a vocation à prévenir l’obsolescence des supports numériques.
En France, c’est le CINES (Centre Informatique National de l’Enseignement Supérieur) qui assure cette mission pour les données scientifiques issues d’observations ou de calculs, les données patrimoniales (pédagogiques, publications, etc.) et les données administratives. […] »
Sources :
Couperin. Groupe de travail science ouverte. Définitions et foire aux questions. https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
Hadrossek Christine , Janik Joanna, Libes Maurice, Louvet Violaine, Quidoz Marie-Claude, Rivet Alain, Romier Geneviève. Guide de bonnes pratiques sur la gestion des données de recherche. 23 août 2023. https://mi-gt-donnees.pages.math.unistra.fr/guide/
Réservoir en ligne de publications scientifiques, principalement des articles. Il permet un accès libre – immédiat ou différé (voir embargo) – et gratuit pour le déposant et le lecteur. Il peut être institutionnel, thématique ou centralisé.
Australian Research Data Commons
En juillet 2018, l’ARDC a été créée par la fusion de trois infrastructures de recherche numérique existantes : l’Australian National Data Service (ANDS), les National eResearch Collaboration Tools and Resources (Nectar) et les Research Data Services (RDS). En mai 2019, l’ARDC est devenue une société à responsabilité limitée, sans but lucratif.
Elle permet à la communauté des chercheurs australiens et à l’industrie australienne d’accéder à une infrastructure de recherche numérique, à des plateformes, à des compétences et à des collections de données de haute qualité, importantes au niveau national et à forte intensité de données.
Source : ARDC. https://ardc.edu.au/about_us/
Archive Resource Key
Système d’identifiants mis en place par la California Digital Library (CDL), et qui a vocation à identifier des objets de manière pérenne. Il peut s’agir d’objets de tous types, physiques (table, livre), numériques (livre numérisé…) ou même immatériels (concepts, …).
Source : BnF. L’identifiant ARK (Archival Resource Key). 13 mars 2018.
Document qui a un format utilisé et compris par un ordinateur.
B
On entend par base de données un recueil d’oeuvres, de données ou d’autres éléments indépendants, disposés de manière systématique ou méthodique, et individuellement accessibles par des moyens électroniques ou par tout autre moyen.
Collection de jeux de données et d’informations organisées afin d’être facilement consultables (“searchable”), gérables et mises à jour.
Sources :
Article L 112-3 du code la propriété intellectuelle. Légifrance
INSU. Glossaire. École thématique DATA-SDUE : Guide de Survie dans la jungle des données en Sciences de l’Univers et de l’Environnement. 10-14 octobre 2022. https://data-sdue.sciencesconf.org/
Bibliothèque nationale de France
Établissement public sous tutelle du ministère de la Culture, la Bibliothèque nationale de France a pour mission de collecter, conserver, enrichir et communiquer le patrimoine documentaire national.
C
Commission d’accès aux documents administratifs
Commission qui assure la bonne application du droit d’accès. C’est une autorité administrative indépendante chargée de veiller au respect de la liberté d’accès aux documents administratifs et aux archives publiques ainsi qu’à la réutilisation des informations publiques.
Source : Cada
Version numérique et dématérialisée du journal de bord utilisé pour détailler au quotidien les activités liées aux projets de recherche, les expériences et les protocoles utilisés. Le cahier permet, notamment devant les offices de brevets, d’établir la preuve de l’invention, de ses inventeurs et donc de ses ayants-droit. Il facilite les démarches qualité, contribue à la reproductibilité des données et des résultats de recherche et répond aux obligations légales et contractuelles.
Centre pour la Communication Scientifique Directe
Au service de la communauté des chercheurs et de leur environnement institutionnel (organismes de recherche, universités), sa mission principale est de fournir, dans l’esprit du libre accès, des outils pour l’archivage, la diffusion et la valorisation des publications et des données scientifiques.
Source : CCSD
Organisation européenne pour la recherche nucléaire.
L’un des plus grands laboratoires scientifiques du monde. Il a pour vocation la physique fondamentale, la découverte des constituants et des lois de l’Univers. Il utilise des instruments scientifiques très complexes pour sonder les constituants ultimes de la matière : les particules fondamentales.
Source : CERN
Centre Informatique National de l’Enseignement Supérieur
Etablissement qui propose des moyens exceptionnels à l’ensemble de la communauté scientifique dans ses missions statutaires stratégiques nationales : le calcul numérique intensif, l’archivage pérenne de données électroniques, l’hébergement de plates-formes informatiques d’envergure nationale.
Source : CINES
Centre de coopération international en recherche agronomique pour le développement
Organisme français de recherche agronomique et de coopération internationale pour le développement durable des régions tropicales et méditerranéennes.
Source : Cirad
Commission Nationale Informatique et Libertés
Commission qui accompagne les professionnels dans leur mise en conformité et aide les particuliers à maîtriser leurs données personnelles et exercer leurs droits. Elle analyse l’impact des innovations technologiques et des usages émergents sur la vie privée et les libertés. Elle travaille en étroite collaboration avec ses homologues européens et internationaux pour élaborer une régulation harmonisée.
Source : CNIL
Ensemble d’instructions composant un programme informatique dans un langage de programmation. Le code source se matérialise généralement sous la forme d’un ensemble de fichiers texte lisibles par un utilisateur et exécutables par une machine. Le code source est la représentation d’un logiciel pour qu’un utilisateur puisse y apporter des modifications.
Source : Ministère de l’Enseignement Supérieur et de la Recherche. Deuxième Plan national pour la science ouverte. Juillet 2021. https://www.ouvrirlascience.fr/deuxieme-plan-national-pour-la-science-ouverte/
« La collecte de données fait référence au processus de rassemblement, d’acquisition et d’enregistrement d’informations, qu’elles soient quantitatives ou qualitatives. Ce processus peut être effectué à partir de diverses sources telles que des enquêtes, des capteurs, des bases de données, des formulaires en ligne, des médias sociaux, etc. Il est essentiel de reconnaître la diversité des méthodes d’acquisition de données, lesquelles peuvent varier considérablement en fonction des différentes disciplines de recherche. La collecte des données peut entraîner leur réutilisation, c’est-à-dire leur utilisation à des fins dépassant et/ou prolongeant leur objectif initial. […] »
Source : Couperin. Groupe de travail science ouverte. Définitions et foire aux questions. https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
Comité d’éthique du CNRS
Instance consultative et indépendante dont les avis sont publics. Placé auprès du Conseil d’administration du CNRS, le COMETS traite des questions dont le saisissent le Conseil d’administration, le Conseil scientifique ou le Directeur général du CNRS. Son indépendance lui permet d’aborder librement la portée éthique des grands enjeux impliquant la recherche.
C’est une instance de réflexion qui examine les questions éthiques soulevées par la recherche scientifique, dans ses pratiques, dans les situations nouvelles qu’elle fait naître, dans ses finalités. Il dégage, dans le domaine de l’éthique, les principes qui concernent les activités de recherche, les comportements individuels, les attitudes collectives et le fonctionnement des instances de l’organisme.
Source : COMETS
Compétences relatives au système de publication, à la structuration des données, au droit, aux nouveaux usages numériques et aux bonnes pratiques de la science ouverte.
Communauté d’Universités et Établissements
Etablissements publics à caractère scientifique, culturel et professionnel (EPSCP) assurant le rapprochement et la coordination des établissements d’enseignement supérieur et de recherche d’un même territoire académique ou inter académique. L’objet des communautés d’universités et établissements est de coordonner les offres de formation et les stratégies de recherche et de transfert des établissements publics d’enseignement supérieur sur un territoire donné.
Source : Wikipedia. Communauté d’universités et établissements. https://fr.wikipedia.org/wiki/Communaut%C3%A9_d%27universit%C3%A9s_et_%C3%A9tablissements
CoreTrustSeal offre à tout entrepôt de données intéressé une certification de niveau de base basée sur les Core Trustworthy Data Repositories Requirements (exigences de base des entrepôts de données fiables). Ce catalogue universel d’exigences reflète les caractéristiques essentielles des entrepôts de données fiables.
Source : CoreTrustSeal
La curation scientifique consiste à nettoyer, éditorialiser, transformer dans l’objectif d’obtenir des jeux de données «propres», lisibles et plus faciles à traiter. Il existe aussi la curation documentaire et technique qui consiste à vérifier des métadonnées de fichiers de données à déposer dans un entrepôt, dans le but de proposer des modifications et d’améliorer la qualité de description des jeux de données.
Source : MESR, Ministère de l’Enseignement Supérieur et de la Recherche. Science ouverte. Données de la recherche. Février 2024. https://www.ouvrirlascience.fr/science-ouverte-donnees-de-la-recherche/
« Le cycle de vie des données de la recherche est l’ensemble des étapes de gestion, conservation, diffusion et réutilisation des données scientifiques, associées aux activités de recherche. »
Source : Deboin Marie-Claude. Découvrir de nouveaux métiers liés aux données de la recherche. CIRAD. 5 p. 5 octobre 2018. https://doi.org/10.18167/coopist/0061
D
Agence d’enregistrement des digital object identifier (DOI) pour les données de la recherche.
Source : Ministère de l’Enseignement Supérieur et de la Recherche. Deuxième Plan national pour la science ouverte. Juillet 2021. https://www.ouvrirlascience.fr/deuxieme-plan-national-pour-la-science-ouverte/
Journal (toujours en libre accès) qui publie des articles de données (data papers). Il fournit habituellement des modèles de description des données et guide les chercheurs sur les lieux de dépôt et sur la façon de décrire et de présenter leurs données.
Source : L’Hostis, D., Hamelin, M., Lelievre, V., Aventurier, P. (2016). Publier un Data Paper pour valoriser ses données (Cours). https://hal.inrae.fr/hal-02801638/
Aussi connu sous le nom d’article de données, de data descriptor, data article, data briefs, resource announcements, research note ou encore data resource profile.
Un data paper est un article scientifique dont la spécificité est de décrire les traitements opérés pour un ou des jeux de données publiés, notamment les méthodes de recueil, les opérations d’appariement et d’analyse de ceux-ci. Il détaille le potentiel de réutilisation des jeux de données publiés par ailleurs dans des entrepôts. Le PGD peut servir de trame. Si certaines revues « classiques » acceptent ces articles spécifiques, il existe également des revues spécialisées, appelées data journals. Comme pour les articles, les data papers bénéficient d’une relecture par les pairs (peer-reviewing), sont citables et reconnus dans les évaluations de l’HCERES.
Un data paper permet de valoriser le travail de publication de données et d’attester de la qualité de ces dernières qui sont ainsi soumises à une évaluation par des pairs.
Source : Couperin. Groupe de travail science ouverte. Définitions et foire aux questions. https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
Digital Curation Centre
Centre d’expertise dans le domaine de la conservation de l’information numérique, qui met l’accent sur le renforcement des capacités et des compétences en matière de gestion des données de recherche. Il fournit des conseils d’experts et une aide pratique aux organismes de recherche qui souhaitent stocker, gérer, protéger et partager des données de recherche numérique.
Source : DCC
Dublin Core Metadata Initiative
Organisation ouverte qui soutient l’innovation dans la conception des métadonnées et les meilleures pratiques dans l’écologie des métadonnées. Ses activités comprennent des travaux sur l’architecture et la modélisation, des discussions et des travaux en collaboration au sein des communautés DCMI et des groupes de travail DCMI, des conférences mondiales, des réunions et des ateliers, ainsi que des efforts éducatifs visant à promouvoir l’acceptation généralisée des normes et des meilleures pratiques en matière de métadonnées.
Source : DCMI
« La déontologie réunit les devoirs et obligations imposés à une profession, une fonction ou une responsabilité. »
Source : CNRS, Centre national de la recherche scientifique. Responsabilité de recherche. https://www.cnrs.fr/fr/le-cnrs/responsabilites/responsabilite-de-recherche
Dépôt d’un article (version publiée ou manuscrit final) dans une archive ouverte par l’auteur (auto-archivage, self-archiving) ou l’un de ses représentants. Ce dépôt est communément appelé voie verte (green road, green open access).
La directive européenne du 14 mars 2007, dite directive Inspire, vise à établir une infrastructure d’information géographique pour favoriser la protection de l’environnement. Ce que la directive appelle infrastructure d’information géographique est un ensemble de services d’information disponibles sur Internet, répartis sur les sites des différents acteurs concernés, et permettant la diffusion et le partage de données géographiques.
Source : Ministère de la transition écologique et de la cohésion des territoires. La directive européenne Inspire. https://www.ecologie.gouv.fr/directive-europeenne-inspire
Voir : PGD
Les “Documents administratifs” visés par la loi française sont tous les documents, quels que soient leur date, leur lieu de conservation, leur forme et leur support, qui sont produits ou reçus, dans le cadre de leur mission de service public, par l’État, les collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d’une telle mission.
Source : Becard, N., Castets-Renard, C., Chassang, G., Courtois, M.-A., Dantant, M., Gandon, N., Martin, C., Martelletti, A., Mendoza-Caminade, A., Morcrette, N., Neirac, C. (2017). Ouverture des données de la recherche. Guide d’analyse du cadre juridique en France. DOI : 10.15454/1.481273124091092E12. https://hal.inrae.fr/hal-02791224
Digital Object Identifier
Identifiant pérenne qui permet l’identification unique d’un objet physique ou numérique et sa citation. Il fournit un lien stable à des ressources en ligne, comme les données de la recherche.
Toute information relative à :
- L’état des éléments de l’environnement, notamment l’air, l’atmosphère, l’eau, le sol, les terres, les paysages, les sites naturels, les zones côtières ou marines et la diversité biologique, ainsi que les interactions entre ces éléments ;
- Les décisions, les activités et les facteurs, notamment les substances, l’énergie, le bruit, les rayonnements, les déchets, les émissions, les déversements et autres rejets, susceptibles d’avoir des incidences sur l’état des éléments visés au premier point ;
- L’état de la santé humaine, la sécurité et les conditions de vie des personnes, les constructions et le patrimoine culturel, dans la mesure où ils sont ou peuvent être altérés par des éléments de l’environnement, des décisions, des activités ou des facteurs mentionnés ci-dessus
- Les analyses des coûts et avantages ainsi que les hypothèses économiques utilisées dans le cadre des décisions et activités visées au deuxième point ;
- Les rapports établis par les autorités publiques ou pour leur compte sur l’application des dispositions législatives et réglementaires relatives à l’environnement.
Les dispositions concernant les données environnementales sont issues de la Convention d’Aarhus. Les données environnementales devant être diffusées sont celles relatives à des zones sur lesquelles la France détient ou exerce sa compétence.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
Toute donnée faisant directement ou indirectement référence à un lieu ou une zone géographique spécifique. Les thèmes des données géographiques devant être diffusées sont listés aux Annexes I, II et III de la directive INSPIRE. Ce sont les données géographiques relatives à une zone sur laquelle la France détient ou exerce sa compétence qui doivent être diffusées.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
« Donnée qu’un organisme met à la disposition de tous sous forme de fichiers numériques afin de permettre leur réutilisation. Les données ouvertes n’ont généralement pas de caractère personnel. Elle sont accessibles dans un format favorisant leur réutilisation. La réutilisation des données peut être soumise à condition.»
Source : JORF – 3 mai 2014 : https://www.legifrance.gouv.fr/download/pdf?id=EIfNdfZcj68Ft7HKVNtup0bLevfzmxJeWyfiAQsA_Uo=
« Une donnée personnelle est toute information se rapportant à une personne physique identifiée ou identifiable. Mais, parce qu’elles concernent des personnes, celles-ci doivent en conserver la maîtrise.
Une personne physique peut être identifiée :
– directement (exemple : nom et prénom) ;
– indirectement (exemple : par un numéro de téléphone ou de plaque d’immatriculation, un identifiant tel ue le numéro de sécurité sociale, une adresse postale ou courriel, mais aussi la voix ou l’image). »
Source : CNIL. Donnée personnelle. https://www.cnil.fr/fr/definition/donnee-personnelle
Savoirs, savoir-faire et technologies dont le détournement ou la captation pourrait porter atteinte aux intérêts économiques de la nation, renforcer des arsenaux militaires étrangers ou affaiblir les capacités de défense de la France, contribuer à la prolifération des armes de destruction massive et de leurs vecteurs ou favoriser les actions malveillantes sur le territoire national ou à l’étranger.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
Donnée incluse dans les documents produits ou reçus dans le cadre de leur mission de service public par l’Etat, les collectivités territoriales, les autres personnes de droit public ainsi que les personnes de droit privé chargées d’une mission de service public.Des exemples de données publiques sont données aux articles L.300-2 et L.312-1-1 du Code des relations entre le public et l’administration.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
Donnée collectée par voie d’enquête statistique ou transmises au service statistique public à des fins d’établissement des statistiques.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
Données non préparatoires produites par les établissements de recherche et d’enseignement dans le cadre de leur mission de service public. Il peut s’agir de données brutes, de données élaborées ou de métadonnées. Elle sont qualifiées de documents administratifs et sont donc communicables à toute personne qui en fait la demande, sauf exceptions légales.
Source : Becard, N., Castets-Renard, C., Chassang, G., Courtois, M.-A., Dantant, M., Gandon, N., Martin, C., Martelletti, A., Mendoza-Caminade, A., Morcrette, N., Neirac, C. (2016). Ouverture des données de la recherche. Guide d’analyse du cadre juridique en France. DOI : 10.15454/1.481273124091092E12. https://hal.inrae.fr/hal-02791224
Les données brutes sont des données issues d’une expérimentation, d’un procédé, d’une enquête, etc. : il peut s’agir de données de recherche communicables.
Source : Becard, N., Castets-Renard, C., Chassang, G., Courtois, M.-A., Dantant, M., Gandon, N., Martin, C., Martelletti, A., Mendoza-Caminade, A., Morcrette, N., Neirac, C. (2017). Ouverture des données de la recherche. Guide d’analyse du cadre juridique en France. DOI : 10.15454/1.481273124091092E12. https://hal.inrae.fr/hal-02791224
« Enregistrements factuels (chiffres, textes, images, sons, vidéos… ), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. »
Source : OCDE, Organisation de Coopération et de Développement Économiques. Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics. 2007. https://doi.org/10.1787/9789264034020-en-fr
Données figurant dans une publication scientifique.
Les données préliminaires sont des données préparatoires, préalables, nécessaires à la mise en place d’une expérimentation, d’un procédé, d’une enquête, etc : il ne s’agit pas de données de recherche.
Source : Becard, N., Castets-Renard, C., Chassang, G., Dantant, M., Freyt-Caffin N., Gandon, N., Martin, C., Martelletti, A., Mendoza-Caminade, A., Morcrette, N., Neirac, C. (2017). Ouverture des données de la recherche. Guide d’analyse du cadre juridique en France. DOI : 10.15454/1.481273124091092E12. https://hal.inrae.fr/hal-02791224
« Les données sensibles forment une catégorie particulière des données personnelles.
Ce sont des informations qui révèlent la prétendue origine raciale ou ethnique, les opinions politiques, les convictions religieuses ou philosophiques ou l’appartenance syndicale, ainsi que le traitement des données génétiques, des données biométriques aux fins d’identifier une personne physique de manière unique, des données concernant la santé ou des données concernant la vie sexuelle ou l’orientation sexuelle d’une personne physique. »
Source : CNIL. Donnée sensible. https://www.cnil.fr/fr/definition/donnee-sensible
Données nécessaires à la validation des résultats présentés dans les publications scientifiques.
délégué à la protection des données
Personne désignée qui doit être « associée, d’une manière appropriée et en temps utile, à toutes les questions relatives à la protection des données à caractère personnel ». Il est l’interlocuteur privilégié des personnes souhaitant poser des questions relatives au traitement de leurs données à caractère personnel et à l’exercice des droits que leur confère le Règlement Général sur la Protection des Données.
Data.gouv.fr. Organismes ayant désigné un(e) délégué(e) à la protection des données (DPD/DPO). https://www.data.gouv.fr/fr/datasets/organismes-ayant-designe-un-e-delegue-e-a-la-protection-des-donnees-dpd-dpo/#/resources
Source : Lausson J. RGPD : tout comprendre au rôle de Délégué à la Protection des Données. 25 mai 2018.
Digital Preservation Europe
Consortium d’institutions universitaires et culturelles européennes qui se consacrent au partage de leur expertise et de leurs ressources collectives en matière de préservation numérique. Financé par la Commission européenne au titre du sixième programme-cadre, le DPE se concentre sur la sensibilisation du grand public, des bibliothèques, des archives, des musées, des organismes gouvernementaux et des institutions à travers l’Europe.
Source : DPE
Ensemble des droits dont jouissent les auteurs sur leurs œuvres. Une œuvre est protégée dès sa création et dès lors qu’elle est originale, et ceci sans dépôt ni enregistrement. Le droit d’auteur comprend notamment des droits patrimoniaux ou d’exploitation qui peuvent être cédés à un tiers par l’auteur : droits de reproduction, de représentation et de suite et droit d’autoriser les œuvres dérivées. Les droits moraux ne sont pas cessibles.
Droit acquis au producteur de la base de données sur le contenu de celle-ci lui permettant d’interdire l’extraction ou la réutilisation d’une partie qualitativement ou quantitativement substantielle du contenu de sa base. Attention, à ne pas confondre avec l’architecture de la base de données, le contenant, qui est protégée par le droit d’auteur.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
E
Période pendant laquelle les articles et les données de recherche déposés dans un réservoir ne sont pas accessibles librement.
Entrepôt de données répondant aux critères de qualité exigés pour obtenir une certification (format des données, qualité des métadonnées, conditions d’accès et de réutilisation, identifiant pérenne, archivage à long terme…).
De nombreux entrepôts n’ont pas de certification mais sont cependant largement reconnus par la communauté scientifique et offrent des garanties de conservation à long terme.
« Un entrepôt de données de recherche (Research Data Repository ou Data Repository) est une plateforme destinée à accueillir, conserver, rendre visibles et accessibles des données de recherche. Son rôle est de permettre le dépôt ou la collecte de données, leur description, leur accès, et leur partage en vue de leur réutilisation. Chaque entrepôt dispose généralement d’une politique de dépôt, de description et de diffusion des données. »
Il peut être disciplinaire ou thématique, être institutionnel ou centralisé.
Note : Data Warehouse est une base de données relationnelle, pensée et conçue pour les requêtes et les analyses de données. La traduction littérale en français de “Warehouse” en “entrepôt” est inexacte et conduit souvent à un conflit avec l’ontologie “Data Repository”.
Sources :
Dedieu Laurence, Barale Martine. Déposer des données dans un entrepôt, en 6 points. CIRAD. 4 p. 10 février 2021. https://doi.org/10.18167/coopist/0070
INSU. Glossaire. École thématique DATA-SDUE : Guide de Survie dans la jungle des données en Sciences de l’Univers et de l’Environnement. 10-14 octobre 2022. https://data-sdue.sciencesconf.org/
Entrepôt contenant à la fois des publications scientifiques et des jeux de données.
European Open Science Cloud. C’est un guichet unique par lequel les chercheurs peuvent accéder à des services, des données et d’autres ressources des infrastructures de recherche publiques nationales, régionales et institutionnelles en Europe. Il facilite l’interopérabilité des ensembles de données et des outils de différents fournisseurs.
Source : Ministère de l’Enseignement Supérieur et de la Recherche. Portail Web de l’European Open Science Cloud (EOSC). https://www.ouvrirlascience.fr/portail-web-de-leosc/
Etablissement Public à caractère Scientifique et Technologique
« L’éthique nous invite à réfléchir aux valeurs qui motivent nos actes et à leurs conséquences et fait appel à notre sens moral et à celui de notre responsabilité. »
Source : CNRS, Centre national de la recherche scientifique. Responsabilité de recherche. https://www.cnrs.fr/fr/le-cnrs/responsabilites/responsabilite-de-recherche
F
Findable, Accessible, Interoperable, Reusable principles
Voir : Principes FAIR
Environnement de développement logiciel facilitant le travail collaboratif autour d’un projet logiciel. Une forge contient des outils tels que le dépôt versionné de code source, des forums de discussion, un environnement de tests automatisés, etc.
Source : Ministère de l’Enseignement Supérieur et de la Recherche. Passeport pour la Science Ouverte. Guide pratique à l’usage des doctorants. Février 2024. https://www.ouvrirlascience.fr/passeport-pour-la-science-ouverte-guide-pratique-a-lusage-des-doctorants/
« Un format est quelque chose qui met en forme de manière conventionnelle des données destinées à représenter du texte, du son, de l’image, de la vidéo, ou une combinaison des quatre. C’est une sorte de « gabarit » qui met certaines données à des endroits déterminés ».
Source : Boulétreau V., Habert B. (2014) « Les formats » dans Vitalo-Rosati et Sinatra (dirs.). Pratiques de l’édition numérique. Montréal : Presses de l’université de Montréal. p.147
Analyse informatique de bases de données et de corpus de texte pour extraire des éléments d’information qui serviront à la construction de connaissances.
Voir : APC
H
Archive ouverte nationale française portée par le Centre pour la communication scientifique directe (CCSD)
« Les humanités numériques sont composées de différents champs d’études qui sont les suivants : recherche, enseignement et ingénierie, au croisement de l’informatique et des arts, lettres, sciences humaines et sciences sociales. Elles se caractérisent par des méthodes et des pratiques liées au développement et à l’utilisation de méthodes et d’outils numériques en sciences humaines et sociales (les humanities computing ou « humanités computationnelles »), en ligne et hors ligne. Elles prennent en compte les nouveaux contenus et médias numériques, au même titre que des objets d’étude plus traditionnels (les digital studies ou « études numériques »). »
Source : Wikipedia. Humanités numériques. https://fr.wikipedia.org/wiki/Humanit%C3%A9s_num%C3%A9riques
I
Un identifiant pérenne est une combinaison unique de lettres et/ou de chiffres attribuée à une ressource, qu’elle soit physique ou numérique : un article de revue, un jeu de données, un logiciel, un protocole de recherche, un livre, un auteur… Il permet d’identifier de manière univoque et immuable un objet, une personne, ou une institution.
Source : Couperin. Groupe de travail science ouverte. Définitions et foire aux questions. https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
identifiant unique géré dans HAL
Identifiant unique géré dans HAL. Il permet à un utilisateur connu comme auteur dans HAL, de regrouper toutes ses publications.
Source : HAL Documentation
Information contenue dans un document administratif communicable à tous ou faisant l’objet d’une diffusion publique, sur lequel des tiers ne détiennent pas de droits de propriété intellectuelle.
Source : https://guides.etalab.gouv.fr/juridique/opendata/#qu-est-ce-que-l-open-data
Articles de recherche scientifique évalués par les pairs et données de recherche (publications de données sous-jacentes, données ayant subi une curation ou données brutes).
« L’intégrité scientifique concerne la « bonne » conduite des pratiques de recherche. »
Source : CNRS, Centre national de la recherche scientifique. Responsabilité de recherche. https://www.cnrs.fr/fr/le-cnrs/responsabilites/responsabilite-de-recherche
Capacité de différents systèmes informatiques à dialoguer entre eux, à échanger des données, à communiquer sans ambiguïté et ainsi interpréter des informations correctement.
International Standard Name Identifier
Code international normalisé servant à identifier de manière univoque, sur le long terme et à l’échelle internationale, les personnes et les organismes. Il permet d’identifier au niveau international les identités publiques des personnes ou des organismes impliqués dans la création, la production, la gestion et la distribution de contenus intellectuels et artistiques ou faisant l’objet de ces contenus. Les personnes identifiées peuvent être, par exemple, l’auteur, l’éditeur, le traducteur, l’illustrateur ou le sujet d’une œuvre.
Source : BnF. Qu’est-ce que l’ISNI ?
Information Scientifique et Technique
J
« La notion de « jeu de données » (dataset) peut être définie comme l’agrégation, sous une forme lisible, de données brutes ou dérivées présentant une certaine «unité», rassemblées pour former un ensemble cohérent.
Toutefois, l’échelle à laquelle ces données assemblées acquièrent leur unité pour former un « jeu » varie selon les disciplines, les types de données, les projets, les raisons pour lesquelles ces données sont agrégées. Sous l’angle spécifique de « l’ouverture » des données de recherche, on peut définir le jeu de données comme un enregistrement de données sous la forme d’un ou plusieurs fichiers électroniques, téléchargeables, citables (notamment par l’intermédiaire d’un DOI) et intelligibles – ce jeu étant accompagné des métadonnées descriptives suffisantes. »
Attention, dans le cas des logiciels, un jeu de données peut être le code source ainsi que la documentation associée.
Sources :
– Gaillard Rémi. De l’open data à l’open research data: quelle(s) politique(s) pour les données de la recherche. Janvier 2014. https://www.enssib.fr/bibliotheque-numerique/documents/64131-de-l-open-data-a-l-open-research-data-quelles-politiques-pour-les-donnees-de-recherche.pdf
– Foire aux questions du groupe de travail “Atelier Données”. https://gt-atelier-donnees.miti.cnrs.fr/faq.html#definir
L
Le libre accès réfère à l’accès en ligne gratuit à du contenu scientifique évalué par les pairs, et ce, avec un nombre limité de restrictions (ni authentification, ni embargo, ni paiement) découlant du droit d’auteur et des licences. Il peut être mis en œuvre de différentes façons : auto-archivage dans une archive ouverte, publication dans une revue en libre accès…
Sources :
FOSTER Open Science Training Handbook. https://github.com/Open-Science-Training-Handbook/Open-Science-TrainingHandbook_FR/tree/master/06Glossary
Ministère de l’Enseignement Supérieur et de la Recherche. Passeport pour la Science Ouverte. Guide pratique à l’usage des doctorants. Février 2024. https://www.ouvrirlascience.fr/passeport-pour-la-science-ouverte-guide-pratique-a-lusage-des-doctorants/
« Une licence permet à l’auteur d’une production (qu’il s’agisse d’un article, d’un chapitre d’ouvrage, d’un logiciel ou encore d’un jeu de données) d’en fixer les règles d’utilisation par un tiers. Par exemple, d’autoriser ou non la modification de la production ou son usage commercial. Toute licence exige au minimum de citer le ou les auteurs. »
Source : Couperin. Groupe de travail science ouverte. Définitions et foire aux questions. https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
Contrats-type, proposés par l’organisation Creative Commons, dans lesquels les chercheurs déterminent les droits attachés à l’article ou aux données de recherche qu’ils ont produits dans le cadre de leurs recherches. Six contrats sont possibles en combinant quatre éléments de base qui sont : la paternité, la modification, l’utilisation commerciale et la réutilisation dans les mêmes conditions du contrat d’origine.
La Licence Ouverte a été conçue par Etalab (administration publique française) pour faciliter et encourager la réutilisation des données publiques mises à disposition gratuitement. Cette licence de diffusion ouverte concerne l’ensemble des données publiques au sens du CRPA (Code des relations entre le public et l’administration), c’est-à-dire toutes les données de la recherche sauf celles issues d’une recherche financée majoritairement par des acteurs privés. Cette licence permet la reproduction, la modification et l’utilisation commerciale si la mention d’attribution et la date de dernière mise à jour sont précisées.
Sources :
Etalab. Licence Ouverte / Open Licence. https://www.etalab.gouv.fr/licence-ouverte-open-licence/
Couperin. Groupe de travail science ouverte. Définitions et foire aux questions. https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
Selon l’article L. 112-2 du Code de la propriété intellectuelle (CPI) : un logiciel est une œuvre de l’esprit protégée par le droit d’auteur. C’est l’ensemble des programmes, procédés et règles, et éventuellement de la documentation, relatifs au fonctionnement d’un ensemble de traitement de données. C’est donc un concept large, qui contient le code source, le code compilé et éventuellement la documentation.
Sources :
Légifrance. Code de la propriété intellectuelle. 11 mai 1994. https://www.legifrance.gouv.fr/codes/article_lc/LEGIARTI000006278875/
BBF. Enrichissement du vocabulaire de l’informatique. Arrêté du 22 décembre 1981. https://bbf.enssib.fr/consulter/bbf-1982-06-0355-009
M
Ministère de l’enseignement supérieur et de la recherche
Les métadonnées sont, au sens premier, des « données sur les données ». Selon la BnF (Bibliothèque Nationale de France), une métadonnée est un ensemble structuré d’informations (auteur, date et lieu de publication, édition, etc.) décrivant une ressource quelconque. L’objectif des métadonnées est, en particulier, de contextualiser les données afin de rendre possible et de faciliter leur consultation, leur compréhension et leur échange et ainsi de permettre de pérenniser leur utilisation.
Source : Couperin. Groupe de travail science ouverte. Définitions et foire aux questions. https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
Elles sont intrinsèquement liées aux fichiers de recherche. Par exemple, lorsqu’une photographie est prise, elle contient des métadonnées créées immédiatement : date, lieu, appareil utilisé, configuration, etc.
Source : Couperin. Groupe de travail science ouverte. Définitions et foire aux questions. https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
Elles sont complétées manuellement, soit dans un fichier à part, soit directement au moment du dépôt dans un entrepôt de données. Par exemple pour un jeu de données : les mots-clés, le sujet, le laboratoire ou organisme, le nom du projet, la licence, etc.
Source : Couperin. Groupe de travail science ouverte. Définitions et foire aux questions. https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
Metadata Encoding and Transmission Standard
Schéma XML qui permet la description intégrale d’objets numériques. Ce schéma sert à exprimer des métadonnées de nature diverses portant sur un document numérique, dans le but de faciliter son échange, sa gestion et sa préservation. Il peut servir de standard pour l’échange d’objets numériques entre différentes archives ou différents entrepôts.
Source : BnF. METS : Metadata Encoding and Transmission Standard
Massachusetts Institute of Technology
Open Archival Information System
Cadre conceptuel pour un système d’archivage dédié à la préservation et au maintien de l’accès à l’information numérique à long terme. Le but du modèle de référence est d’accroître la sensibilisation et la compréhension des concepts pertinents pour l’archivage d’objets numériques, en particulier parmi les institutions non archivistiques ; d’élucider la terminologie et les concepts pour décrire et comparer les modèles de données et les architectures archivistiques ; d’élargir le consensus sur les éléments et les processus endémiques de la préservation et de l’accès à l’information numérique ; et de créer un cadre pour guider l’identification et l’élaboration de normes.
Source : Brian Lavoie. Meeting the challenges of digital preservation: The OAIS reference model. 2000.
N
« Le service public est défini comme toute activité d’une collectivité publique visant à satisfaire un besoin d’intérêt général. En France, la notion de service public s’applique à trois catégories d’activités :
– celles qui recouvrent les fonctions régaliennes de l’État (police, défense, justice, finances publiques, administration) […] ;
– celles qui relèvent du secteur administré non marchand (Éducation nationale, santé, Sécurité sociale et aide sociale, activités culturelles et sportives, infrastructures uniques ou essentielles telles que les routes, les voies ferrées, etc., distribution de l’eau) […] ;
– celles qui relèvent du secteur marchand : il s’agit de services publics industriels et commerciaux, qui sont principalement financés par une activité commerciale et gérés par des établissements publics soumis à la fois au droit administratif et au droit privé (transports, énergie, services postaux, télécommunications, etc.). […] »
Source : Larousse. Service public. https://www.larousse.fr/encyclopedie/divers/service_public/187160
O
Organisation de Coopération et de Développement Économiques
Organisation qui a pour mission de promouvoir les politiques qui amélioreront le bien-être économique et social partout dans le monde. L’OCDE offre aux gouvernements un forum où ils peuvent conjuguer leurs efforts, partager leurs expériences et chercher des solutions à des problèmes communs.
Source : OCDE.
Online Computer Library Center
Coopérative mondiale de bibliothèques qui fournit des services technologiques partagés, des études et travaux de recherche originaux et des programmes collectifs pour ses membres et la communauté des bibliothèques en général.
Source : OCLC.
Création de l’esprit empreinte d’originalité c’est-à-dire laissant transparaitre la personnalité de son auteur.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
« Ensemble organisé de termes/concepts avec des relations sémantiques variées décrivant un domaine de connaissance. Ex : FOAF (FriendOfAFriend). »
Source : École thématique E-Envir 2021. Interoperable & Reuse. Introduction aux concepts clefs et immersion. 2 au 5 novembre 2021. https://e-envir-21.sciencesconf.org/data/pages/6_E_ENVIR21_INTEROP_REUSE.pdf
Open Access Infrastructure for Research in Europe
OpenAIRE a pour objectif principal de soutenir le travail de recherche des scientifiques européens en créant et en exploitant une infrastructure d’accès ouvert, robuste, durable et participative, responsable de la gestion, de l’analyse, de la manipulation, de la fourniture et (surtout) de la mise en réseau d’un très large éventail de publications scientifiques et de données de la recherche.
Sources : Science ouverte France. OpenAIRE ; Projet OpenAIRE
Directory of Open Access Repositories
Annuaire mondial (de qualité certifiée) des dépôts universitaires à accès libre. Il permet l’identification, la navigation et la recherche de dépôts, sur la base d’une série de caractéristiques, telles que l’emplacement, le logiciel ou le type de matériel détenu.
Source : JISC. OpenDOAR.
Optimisation du Partage et de l’Interopérabilité des Données de la Recherche
Portail mis en place et hébergé par l’Inist-CNRS. Il met à disposition de la communauté de l’Enseignement Supérieur et de la Recherche un ensemble d’outils et de services facilitant la gestion et la valorisation des données afin de répondre aux critères d’intégrité, reproductibilité et aux principes FAIR qui visent à rendre les données Faciles à trouver, Accessibles, Interopérables, Réutilisables. Trois services sont actuellement proposés : DMP OPIDoR accompagne les chercheurs et leurs partenaires dans l’élaboration d’un plan de gestion de données, élément clé d’une bonne gestion ; Cat OPIDoR est un catalogue permettant d’identifier les services dédiés aux données de la recherche ; Un service d’attribution d’identifiants pérennes DOI aux objets issus de la recherche.
Source : OPIDoR.
Open Researcher and Contributor Identifier
ORCID s’efforce de permettre des connexions transparentes et dignes de confiance entre les chercheurs, leurs contributions et leurs affiliations en fournissant un identifiant unique et persistant que les individus peuvent utiliser lorsqu’ils s’engagent dans des activités de recherche, d’érudition et d’innovation.
Source : ORCID.
P
Le Plan de Gestion des Données est un outil de gestion. Il se présente sous la forme d’un document évolutif, structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données d’un projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.
Persistent IDentifier
Voir Identifiant pérenne
Public Library of Science
Editeur innovateur à but non lucratif et organisation de défense des droits avec pour mission d’accélérer les progrès de la science et de la médecine en dirigeant une transformation dans la communication de la recherche. Ce n’est plus seulement un accès libre et gratuit à la recherche, il s’agit aussi de données ouvertes, de transparence dans l’examen par les pairs et d’une approche ouverte de l’évaluation scientifique.
Source : PLOS.
Personnes Responsables de l’Accès aux Documents Administratifs.
Personne responsable de l’accès aux documents administratifs et des questions relatives à la réutilisation des informations publiques chargée de : réceptionner les demandes d’accès aux documents administratifs et de licence de réutilisation des informations publiques ainsi que les éventuelles réclamations et de veiller à leur instruction ; assurer la liaison entre l’autorité auprès de laquelle elle est désignée et la commission d’accès aux documents administratifs.
Source : Cada. Le rôle de la PRADA.
PREservation Metadata Implementation Strategies
Dictionnaire de données développé par une équipe internationale d’experts. Tout en s’appuyant sur le modèle OAIS, l’objectif de PREMIS est de favoriser la pérennisation des documents numériques en fournissant des informations sous forme d’un dictionnaire de données.
Source : BnF. PREMIS : PREservation Metadata Implementation Strategies
La notion de FAIR data recouvre les manières de construire, stocker, présenter ou publier des données de manière à permettre que la donnée soit facile à trouver, accessible, interopérable et réutilisable.
Source : Ministère de l’Enseignement Supérieur et de la Recherche. Deuxième Plan national pour la science ouverte. Juillet 2021. https://www.ouvrirlascience.fr/deuxieme-plan-national-pour-la-science-ouverte/
Personne physique ou morale qui prend l’initiative et le risque financier de la production de la base de données.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
« La propriété industrielle a […] pour objet la protection et la valorisation des inventions, des innovations et des créations. »
Source : INPI. Les enjeux de la propriété intellectuelle
« La propriété intellectuelle regroupe la propriété industrielle, d’une part, et la propriété littéraire et artistique, d’autre part. »
Source : INPI. Les enjeux de la propriété intellectuelle
Open Archives Initiative Protocol for Metadata Harvesting
C’est un protocole qui définit les conditions du transfert de métadonnées d’une archive ouverte, produite par un fournisseur de données, vers le serveur d’un fournisseur de services.
Publication d’un article dans une revue donnant un accès libre et gratuit aux lecteurs dès sa publication. Le mode de financement diffère d’une revue à l’autre. Certains éditeurs ne demandent aucun frais, d’autres en demandent (voir frais de publication). Ce mode de publication est désigné par voie dorée (gold road, gold open access).
persistent URL
Fonctionnellement, un PURL est une URL. Cependant, au lieu de pointer directement vers l’emplacement d’une ressource Internet, un PURL pointe vers un service de résolution intermédiaire. Le service de résolution PURL associe le PURL à l’URL réelle et renvoie cette URL au client sous la forme d’une redirection HTTP standard. Les PURLs sont une approche pour résoudre le problème des URLs instables.
Source : DOI. Factsheet. DOI® System and Persistent URLs (PURLs). 5 mai 2015
R
Réseau Bases De Données
Réseau dédié aux questionnements commun à toutes les équipes du CNRS et aux autres établissements, autour des bases de données.
Source : Martin C. Pourquoi un réseau Bases de données ? 4 novembre 2016
Research Data Alliance
«Organisation internationale, basée sur les contributions de ses membres, qui développe de l’infrastructure et des activités communautaires pour réduire les obstacles au partage et aux échanges de données, et pour accélérer l’innovation à l’échelle mondiale en misant délibérément sur les données.»
Source : Research Data Alliance in a nutshell. Février 2024. https://www.rd-alliance.org/about-the-rda/
Resource Description Framework
Modèle standard de graphe destiné à décrire de façon formelle les ressources web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions.
Registry of Research Data Repositories
Annuaire mondial d’entrepôts de données de recherche couvrant différentes disciplines scientifiques. Il présente des entrepôts pour le stockage permanent et l’accès aux jeux de données destinés aux chercheurs, aux organismes de financement, aux éditeurs et aux établissements d’enseignement.
Source : re3data.org
« Le RGPD encadre le traitement des données personnelles sur le territoire de l’Union européenne.
Ce nouveau règlement européen s’inscrit dans la continuité de la Loi française Informatique et Libertés de 1978 et renforce le contrôle par les citoyens de l’utilisation qui peut être faite des données les concernant.
Il harmonise les règles en Europe en offrant un cadre juridique unique aux professionnels. Il permet de développer leurs activités numériques au sein de l’UE en se fondant sur la confiance des utilisateurs. »
Source : CNIL. RGPD : de quoi parle-t-on ? 10 avril 2018. https://www.cnil.fr/fr/rgpd-de-quoi-parle-t-on
La réplicabilité est la capacité, par une équipe différente, de reproduire une expérience en ré-utilisant le même dispositif expérimental décrit (y compris les codes logiciels).
La reproductibilité est la capacité, par une équipe différente, de reproduire une expérience, sans se fier au dispositif expérimental et aux codes logiciels développés par l’équipe d’origine.
Les revues scientifiques sont des publications périodiques d’articles scientifiques, qui sont préalablement soumis à validation par un comité de lecture indépendant.
Registry of Open Access Repositories
Répertoire international de plus de 5000 plateformes d’archives ouvertes, classées par type et par pays.
Source : Couperin. Open access France. Les répertoires
Research Organization Registry : Identifiants uniques pour les établissements de recherche.
Source : Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation. Deuxième Plan national pour la science ouverte. Juillet 2021. https://www.ouvrirlascience.fr/deuxieme-plan-national-pour-la-science-ouverte/
S
La science des données, parfois opposée à la science expérimentale, est une autre façon de faire de la science. Elle se base sur des méthodes automatisées pour fouiller et analyser de grandes quantités de données afin d’en extraire des éléments d’information qui serviront à la construction de connaissances.
diffusion sans entrave des publications et des données de la recherche.
Source : Ministère de l’enseignement supérieur et de la recherche. Plan national pour la Science ouverte. 4 juillet 2018
Toute information dont une personne a eu connaissance de par son état ou sa profession, soit en raison d’une fonction ou d’une mission temporaire. Ce sera donc toute information dont une personne a eu connaissance au cours de l’exercice de ses fonctions professionnelles. Le terme « état » renvoie à une fonction qui n’est pas forcément d’ordre professionnel, comme une fonction religieuse.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
Le secret statistique permet d’apporter aux personnes qui fournissent des informations utilisées pour l’établissement de statistiques l’assurance que ces informations ne seront pas utilisées d’une façon susceptible de leur porter tort.
Il permet ainsi d’assurer :
- Aux personnes physiques que la confidentialité sur leur vie personnelle et familiale sera garantie,
- Aux entreprises que le secret commercial sera respecté : les informations transmises ne seront pas mises à la disposition de leurs concurrents.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
“Software article” ou “software tool article” ou “article sur les logiciels”
” C’est une publication revue par les pairs dont l’objectif est de présenter un logiciel à la communauté scientifique. Contrairement à une publication « traditionnelle », le software paper ne vise pas à partager un résultat marquant mais à décrire un logiciel qui a été développé pour la recherche, y compris les objectifs ayant conduit à son développement, le processus de conception, les détails techniques sur son fonctionnement, des instructions sur la façon de l’utiliser, son potentiel de réutilisation… ”
Source : Institut Pasteur. On vous explique les software papers. 26 février 2024. https://openscience.pasteur.fr/2024/02/26/les-software-papers/
Software Hash Identifier (anciennement Software Heritage persistent Identifier)
Créé par l’archive universelle Software Heritage, c’est un système d’identifiant pérenne sous forme de code alphanumérique qui identifie de manière unique les codes sources des logiciels.
C’est un identifiant pérenne et intrinsèque pour les artefacts du code source des logiciels, tels que les fichiers de code source, les arborescences de sources, les commits et d’autres objets que l’on trouve généralement dans les systèmes de contrôle de version.
Source : https://www.swhid.org/
T
« La taxonomie ou taxinomie est une branche des sciences naturelles qui a pour objet l’étude de la diversité du monde vivant. Cette activité consiste à décrire et circonscrire en termes d’espèces les organismes vivants et à les organiser en catégories hiérarchisées appelées taxons. Elle doit proposer des outils et des méthodes permettant de les identifier (notamment grâce aux clés de détermination). La reconnaissance par la communauté scientifique de ces catégories repose sur la pertinence de leur description, l’attribution d’un nom et leur classement au sein du Vivant. »
Source : Wikipedia. Taxonomie. https://fr.wikipedia.org/wiki/Taxonomie
« Par extension, [la taxonomie est une] classification, suite d’éléments formant des listes qui concernent un domaine, une science. »
Source : Dictionnaire Larousse. https://www.larousse.fr/dictionnaires/francais/taxinomie/76893
Text and Data Mining
En français : Analyse et fouille de textes et de données.
Extraction d’un savoir ou d’une connaissance à partir de grandes quantités de textes et de données, par des méthodes automatiques ou semi-automatiques.
Très Grande Infrastructure de Recherche
C’est un ensemble organisé de termes contrôlés et normalisés représentant les concepts d’un domaine de connaissance. Les termes sont reliés entre eux par des relations de synonymie (terme équivalent), de hiérarchie (terme générique et terme spécifique) et d’association (terme associé) ; chaque terme appartient à une catégorie ou domaine.
Source : Wikipedia. Thésaurus documentaire
Opération, ou ensemble d’opérations, portant sur des données personnelles, quel que soit le procédé utilisé (collecte, enregistrement, organisation, conservation, adaptation, modification, extraction, consultation, utilisation, communication par transmission diffusion ou toute autre forme de mise à disposition, rapprochement). Un traitement de données doit avoir un objectif, une finalité, c’est-à-dire que vous ne pouvez pas collecter ou traiter des données personnelles simplement au cas où cela vous serait utile un jour. A chaque traitement de données doit être assigné un but, qui doit bien évidemment être légal et légitime au regard de votre activité professionnelle.
Source : Cirad. 2021. Avez-vous le droit ou l’obligation de diffuser vos données ? Parcourez l’arbre de décision du Cirad. Montpellier (FRA) : CIRAD, 7 p. https://doi.org/10.18167/coopist/0075
U
Union Européenne
V
Evaluation des travaux de chercheurs par d’autres chercheurs (les pairs), pouvant notamment porter sur la publication d’un article dans une revue scientifique. Dans ce cas, les pairs validant l’article sont constitués en comité de lecture.
Lexique raisonné et normalisé facilitant la recherche documentaire et l’analyse comparative de données (liste de mots-clés, glossaire, thésaurus, taxonomie, ontologie).
Source : MESR, Ministère de l’Enseignement Supérieur et de la Recherche. Science ouverte. Données de la recherche. Février 2024. https://www.ouvrirlascience.fr/science-ouverte-donnees-de-la-recherche/
W
World Data System
La mission du WDS est de promouvoir la gestion à long terme et l’accès universel et équitable à des données scientifiques de qualité, ainsi qu’à des services de données, des produits et des informations dans toutes les disciplines des sciences naturelles et des sciences humaines et sociales.
Source : International Science Council. World Data System (WDS). https://council.science/what-we-do/affiliated-bodies/world-data-system-wds/
Initiative du World Wide Web Consortium (W3C) visant à favoriser la publication de données structurées sur le web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d’informations.
Source : MESR, Ministère de l’Enseignement Supérieur et de la Recherche. Science ouverte. Données de la recherche. Février 2024. https://www.ouvrirlascience.fr/science-ouverte-donnees-de-la-recherche/