Accès aux données ouvertes de l'Union européenne
EUROPAPortail des données ouvertes de l'UEGlossaire
Menu
Vue d’ensemble Outils Centre de ressources Projets Sandbox

GLOSSAIRE

 

ADMS

Le schéma de métadonnées de description de ressources (ADMS — Asset Description Metadata Schema) est un vocabulaire de description des ressources d'interopérabilité qui permet aux développeurs informatiques d’explorer et de rechercher ce type de ressources. L’ADMS permet aux administrations publiques, aux entreprises, aux organismes de normalisation et aux établissements d’enseignement supérieur:

  • de décrire des ressources sémantiques selon une méthode commune, afin qu’elles puissent être facilement interrogées, croisées et trouvées par les développeurs à partir d'un point d’accès unique;
  • de rechercher, d’identifier, d’extraire et de comparer des ressources sémantiques en vue de leur réutilisation à partir d'un point d’accès unique, ce qui permet d’éviter un travail de développement coûteux et redondant;
  • de conserver leurs propres systèmes de documentation et de stockage des ressources sémantiques;
  • d’améliorer l’indexation et la visibilité de leurs propres ressources;
  • de relier des ressources sémantiques entre plusieurs pays ou secteurs.

Source: https://joinup.ec.europa.eu/asset/adms/description

ANALYSE SYNTAXIQUE 

Décomposition d'un bloc de données en parties plus petites selon un ensemble de règles, de sorte qu’il puisse être interprété, géré ou transmis plus facilement par un ordinateur.

Source: http://www.businessdictionary.com/definition/parsing.html

API 

«Application programming interface» (interface de programmation d’application).

Système de communication entre programmes informatiques, comparable à la façon dont un programmeur envoie des instructions entre plusieurs programmes.

Source: http://schoolofdata.org/handbook/appendix/glossary

APPLICATION COMPOSITE (MASHUP) 

Combinaison de plusieurs jeux de données provenant de plusieurs sources afin de créer un nouveau service, une nouvelle visualisation ou de nouvelles informations.

 

BASE DE DONNEES

Une base de données est un recueil d'œuvres, de données ou d'autres éléments indépendants, disposés de manière systématique ou méthodique et individuellement accessibles par des moyens électroniques ou d'une autre manière.

 

CKAN

Un système de gestion de données qui rend les données accessibles en fournissant des outils pour intégrer la publication, le partage, la recherche et l’utilisation des données. CKAN est destiné aux éditeurs de données (administrations nationales et régionales, entreprises et organisations) qui souhaitent rendre leurs données ouvertes et accessibles.

Source: http://ckan.org/

CORDIS

Le principal portail et registre public utilisé par la Commission européenne pour diffuser des informations sur tous les projets de recherche financés par l’UE et sur leurs résultats.

Source: http://cordis.europa.eu/home_en.html

CSV

«Comma separated values» (valeurs séparées par des virgules). Format de fichier couramment utilisé pour l’échange de données entre différentes applications d’une même catégorie. Le format de fichier CSV est compatible avec les tableurs KSpread, OpenOffice Calc et Microsoft Excel. De nombreuses autres applications utilisent le format CSV pour l'importation et l’exportation de données.

Source: http://edoceo.com/utilitas/csv-file-format

DCAT 

Vocabulaire de catalogue de données.

Vocabulaire RDF permettant l'interopérabilité des catalogues de données.

Voir aussi: W3C - http://www.w3.org/TR/vocab-dcat

DCAT-AP 

Profil d’application DCAT. Vocabulaire commun, fondé sur le DCAT, pour décrire des jeux de données hébergés sur des portails de données en Europe.

Voir aussi: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DCMI

«Dublin core metadata initiative» (initiative du Dublin Core relative aux métadonnées). Organisation ouverte qui soutient l’innovation et les bonnes pratiques en matière de conception de métadonnées, dans l’ensemble de l’écosystème des métadonnées.

Source: http://dublincore.org/

DONNÉES BRUTES 

Données dans leur état original, qui n’ont pas été traitées, agrégées ou manipulées de toute autre façon. Synonyme de «données primaires».

DONNÉES LIÉES 

Les données liées (également appelées «web des données») désignent une méthode de publication de données structurées qui permet leur interconnexion. Cette méthode s’appuie sur des technologies web standard telles que le protocole HTTP et les URI, mais plutôt que de les utiliser pour afficher des pages internet destinées au lecteur, elle exploite ces technologies pour partager des informations dans un format qui peut être interprété automatiquement par l’ordinateur.

Source: https://en.wikipedia.org/wiki/linked_data

DONNÉES OUVERTES DES ADMINISTRATIONS 

Données recueillies, produites ou commandées par les administrations publiques et mises gratuitement à disposition à toutes fins de réutilisation.

DONNÉES STRUCTURÉES 

Des données stockées dans des champs fixes d'un enregistrement ou d'un fichier. Les bases de données relationnelles et les feuilles de calcul constituent des exemples de données structurées. Bien que les données stockées sous la forme de fichiers XML n’aient pas un emplacement fixe comme dans les bases de données classiques, elles sont néanmoins structurées, car elles sont balisées et peuvent être identifiées de façon précise.

Source: PC Magazine encyclopaedia — http://www.pcmag.com/encyclopedia/term/52162/structured-data

DUMP DE BASE DE DONNÉES 

Transfert d'un grand volume de données d'un système ou d'un emplacement vers un autre.

Source: http://www.oxforddictionaries.com

ELI

«European legislation identifier» (identifiant européen de la législation). Permet d'identifier de façon unique et de consulter des actes juridiques nationaux et européens et de faciliter la consultation, l’échange et la réutilisation de la législation par les pouvoirs publics, les utilisateurs professionnels, les universitaires et les citoyens. L’ELI ouvre la voie au web sémantique des journaux officiels.

Source: https://en.wikipedia.org/wiki/European_Legislation_Identifier

EXPLORATION DE DONNÉES 

Méthode consistant à examiner de grandes bases de données préexistantes afin de produire de nouvelles informations.

Source: http://www.oxforddictionaries.com

«Par exemple, une chaîne de supermarchés du Midwest a recouru aux capacités d’exploration de données d'un logiciel Oracle pour analyser les habitudes d’achat locales. Elle a découvert que les hommes qui achètent des couches-culottes le jeudi et le samedi tendent également à acheter de la bière. Une analyse plus poussée a révélé que ces clients font généralement leurs courses pour la semaine le samedi, alors qu'ils n’achètent que peu d’articles le jeudi. L’entreprise en a conclu que les clients achetaient de la bière pour en disposer le weekend suivant. Elle pourrait exploiter cette nouvelle information de différentes manières pour augmenter ses revenus. Par exemple, elle pourrait rapprocher le rayon des bières de celui des couches-culottes. Elle pourrait également veiller à ce que la bière et les couches-culottes soient vendues au prix plein le jeudi.»

Source: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

FOAF

«Friend of a friend» (ami d'un ami) est un vocabulaire descriptif lisible par l’ordinateur, qui porte sur les personnes, leurs activités et leurs relations avec d’autres personnes et des objets. FOAF permet à des groupes de personnes de décrire des réseaux sociaux sans devoir recourir à une base de données centralisée.

Source: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

IMMC

L’ensemble minimal d’éléments de métadonnées — les métadonnées de base IMMC — qui doivent être utilisés dans les échanges de données.

Source: http://publications.europa.eu/mdr/core-metadata/

INTEROPÉRABILITÉ 

La capacité des systèmes à échanger des informations et à utiliser les informations échangées.

ISA 

«Interoperable Solutions for European Public Administrations» (solutions d'interopérabilité pour les administrations publiques européennes).

Programme de la Commission européenne visant à faciliter les opérations transfrontières et/ou transsectorielles entre les administrations publiques d’Europe.

Le programme ISA² couvre la période 2016-2020 et succède au premier programme ISA (2010-2015).

ISP 

Informations du secteur public. La vaste gamme d'informations que les organismes du secteur public recueillent, produisent, reproduisent et diffusent dans de nombreux domaines d’activité, dans le cadre de leurs missions institutionnelles.

Ces données peuvent être mises à disposition dans le cadre de divers types de licences, qui ne sont pas toujours ouvertes.

JEU DE DONNÉES 

Une collection d’ensembles de données composée d’éléments distincts, mais qui peut être manipulée d'un seul bloc et consultée ou téléchargée dans un ou plusieurs formats.

JSON

«JavaScript object notation» (notation d'objets JavaScript). Un format ouvert qui utilise du texte lisible par l’homme pour transmettre des objets de données composés de paires attribut/valeur. Il s’agit du format de données le plus fréquemment utilisé pour la communication asynchrone navigateur/serveur (AJAJ).

Source: https://en.wikipedia.org/wiki/JSON

LISIBLE PAR MACHINE 

Les données lisibles par machine sont des données dont le format peut être interprété par un programme informatique. Il existe deux types de données lisibles par machine:

  • des données lisibles par l'homme qui sont formatées de façon à être également compréhensibles pour l’ordinateur (par exemple: microformats ou RDFa);
  • des formats de données destinés principalement aux ordinateurs (par exemple: RDF, XML ou JSON).

MÉTADONNÉES 

Les métadonnées sont des informations structurées qui permettent de décrire, d’expliquer ou de localiser des ressources d'information, ce qui permet de les trouver, de les utiliser ou de les gérer plus facilement. On peut définir les métadonnées comme des données relatives à des données.

Source: NISO — http://www.niso.org/publications/press/UnderstandingMetadata.pdf

MOISSONNAGE (DE DONNÉES)  

Extraction de données dans des formats lisibles par machine à partir de sources qui ne sont pas strictement des sources de données (par example pages internet ou documents PDF).

Sources: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

NORMES OUVERTES 

Dans l’acception la plus large, des normes techniques libres de restrictions en matière de licences. Peut également désigner des normes élaborées sans association à un fournisseur spécifique.

Source: http://schoolofdata.org/handbook/appendix/glossary

ONTOLOGIE 

Modèle formel qui permet de représenter les connaissances dans un domaine spécifique. Une ontologie décrit les types d’objets qui existent (classes), les relations entre ces objets (propriétés) et les moyens logiques de combiner ces classes et ces propriétés (axiomes).

Source: W3C — http://www.w3.org/TR/ld-glossary/#ontology

PDF

«Portable document format» Format de fichier utilisé pour présenter et échanger des documents indépendamment du logiciel, du matériel ou du système d’exploitation utilisés. Cette norme ouverte est gérée par l’Organisation internationale de normalisation.

Source: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

POINT DE TERMINAISON SPARQL 

Service qui accepte les requêtes SPARQL et leur renvoie des réponses sous la forme d’ensembles de résultats SPARQL. Il est recommandé aux fournisseurs de jeux de données d'indiquer l’URL de leur point de terminaison SPARQL afin de donner accès à leurs données au moyen de programmes informatiques ou d'une interface internet.

Source: W3C — http://www.w3.org/TR/ld-glossary/#sparql-endpoint

PRINCIPES DES DONNÉES LIÉES

Les principes des données liées prévoient une API commune pour les données sur l'internet, qui est plus pratique qu'un grand nombre d’API conçues séparément et différemment et publiées par les divers fournisseurs de données. Tim Berners-Lee, inventeur de l'internet et initiateur du projet relatif aux données liées, a proposé les principes suivants pour les données liées:

  • utiliser des URI pour nommer les objets;
  • utiliser des URI HTTP afin que les objets puissent être référencés et consultés («déréférencés») par les utilisateurs et les programmes;
  • lorsque quelqu'un consulte une URI, fournir des informations utiles au moyen de normes internet ouvertes telles que RDF ou SPARQL;
  • lors de la publication sur l'internet, inclure des liens vers d’autres objets liés, en mentionnant leurs URI.

Source: W3C — http://www.w3.org/TR/ld-glossary/#linked-data-principles

RDF 

«Resource description framework» (cadre de description de ressources).

Famille de normes internationales pour l’échange de données sur l'internet. Les normes RDF se fondent sur le principe d'identifier des objets au moyen d'identifiants internet ou d’URI HTTP, et de décrire les ressources au moyen de propriétés et de valeurs simples.

Source: W3C — http://www.w3.org/TR/ld-glossary/#rdf

RDFa

«Resource description framework in attributes» (cadre de description de ressources en attributs). Recommandation du W3C qui ajoute une série d’extensions dans la catégorie des attributs pour les formats HTML et XHTML et divers types de documents fondés sur le XML. Ces extensions permettent d'intégrer des métadonnées riches aux documents internet.

Source: https://en.wikipedia.org/wiki/RDFa

REGISTRE DES MÉTADONNÉES (MDR) 

Le registre des métadonnées est un outil d'interopérabilité et de normalisation important. Il contient et certifie des données de définition (éléments de métadonnées, listes d’autorités désignées, schémas, etc.) utilisées par les institutions européennes.

Source: http://publications.europa.eu/mdr/index.html

RESSOURCE 

Représentation physique d’un jeu de données. Une ressource peut être un fichier d'un type donné, un lien vers un fichier ailleurs sur l'internet, ou un lien vers une API. Par exemple, si les données sont fournies dans plusieurs formats ou classées selon différents domaines ou différentes périodes, chaque fichier est une «ressource» différente qui doit être décrite individuellement.

ROBOT D'INDEXATION 

Un robot d'indexation est un programme qui visite les sites internet et analyse leurs pages et d’autres informations afin de créer des entrées pour l’index d'un moteur de recherche. La plupart des moteurs de recherche sur l'internet utilisent ce type de programmes, également appelés «spider» ou «bot».

Source: http://searchsoa.techtarget.com/definition/crawler

Lorsqu'on parle d’extraction de données depuis l'internet, on confond souvent les termes «indexation» et «moissonnage». Ces termes recouvrent cependant des notions différentes: l’indexation a trait au traitement de vastes jeux de données au moyen de robots d'indexation (ou bots) conçus à cet effet, qui explorent jusqu’aux pages les plus reculées des sites internet. Le moissonnage de données désigne l’extraction d'informations à partir de toutes sortes de sources (et pas nécessairement des sites internet).

Source: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

SDMX

«Statistical data and metadata exchange» (échange de données et de métadonnées statistiques). Initiative internationale visant à harmoniser et à moderniser les mécanismes et procédures d’échange de données et métadonnées statistiques entre les organisations internationales et leurs pays membres.

Source: https://en.wikipedia.org/wiki/SDMX

SEO

«Search engine optimisation» (optimisation pour les moteurs de recherche). Techniques visant à influer de façon positive sur la visibilité d'un site ou d'une page internet dans les résultats de recherche non commerciaux d'un moteur de recherche.

Source: https://en.wikipedia.org/wiki/Search_engine_optimization

SOLR

Plateforme libre pour moteurs de recherche professionnels. Ses principales fonctions comprennent la recherche en texte intégral, la mise en évidence des correspondances, la recherche à facettes, l’indexation en temps réel, le regroupement dynamique, l'intégration des bases de données et le traitement des documents en texte riche (par example les formats Word ou PDF).

Source: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL 

Le protocole SPARQL et le langage de requête RDF (SPARQL) déterminent un langage de requête consacré aux données RDF, analogue au langage de requête structurée (SQL) pour les bases de données relationnelles.

Source: W3C — http://www.w3.org/TR/ld-glossary/#sparql

TÉLÉCHARGEMENT EN MASSE 

Un téléchargement contenant des fichiers de plusieurs collections, qui peuvent être récupérés en une seule fois.

TRIPLET / TRIPLESTORE 

Un triplestore est une base de données conçue spécifiquement pour le stockage et la récupération de triplets au moyen de requêtes sémantiques. Un triplet est une entité de données composée d'un sujet, d'un prédicat et d'un objet. Par exemple «Bob a 35 ans» ou «Bob connaît Fred».

Tout comme dans une base de données relationnelle, les informations sont stockées dans un triplestore et extraites au moyen d'un langage de requête. Par contre, les triplestores sont optimisés pour le stockage et la récupération de triplets, ce qui les distingue des bases de données relationnelles. En plus des requêtes, les triplets peuvent généralement être importés ou exportés au format RDF ou dans d’autres formats.

Source: Wikipedia.org — http://en.wikipedia.org/wiki/Triplestore

URI 

«Uniform resource identifier» (identifiant uniforme de ressource).

Chaîne de caractères permettant d'identifier pratiquement n'importe quelle chose, que ce soit un bâtiment ou un concept plus abstrait, tel qu'une couleur. Cet identifiant peut renvoyer à une page internet, mais pas nécessairement.

Source: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL 

«Uniform resource locator» (localisateur uniforme de ressource).

Identifiant global souvent appelé «adresse internet». Un URL renvoie à une page internet. Tous les URL HTTP sont des URI, mais tous les URI ne sont pas des URL.

Source: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

«Uniform resource name» (nom de ressource uniforme). Ancien nom d'un identifiant uniforme de ressource (URI).

Source: https://en.wikipedia.org/wiki/Uniform_Resource_Name

VOCABULAIRE 

Ensemble de termes destinés à un usage particulier. Les vocabulaires peuvent être simples, comme par exemple le schéma RDF, le vocabulaire FOAF ou l’ensemble d’éléments de métadonnées du Dublin Core, très utilisés, ou complexes, contenant des milliers de termes, tels que les vocabulaires employés dans les soins de santé pour décrire les symptômes, les maladies et les traitements.  Les vocabulaires jouent un rôle très important dans les données liées, en particulier pour faciliter l’intégration des données. L’acception de ce terme recouvre en partie celle du terme «ontologie».

Source: W3C — http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 1.0 

La première génération du world wide web, caractérisée par des sites internet statiques distincts, plutôt que par des blogs et des réseaux sociaux mis à jour en permanence.

Source: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0 

Description familière de la partie du world wide web qui met en œuvre les réseaux sociaux, les blogs, les commentaires et critiques d’utilisateurs, ainsi que les activités centrées sur les relations humaines.

Source: W3C — http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0  

Description familière de la partie du world wide web qui met en œuvre les données lisibles par machine et la capacité d’effectuer des recherches et des analyses à grande échelle à partir de ces données. Cette expression est synonyme des expressions «web sémantique» et «web des données».

Source: W3C — http://www.w3.org/TR/ld-glossary/#web-3.0

WEB SÉMANTIQUE 

Évolution ou partie du world wide web consistant en des données lisibles par machine au format RDF qui peuvent être recherchées selon des méthodes normalisées (au moyen de SPARQL, par ex.).

Source: W3C - http://www.w3.org/TR/ld-glossary/#semantic-web

XML

«Extensible markup language» (langage de balisage extensible). Langage de balisage qui détermine un ensemble de règles permettant d’encoder les documents dans un format lisible aussi bien par l’homme que par l’ordinateur.

Source: https://en.wikipedia.org/wiki/XML