Dé plek voor open data van de Europese Unie
EUROPAOpendataportaal van de EUVerklarende woordenlijst
Menu
Overzicht Kennisbank Projecten Sandbox

VERKLARENDE WOORDENLIJST

ADMS

Asset Description Metadata Schema.

Vocabularium voor de beschrijving van interoperabiliteitsdossiers waarmee ICT-ontwikkelaars interoperabiliteitsnormen kunnen zoeken en opvragen. Dankzij ADMS kunnen overheden, bedrijven, normalisatie-instellingen en universiteiten:

  • een gemeenschappelijke beschrijving opstellen van semantische assets, zodat deze door ICT-ontwikkelaars via een centraal toegangspunt kunnen worden gevonden en doorzocht;
  • semantische assets via een centraal toegangspunt identificeren, opvragen en vergelijken, zodat deze kunnen worden hergebruikt om dubbel werk en kostbare herontwikkeling te voorkomen;
  • hun eigen systeem voor documentatie en opslag van semantische assets handhaven;
  • de indexering en zichtbaarheid van hun eigen assets verbeteren;
  • semantische assets aan elkaar linken in internationale en sectoroverstijgende situaties.

Bron: https://joinup.ec.europa.eu/asset/adms/description

API

Application Programming Interface (interface voor applicatieontwikkeling).

De API definieert de wijze waarop computers met elkaar kunnen communiceren. Hij beschrijft de instructies die een programma naar een ander programma moet sturen.

Bron: http://schoolofdata.org/handbook/appendix/glossary

BULKDOWNLOADEN

Het downloaden van bestanden uit meerdere datacollecties in één operatie.

CKAN

Een databeheersysteem waarmee gegevens toegankelijk worden gemaakt met behulp van tools die het publiceren, uitwisselen, zoeken en gebruiken van data vergemakkelijken. CKAN is bestemd voor dataverstrekkers (nationale en regionale overheden, bedrijven en organisaties) van open data.

Bron: http://ckan.org/

CORDIS

Website van de Europese Commissie die als verzamelplaats en verspreidingsportaal fungeert voor informatie over alle door de EU gefinancierde onderzoeksprojecten en de resultaten daarvan.

Bron: http://cordis.europa.eu/home_en.html

CRAWLER

Ook wel „spider” genoemd. Een programma („bot”) dat websites automatisch doorzoekt en op basis daarvan indexinformatie voor zoekmachines verzamelt. Alle grote zoekmachines op internet beschikken over zo'n crawler.

Bron: http://searchsoa.techtarget.com/definition/crawler

De term „crawling” wordt gebruikt voor het verzamelen van gegevens op het web. Vaak wordt hiervoor ook de term „data scraping” of „harvesting” gebruikt. Toch is dit niet helemaal hetzelfde: „crawling” heeft betrekking op grote datasets waarvoor iemand zijn eigen crawlers (bots) kan ontwikkelen, die doordringen tot in de diepste onderdelen van webpagina's, terwijl „data scraping” wordt gebruikt voor het achterhalen van informatie uit allerlei bronnen, niet alleen die op het web.

Bron: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

CSV

Comma Separated Values.

Bestandsformaat dat vaak wordt gebruikt voor de uitwisseling van gegevens tussen vergelijkbare applicaties. CSV wordt gebruikt door de spreadsheetprogramma's KSpread, OpenOffice Calc en Microsoft Excel. Maar ook andere applicaties ondersteunen CSV bij het importeren of exporteren van data.

Bron: http://edoceo.com/utilitas/csv-file-format

DATABASE

Een database of databank is een verzameling van onafhankelijke werken, gegevens of andere elementen die op systematische wijze zijn georganiseerd en afzonderlijk toegankelijk zijn langs elektronische of andere weg.

DATASET

Een verzameling van gerelateerde gegevensverzamelingen die weliswaar uit afzonderlijke componenten bestaan, maar als één geheel kunnen worden verwerkt en benaderd in één of meer formaten.

DCAT

Data catalogue vocabulary.

Een RDF-vocabularium voor de interoperabiliteit van datacatalogi.

Zie ook: W3C — http://www.w3.org/TR/vocab-dcat

DCAT-AP

DCAT-applicatieprofiel.

Een gemeenschappelijk vocabularium voor de beschrijving van datasets die worden gehost op Europese dataportals die met DCAT werken.

Zie ook: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DUMP, GEGEVENS-

Een grote hoeveelheid gegevens die van het ene systeem op het andere wordt overgedragen.

Bron: http://www.oxforddictionaries.com

DCMI

Dublic Core Metadata Initiative.

Open organisatie die innovatie en goede prakijken op metadatagebied ondersteunt.

Bron: http://dublincore.org/

ELI

European Legislation Identifier (Europese identificatiecode voor wetgeving).

Code voor de unieke identificatie van nationale en Europese wetgeving online en om de toegankelijkheid, de uitwisseling en het hergebruik van wetgeving te vergemakkelijken voor professionele gebruikers, academici en burgers. ELI baant de weg voor een semantisch web van staatsbladen en publicatiebladen.

Bron: https://en.wikipedia.org/wiki/European_Legislation_Identifier

FOAF

Friend of a Friend.

Machineleesbaar beschrijvend vocabularium van personen, hun activiteiten en hun relaties met andere personen en objecten. Dankzij FOAF kunnen groepen mensen hun sociale netwerken beschrijven zonder dit in een centrale database vast te leggen.

Bron: https://nl.wikipedia.org/wiki/FOAF

GESTRUCTUREERDE DATA

Data die in een bestand of record met vaste velden zijn opgenomen. Relationele databases en spreadsheets zijn voorbeelden van gestructureerde data. Hoewel de gegevens in XML-bestanden niet in een vaste structuur hoeven voor te komen, zoals bij databases, zijn ze niettemin als gestructureerd te beschouwen omdat de gegevens van tags worden voorzien die exact te identificeren zijn.

Bron: PC Magazine encyclopaedia — http://www.pcmag.com/encyclopedia/term/52162/structured-data

IMMC

De minimumverzameling van metadata-elementen, de zogenaamde IMMC-kerngegevens, die bij de gegevensuitwisseling moeten worden gebruikt.

Bron: http://publications.europa.eu/mdr/core-metadata/

INTEROPERABILITEIT

Het vermogen van systemen om informatie uit te wisselen en de uitgewisselde informatie te benutten.

ISA

Interoperability Solutions for European Public Administrations (Interoperabiliteitsoplossingen voor Europese overheidsdiensten).

Door de Europese Commissie gefinancierd programma dat grensoverschrijdende en/of sectoroverstijgende transacties tussen overheidsdiensten in Europa moet vergemakkelijken.

ISA² is het vervolg op het oorspronkelijke ISA-programma, dat van 2010-2015 liep. Het loopt van 2016 tot 2020.

JSON

JavaScript Object Notation.

Open, gestandaardiseerd, voor mensen leesbaar formaat waarmee dataobjecten kunnen worden overgebracht als paren van attributen met hun bijbehorende waarde. Het is het meest gangbare dataformaat dat voor asynchrone communicatie tussen browsers en servers wordt gebruik (AJAJ).

Bron: https://nl.wikipedia.org/wiki/JSON

LINKED DATA

Methode voor het publiceren van gestructureerde data, zodat die gekoppeld kunnen worden. De methode is gebaseerd op standaardwebtechnologieën zoals HTTP en URI's, zij het niet om voor mensen leesbare webpagina's te publiceren, maar om met uitbreidingen daarop machineleesbare informatie uit te wisselen.

Bron: https://nl.wikipedia.org/wiki/Linked_data

LINKED DATA, UITGANGSPUNTEN VAN -

De uitgangspunten van linked data bieden een gemeenschappelijke API voor webdata die handiger is dan de apart ontwikkelde API's van individuele dataverstrekkers. Tim Berners-Lee, uitvinder van het wereldwijde web en initiatiefnemer van het linked data-project, heeft de volgende uitgangspunten voor linked data geformuleerd:

  • Gebruik URI's om naar objecten te verwijzen.
  • Gebruik HTTP-URI 's, zodat de objecten waarnaar wordt verwezen, kunnen worden gevonden en worden opgehaald door mensen of programma's.
  • Geef nuttige informatie als mensen of programma's met behulp van open webstandaards zoals RDF of SPARQL objecten zoeken.
  • Neem bij de publicatie van informatie op het web ook links op naar verwante objecten in de vorm van URI's.

Bron: W3C — http://www.w3.org/TR/ld-glossary/#linked-data-principles

MACHINELEESBARE DATA

Data in een formaat dat door een computer kan worden geïnterpreteerd. Er zijn twee soorten machineleesbare data:

·      voor mensen leesbare data waaraan markeringen worden toegevoegd, zodat ook computers ermee kunnen omgaan, bijv. microformaten en RDFa;

·      dataformaten die primair voor computers zijn bestemd, zoals RDF, XML en JSON.

MASHUP

Een combinatie van meerdere datasets van verschillende bronnen waarmee een nieuwe dienst, visualisering of informatiebron wordt gecreëerd.

METADATA

Gestructureerde informatie-elementen waarmee een informatiebron wordt beschreven, toegelicht, gelokaliseerd of op andere wijze wordt geannoteerd, zodat deze gemakkelijker op te vragen, te gebruiken en te beheren is. Metadata zijn dus gegevens over gegevens.

Bron: NISO — http://www.niso.org/publications/press/UnderstandingMetadata.pdf

METADATAREGISTER (MDR)

Belangrijk hulpmiddel voor interoperabiliteit en standaardisatie. Het bevat de metadatadefinities (metadata-elementen, lijsten van toegelaten elementen, schema's enz.) die door de verschillende Europese instellingen worden gebruikt.

http://publications.europa.eu/mdr/index.html

MINING, DATA-

Het onderzoeken van bestaande databases om daar nieuwe informatie uit af te leiden.

Bron: http://www.oxforddictionaries.com

Een supermarkt in het Midwesten, in de VS, analyseerde het lokale koopgedrag met behulp van de dataminingtools van hun Oracle-software. Het bleek dat klanten die luiers kochten op donderdag of zaterdag, ook vaak wat bier insloegen. Bij nadere analyse werd ontdekt dat deze klanten hun wekelijkse boodschappen vooral op zaterdag deden. Op donderdag kochten ze meestal maar een paar dingen. De supermarkt concludeerde dat het bier werd gekocht met het oog op het naderende weekend. Deze informatie werd op verschillende manieren gebruikt om de inkomsten te vergroten. Zo zetten ze het bier dichter bij het rek met luiers. Ook letten ze erop dat bier en luiers op donderdag alleen voor de volle prijs over de toonbank gingen.

Bron: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

ONTOLOGIE

Formeel model voor het representeren van kennis op een bepaald gebied. Zij beschrijft de soorten objecten die bestaan (klassen), hun onderlinge relaties (eigenschappen) en de logische manieren waarop deze klassen en eigenschappen samen kunnen worden gebruikt (axioma's).

Bron: W3C — http://www.w3.org/TR/ld-glossary/#ontology

OPEN STANDAARDS

De technische standaards die vrij kunnen worden gebruikt zonder licentiebeperkingen. Soms worden ook standaards bedoeld die onafhankelijk van bepaalde leveranciers worden ontwikkeld.

Bron: http://schoolofdata.org/handbook/appendix/glossary

OPEN OVERHEIDSDATA

Gegevens die worden verzameld, geproduceerd of betaald door overheidsinstanties en die kosteloos voor alle vormen van hergebruik ter beschikking worden gesteld.

PARSING

Het opsplitsen van een blok data in kleinere eenheden op basis van een aantal regels, zodat deze makkelijker kunnen worden geïnterpreteerd, beheerd of overgedragen.

Bron: http://www.businessdictionary.com/definition/parsing.html

PDF

Het Portable Document Format is een bestandsformaat dat wordt gebruikt voor het presenteren en uitwisselen van gegevens, onafhankelijk van de software, de hardware of het besturingssysteem. Het gaat om een open standaard die wordt beheerd door de Internationale Organisatie voor Normalisatie.

Bron: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

PSI

Publiekesectorinformatie.

Gevarieerde informatie op allerlei gebieden die door instanties uit de publieke sector wordt geproduceerd, gereproduceerd en verspreid bij de uitoefening van hun publiekstaken.

Deze informatie kan beschikbaar worden gesteld op basis van verschillende soorten licenties die niet altijd open zijn.

RDF

Resource Description Framework.

Een familie van internationale standaards voor data-uitwisseling via internet. RDF is gebaseerd op het identificeren van objecten aan de hand van webidentificaties (HTTP-URI's) en het beschrijven van bronnen met eenvoudige attributen en de waarde daarvan.

Bron: W3C — http://www.w3.org/TR/ld-glossary/#rdf

RDFa

Resource Description Framework in Attributes.

Een W3C-aanbeveling met een aantal uitbreidingen op HTML, XHTML en diverse op XML gebaseerde documenttypes voor het inbedden van rijke metadata in webdocumenten.

Bron: https://en.wikipedia.org/wiki/RDFa

RESOURCE (BRON)

De fysieke representatie van een dataset. Een bron is een bestand van een willekeurig type, een link naar een bestand elders op het web, of een link naar een API. Als data bijvoorbeeld in meerdere formaten worden geleverd of voor verschillende gebieden of periodes worden opgesplitst, is elk bestand een „bron”, die afzonderlijk moet worden beschreven.

RUWE DATA

Data in de oorspronkelijke vorm, dus nog op geen enkele wijze verwerkt of gecombineerd. We spreken ook wel van „primaire data”.

SCRAPING

Het proces waarbij data in een machineleesbaar formaat worden geëxtraheerd uit databronnen die niet alleen nuttige data bevatten, bijvoorbeeld webpagina's of PDF-documenten. Het begrip wordt vaak voorafgegaan door de vermelding van de bron (web scraping, PDF scraping enz.).

Bronnen: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

SDMX

Statistical Data and Metadata Exchange.

Internationaal initiatief dat gericht is op standaardisatie en modernisering van de uitwisselingsmechanismen en -processen voor statistische gegevens en metadata tussen internationale organisaties en hun lidstaten.

Bron: https://en.wikipedia.org/wiki/SDMX

SEMANTISCH WEB

Evolutie of deel van het wereldwijde web bestaande uit machineleesbare data in RDF en de mogelijkheid om die via gestandaardiseerde zoekopdrachten (bijv. in SPARQL) te benaderen.

Bron: W3C — http://www.w3.org/TR/ld-glossary/#semantic-web

SEO

Search Engine Optimisation (zoekmachineoptimalisatie).

Techniek om de zichtbaarheid van een website of een webpagina in de niet-gesponsorde resultaten van een zoekmachine ter verhogen.

Bron: https://nl.wikipedia.org/wiki/zoekmachineoptimalisatie

SOLR

Opensourcezoekplatform voor bedrijven. De belangrijkste kenmerken zijn zoeken door de volledige tekst, markeren van hits, facetzoeken, realtime-indexeren, dynamisch clusteren, database-integratie en verwerking van rijke tekst (bijv. Word en PDF).

Bron: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL

„SPARQL Protocol and RDF Query Language”.

Protocol en zoektaal voor RDF-data die overeenkomsten vertoont met de gestructureerde zoektaal voor relationele databases (SQL).

Bron: W3C — http://www.w3.org/TR/ld-glossary/#sparql

SPARQL-ENDPOINT

Een service die SPARQL-zoekopdrachten accepteert en de resultaten daarvan ook in SPARQL-formaat retourneert. Voor dataverstrekkers geldt het als een goede praktijk om de URL van het SPARQL-endpoint openbaar te maken, zodat hun data ook via applicaties of via een webinterface kunnen worden benaderd.

Bron: W3C — http://www.w3.org/TR/ld-glossary/#sparql-endpoint

TRIPLE, TRIPLESTORE

Een triplestore is een speciale database voor het opslaan en opvragen van triples via semantische zoekopdrachten. Een triple is een combinatie van drie data-elementen in de vorm van een subject-predicaat-object-structuur, bijvoorbeeld „Rob is 35” of „Rob kent Fred”.

Net als bij relationele databases wordt de informatie in de triplestore opgeslagen en hieruit weer opgevraagd met behulp van (zoek)commando's of -opdrachten. Maar anders dan een relationele database is de triplestore geoptimaliseerd voor het opvragen van triples. Bovendien kan de informatie meestal worden geïmporteerd of geëxporteerd in RDF of in andere formaten.

Bron: Wikipedia.org — http://en.wikipedia.org/wiki/Triplestore

URI

Uniform Resource Identifier.

String aan de hand waarvan bijna elk willekeurig object op unieke wijze kan worden geïdentificeerd, ook bijvoorbeeld fysieke objecten zoals gebouwen of abstracte eigenschappen zoals kleuren. De URI is al dan niet identificeerbaar op het web.

Bron: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL

Uniform Resource Locator.

Een wereldwijd geldig gemeenschappelijk identificatiesymbool dat doorgaans „webadres” wordt genoemd. Een URL is identificeerbaar op het web. Alle HTTP-URL zijn URI's, maar niet alle URI's zijn URL's.

Bron: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Uniform Resource Name is een oude benaming voor een Uniform Resource Identifier (URI).

Bron: https://en.wikipedia.org/wiki/Uniform_Resource_Name

VOCABULARIUM

Een vocabularium, vocabulaire of lexicon is een verzameling van termen voor een bepaalde toepassing. Vocabularia kunnen in omvang variëren van eenvoudige vocabularia, zoals RDFS, FOAF en Dublin Core Metadata Element Set, tot complexe vocabularia met duizenden termen, zoals die welke in de gezondheidszorg worden gebruikt om symptomen, ziekten of behandelingen te beschrijven. Ze spelen een zeer belangrijke rol in linked data, vooral voor de integratie van gegevens. Deze term overlapt het begrip „ontologie”.

Bron: W3C — http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 1.0

De eerste generatie van het wereldwijde web, gekarakteriseerd door afzonderlijke statische websites in plaats van continu geüpdatete weblogs en sociale netwerken.

Bron: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0

Een informele benaming voor dat deel van het wereldwijde web dat als thuishaven dient voor sociale media, blogs, reviews en ratings, en andere gerelateerde activiteiten waarbij de mens centraal staat.

Bron: W3C — http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 3.0

Een informele benaming voor dat deel van het wereldwijde web waarin de machineleesbare data zijn opgenomen en het vermogen om daarop gedistribueerde zoekopdrachten en analyses te verrichten. Synoniemen zijn „semantisch web” en „the web of data”.

Bron: W3C — http://www.w3.org/TR/ld-glossary/#vocabulary

XML

Extensible Markup Language.

XML is een markeringstaal („markup language”) op basis van een reeks regels voor het coderen van documenten in een formaat dat leesbaar is voor zowel de mens als machines.

Bron: https://nl.wikipedia.org/wiki/Extensible_Markup_Language