Zugang zu offenen Daten der Europäischen Union
EUROPAOffenes Datenportal der EUGlossar
Menu

Glossar

 

ADMS

Das „Asset Description Metadata Schema“ (ADMS) ist ein Vokabular zur Beschreibung von Interoperabilitätsbeständen. IKT-Entwickler können diese so leichter finden und nutzen. ADMS erlaubt öffentlichen Verwaltungen, Unternehmen, Normungsorganisationen und Hochschulen

  • die einheitliche Beschreibung semantischer Bestände, um Kreuzabfragen und den reibungslosen Zugriff über einen einzigen Zugangspunkt zu ermöglichen;
  • Suche, Ermittlung, Abfrage und Vergleich semantischer Bestände über einen einzigen Zugangspunkt zum Zwecke der Wiederverwendung und Vermeidung von Doppel- und kostspieliger Entwicklungsarbeit;
  • die Nutzung eigener Systeme für die Dokumentation und Speicherung semantischer Bestände;
  • die Verbesserung der Indexierung und Sichtbarkeit eigener Bestände;
  • die Verknüpfung semantischer Bestände im grenz- und bereichsübergreifenden Kontext.

Quelle: https://joinup.ec.europa.eu/asset/adms/description

API 

Application programming interface (Anwendungsprogrammierschnittstelle).

Mittel zur Kommunikation zwischen Computerprogrammen, als würde ein Programmierer Anweisungen zwischen Programmen übermitteln.

Quelle: http://schoolofdata.org/handbook/appendix/glossary

BULK DOWNLOAD 

Herunterladen großer Datenmengen, zum Beispiel von Dateien aus mehreren Sammlungen, in einem Schritt.

CKAN

Datenmanagementsystem, das den Zugang zu Daten ermöglicht, indem es Tools zur Vereinfachung ihrer Veröffentlichung, Verbreitung, Ermittlung und Nutzung bereitstellt. CKAN richtet sich an Datenlieferanten (nationale und regionale Regierungen, Unternehmen und Organisationen), die ihre Datenbestände öffnen und deren Verfügbarkeit erhöhen möchten.

Quelle: http://ckan.org/

CORDIS

Öffentliche Datenbank und Portal der Europäischen Kommission zur Veröffentlichung von Informationen über alle EU-finanzierten Forschungsprojekte und ihrer Ergebnisse.

Quelle: http://cordis.europa.eu/home_en.html

(DATA) CRAWLING 

Ein Crawler ist ein Programm, das Websites und die darin enthaltenen Seiten und Informationen analysiert und Einträge für einen Suchmaschinenindex zusammenstellt. Alle größeren Suchmaschinen im Internet verwenden ein solches Programm, das auch als „Spider“ oder „Bot“ bezeichnet wird.

Quelle: http://searchsoa.techtarget.com/definition/crawler

Im Zusammenhang mit dem Abruf von Daten im Internet wird oft auch der Begriff „Data scraping“ (Daten „schürfen“) oder „Harvesting“ (Daten „ernten“) verwendet. Diese haben jedoch eine andere Bedeutung: „Crawling“ bezieht sich auf den Umgang mit großen Datensätzen und die Entwicklung eigener Crawler (oder Bots), die bis in die untersten Ebenen der Webseiten vordringen; „Scraping“ hingegen bezeichnet das Abrufen von Informationen aus irgendeiner Quelle und ist nicht notwendigerweise auf das Internet beschränkt.

Quelle: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

Datenbank

Eine Datenbank ist ein Sammelwerk, dessen Elemente (unabhängige Arbeiten, Daten oder Materialien) systematisch oder methodisch angeordnet und einzeln mithilfe elektronischer Mittel oder auf andere Weise zugänglich sind.

 

CSV

„Comma Separated Values“ ist ein Dateiformat, das in der Regel zum Austausch von Daten zwischen gleichartigen Anwendungen verwendet wird. Es wird von Anwendungen zur Tabellenkalkulation wie Spread, OpenOffice Calc und Microsoft Excel, aber auch von vielen anderen Anwendungen für den Im- und Export von Daten unterstützt.

Quelle: http://edoceo.com/utilitas/csv-file-format

DATASET 

Eine Sammlung zusammenhängender Datensätze, deren getrennte Elemente als Einheit behandelt und in einem oder mehreren Formaten abgerufen oder heruntergeladen werden können.

DCAT 

Datenkatalogvokabular.

RDF-Vokabular für die Interoperabilität von Datenkatalogen.

Siehe auch: W3C - http://www.w3.org/TR/vocab-dcat

DCAT-AP 

DCAT-Anwendungsprofil. Gemeinsames Vokabular zur Beschreibung der in europäischen Datenportalen unter Verwendung von DCAT gespeicherten Datensätze.

Siehe auch: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

(DATA) DUMP 

Transfer einer großen Datenmenge von einem Ort an einen anderen.

Quelle: http://www.oxforddictionaries.com

DATA-MINING 

Die Auswertung großer bestehender Datenbanken mit dem Ziel, neue Informationen zu erzeugen.

Quelle: http://www.oxforddictionaries.com

Zum Beispiel analysierte eine Supermarktkette in den USA mithilfe der Daten-Mining-Kapazitäten einer Oracle-Software das Kaufverhalten ihrer lokalen Kunden. Die Analyse ergab, dass Männer, die donnerstags und samstags Windeln kauften, meistens auch Bier einkauften. Eine eingehendere Analyse ergab, dass diese Kunden ihre wöchentlichen Einkäufe normalerweise samstags erledigten, donnerstags hingegen nur wenig einkauften. Der Händler schloss daraus, dass die Kunden das Bier kauften, um einen Vorrat für das kommende Wochenende anzulegen. Die Supermarktkette könnte diese Erkenntnisse auf unterschiedliche Weise nutzen, um ihre Einkünfte zu erhöhen. Zum Beispiel könnte sie das Bier in der Nähe der Windeln platzieren. Und sie könnte sicherstellen, dass sowohl Bier als auch Windeln donnerstags immer zum vollen Preis angeboten werden.

Quelle: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

DCMI

„Dublin Core Metadata Initiative“ – offene Organisation, die Innovationen bei der Entwicklung von Metadaten und die Verbreitung bewährter Methoden in der Metadaten-Ökologie unterstützt.

Quelle: http://dublincore.org/

ELI

Der „European Legislation Identifier“ erlaubt die eindeutige Kennzeichnung und den Online-Zugang zu nationalen und EU-Rechtsvorschriften und gewährleistet, dass Behörden, professionelle Nutzer, Hochschulen und Bürgerinnen und Bürger einfach auf Rechtvorschriften zugreifen, sie austauschen und weiterverwenden können. ELI schafft die Voraussetzungen für ein semantisches Web von Gesetzesanzeigern und Amtsblättern.

Quelle: https://en.wikipedia.org/wiki/European_Legislation_Identifier

FOAF

„Friend of a friend“ ist ein maschinenlesbares beschreibendes Vokabular von Personen, ihren Aktivitäten und Beziehungen zu anderen Menschen und Objekten. So können Personengruppen soziale Netze bilden, ohne dabei auf eine zentralisierte Datenbank angewiesen zu sein.

Quelle: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

INTEROPERABILITÄT 

Fähigkeit von Systemen zum Austausch und zur anschließenden Nutzung von Informationen.

ISA 

Interoperabilitätslösungen für europäische öffentliche Verwaltungen.

Dieses von der Europäischen Kommission finanzierte Programm soll grenz- und/oder sektorübergreifende Transaktionen zwischen öffentlichen Verwaltungen in Europa erleichtern.

ISA² ist das Folgeprogramm zu ISA, das von 2010–2015 lief. ISA² läuft von 2016 bis 2020.

IMMC

„IMMC Core Metadata“: Mindestsatz an Metadaten, die im Datenaustausch zu verwenden sind.

Quelle: http://publications.europa.eu/mdr/core-metadata/

JSON

„JavaScript Object Notation“ ist ein offenes Standardformat zur Übertragung von Datenobjekten aus Attribut-Wert-Paaren in einem vom Menschen lesbaren Format. Es ist das am häufigsten für die asynchrone Kommunikation zwischen Browser und Server (AJAJ) verwendete Datenformat.

Quelle: https://en.wikipedia.org/wiki/JSON

LINKED DATA 

„Linked Data“ ist eine Methode zur Veröffentlichung strukturierter Daten, die deren Verknüpfung ermöglicht. Sie basiert auf Standard-Webtechnologien wie HTTP und URI, verwendet diese allerdings nicht zur Bereitstellung von Webseiten für menschliche Leser, sondern erweitert sie, damit Informationen so ausgetauscht werden können, dass Computer sie automatisch lesen können.

Quelle: http://www.wikipedia.org

LINKED DATA PRINCIPLES

Dank gemeinsamer Grundsätze für die Verknüpfung von Daten kann eine einheitliche Anwendungsprogrammierschnittstelle für Daten im Internet bereitgestellt werden. Dies ist praktischer als viele einzelne und unterschiedlich konzipierte Schnittstellen einzelner Datenlieferanten. Tim Berners-Lee, Erfinder des World Wide Web und Initiator des „Linked Data“-Projekts schlug folgende Grundsätze vor, auf denen „Linked Data“ beruht:

  • Verwendung von URI-Adressen,
  • Verwendung von URIs im HTTP-Format, um Referenzen und Dereferenzierung durch Nutzer und Nutzeragenten zu ermöglichen,
  • Verwendung offener Webstandards wie RDF oder SPARQL zur Angabe nützlicher Informationen in URIs,
  • bei Veröffentlichungen im Internet: Verknüpfung mit einschlägigen nützlichen Informationen mithilfe der URI dieser Datenquellen.

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#linked-data-principles

MASCHINENLESBAR 

Maschinenlesbare Daten sind Daten in einem Format, das von einem Computerprogramm interpretiert werden kann. Es gibt zwei Arten maschinenlesbarer Daten:

  • Vom Menschen lesbare Daten, die für Computer markiert werden, z. B. Mikroformate oder RDFa;
  • Ursprünglich für Computer entwickelte Datenformate wie RDF, XML und JSON.

MASHUP 

Kombination mehrerer Datensätze aus verschiedenen Quellen zur Schaffung neuer Dienste, Visualisierungen oder Informationen.

METADATEN 

Metadaten sind strukturierte Informationen, die durch Beschreibungen, Erläuterungen, Lokalisierungen oder auf andere Art den Abruf, die Nutzung oder die Verwaltung einer Informationsquelle erleichtern. Metadaten sind also im Prinzip Daten über Daten.

Quelle: NISO - http://www.niso.org/publications/press/UnderstandingMetadata.pdf

METADATENREGISTER (MDR) 

Das Metadatenregister ist ein wichtiges Instrument für Interoperabilität und Normung. Es verzeichnet und speichert Definitionsdaten (Metadaten-Elemente, Listen benannter Stellen, Schemata usw.), die von den EU-Institutionen verwendet werden.

http://publications.europa.eu/mdr/index.html

ONTOLOGIE 

Eine formal geordnete Darstellung von Wissen in einem bestimmten Bereich. Eine Ontologie beschreibt verschiedene Objekttypen (Klassen), die Beziehungen zwischen ihnen (Eigenschaften) und die logische Verbindung zwischen diesen Klassen und Eigenschaften (Axiome).

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#ontology

OFFENE STANDARDS 

Im landläufigen Sinne technische Standards, die frei von Zulassungsbeschränkungen sind. Eine weitere Bedeutung ist „händlerneutral“.

Quelle: http://schoolofdata.org/handbook/appendix/glossary

OPEN GOVERNMENT DATA 

Von öffentlichen Stellen erhobene, erzeugte oder finanzierte Daten, die zur kostenlosen Weiterverwendung ohne Zweckbindung freigegeben werden.

(DATA) PARSING 

Zerlegung von Datenblöcken in kleinere Einheiten nach vorgegeben Regeln, so dass sie von einem Computer leichter ausgewertet, verwaltet oder übermittelt werden können.

Quelle: http://www.businessdictionary.com/definition/parsing.html

PDF

Im Dateiformat „Portable Document Format“ (PDF) können Dokumente unabhängig von Software, Hardware oder Betriebssystem bereitgestellt und ausgetauscht werden. Ein offener Standard der Internationalen Organisation für Normung (ISO).

Quelle: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

PSI 

Informationen des öffentlichen Sektors („Public Sector Information“). Es handelt sich um ein großes Angebot an Informationen, die öffentliche Stellen bei der Ausübung ihrer institutionellen Aufgaben in zahlreichen Tätigkeitsbereichen erheben, erzeugen, vermehren und verbreiten.

Die Daten werden unter einer Vielzahl von Lizenzen zur Verfügung gestellt, die nicht immer offen sind.

RESSOURCE 

Physische Darstellung eines Datensatzes. Eine Ressource kann eine beliebige Datei, ein Link zu einer Datei im Internet oder ein Link zu einer API sein. Wenn die Daten in mehreren Formaten bereitgestellt werden oder in verschiedene Bereiche oder Zeiträume unterteilt sind, ist jede Datei eine eigene „Ressource“, die einzeln beschrieben werden sollte.

ROHDATEN 

Dieser Ausdruck bezieht sich auf Daten im ursprünglichen Zustand, die noch nicht verarbeitet, aggregiert oder anderweitig bearbeitet wurden. Eine weitere Bezeichnung ist „Primärdaten“.

RDF 

„Resource Description Framework“.

Eine Gruppe internationaler Normen für den Datenaustausch über das Internet. Grundlage ist die Kennzeichnung von Objekten durch Identifikatoren oder URIs im HTTP-Format und die Beschreibung von Ressourcen in Form einfacher Eigenschaften und Werte.

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#rdf

RDFa

„Resource Description Framework in Attributes“ ist eine W3C-Empfehlung, die das Hinzufügen von Erweiterungen auf Attributebene in HTML, XHTML und einer Reihe von XML-basierten Dokumenttypen ermöglicht, um komplexe Metadaten in Web-Dokumente einbetten zu können.

Quelle: https://en.wikipedia.org/wiki/RDFa

SEMANTIC WEB 

Weiterentwicklung oder Teil des World Wide Web, bestehend aus maschinenlesbaren Daten in RDF, sowie Fähigkeit zur Standardabfrage dieser Informationen (z. B. über SPARQL).

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#semantic-web

(DATA) SCRAPING  

Verfahren zur Extraktion von Daten in maschinenlesbaren Formaten aus nicht reinen Datenquellen (z. B. Webseiten oder PDF-Dokumenten). Oft wird die Quelle vorangestellt: Web-Scraping, PDF-Scraping.

Quellen: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

SDMX

„Statistical Data and Metadata Exchange“: Eine internationale Initiative, die darauf abzielt, die Mechanismen und Verfahren für den Austausch von statistischen Daten und Metadaten zwischen internationalen Organisationen und ihren Mitgliedstaaten zu standardisieren und modernisieren.

Quelle: https://en.wikipedia.org/wiki/SDMX

SEO

Suchmaschinenoptimierung: Verfahren zur positiven Beeinflussung der Visibilität einer Webpräsenz oder Webseite in den nicht kommerziellen Suchtreffern einer Suchmaschine.

Quelle: https://en.wikipedia.org/wiki/Search_engine_optimization

SOLR

Quelloffene, in Unternehmen einsetzbare Suchmaschine. Zu den wichtigsten Merkmalen zählen Volltextsuche, Trefferhervorhebung, Facettensuche, Echtzeit-Indexierung, dynamische Cluster, Datenbankintegration und Bearbeitung komplexer Dokumente (z. B. Word, PDF).

Quelle: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL 

Das SPARQL-Protokoll und die RDF-Abfragesprache (SPARQL) definieren eine Abfragesprache für RDF-Daten, analog zur strukturierten Abfragesprache (SQL) für relationale Datenbanken.

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#sparql

SPARQL-ENDPUNKT 

Dieser Dienst akzeptiert SPARQL-Anfragen und gibt Ergebnissätze in SSPARQL aus. Datensatzlieferanten geben üblicherweise die URL ihres SPARQL-Endpunkts an, um den programmatischen Zugriff auf ihre Daten oder den Zugang über eine Web-Schnittstelle zu erlauben.

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#sparql-endpoint

STRUKTURIERTE DATEN 

Daten, die in einem Datensatz oder einer Datei in festen Feldern angeordnet sind. Beispiele für strukturierte Daten sind relationale Datenbanken und Tabellen. Obwohl Daten in XML-Dateien nicht fest angeordnet sind wie traditionelle Datenbank-Datensätze, sind sie dennoch strukturiert, da sie gekennzeichnet sind und identifiziert werden können.

Quelle: PC Magazine encyclopaedia - http://www.pcmag.com/encyclopedia/term/52162/structured-data

TRIPEL, TRIPELSPEICHER 

Ein Tripelspeicher ist eine maßgeschneiderte Datenbank für Speicherung und Abruf von Tripeln über semantische Abfragen. Ein Tripel ist eine Datenentität bestehend aus Subjekt-Prädikat-Objekt wie „Bob ist 35“ oder „Bob kennt Fred“.

Wie bei einer relationalen Datenbank wird die Information in einem Tripelspeicher gespeichert und mithilfe einer Abfragesprache abgerufen. Jedoch ist der Tripelspeicher entgegen der relationalen Datenbank für die Speicherung und Anfrage von Tripeln optimiert. Tripel können nicht nur abgerufen, sondern in der Regel auch in RDF und anderen Formaten importiert bzw. exportiert werden.

Quelle: Wikipedia.org - http://en.wikipedia.org/wiki/Triplestore

URI 

„Uniform Resource Identifier“.

Eine Zeichenfolge, mit der sich alles Mögliche virtuell identifizieren lässt, sei es ein Gebäude oder abstraktere Konzepte wie Farben. Sie können im Web auflösbar sein oder nicht.

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL 

„Uniform Resource Locator“.

Eine weltweite Kennung, die im allgemeinen als „Internetadresse“ bezeichnet wird. Eine URL ist im Web auflösbar. Alle URLs im HTTP-Format sind URIs, jedoch nicht alle URIs sind URLs.

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

„Uniform Resource Name“ ist die alte Bezeichnung für „Uniform Resource Identifier“ (URI).

Quelle: https://en.wikipedia.org/wiki/Uniform_Resource_Name

VOKABULAR 

Eine Sammlung von Begriffen für einen bestimmten Zweck. Vokabulare können einfache (RDF schema, FOAF und Dublin Core Metadata Element Set) oder komplexe Glossare mit Tausenden von Begriffen sein (z. B. in der Gesundheitsversorgung zur Beschreibung von Symptomen, Krankheiten und Behandlungen). Vokabulare spielen eine wichtige Rolle bei der Verknüpfung von Daten, insbesondere zur Unterstützung der Datenintegration. Der Begriff wird gleichbedeutend mit „Ontologie“ verwendet.

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 1.0 

Die erste Generation des World Wide Web, bestehend aus einzelnen statischen Websites statt kontinuierlich aktualisierter Blogs und sozialer Netzwerke.

Quelle: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0 

Eine umgangssprachliche Bezeichnung des Teils des World Wide Web, in dem soziale Netze, Blogs, Nutzerkommentare und -bewertungen sowie damit verbundene nutzerorientierte Tätigkeiten implementiert werden.

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0  

Eine umgangssprachliche Bezeichnung des Teils des World Wide Web, in dem maschinenlesbare Daten implementiert werden und das die Möglichkeit zur Durchführung verteilter Abfragen und Analysen dieser Daten bietet. Synonym werden die Bezeichnungen „semantisches Web“ und „Internet der Daten“ verwendet.

Quelle: W3C - http://www.w3.org/TR/ld-glossary/#web-3.0

XML

„Extensible Markup Language“. Eine Markup-Sprache, die Regeln für die Kodierung von Dokumenten in einem Format festlegt, das sowohl vom Menschen als auch von Maschinen gelesen werden kann.

Quelle: https://en.wikipedia.org/wiki/XML