Tillgång till öppna data från EU-institutionerna
EUROPAEU:s portal för öppna dataOrdlista
Menu
Översikt Verktyg Utbildning och dokumentation Projekt Sandbox

ORDLISTA

ADMS

Förkortning för ”Asset Description Metadata Schema” – ett språk som beskriver interoperabilitetsresurser och som hjälper it-utvecklare att kartlägga dem. Med hjälp av ADMS kan myndigheter, företag, standardiseringsorgan och forskare

  • beskriva semantiska resurser på ett enhetligt sätt, så att it-utvecklare smidigt kan söka efter dem i olika system från ett och samma ställe
  • söka, identifiera, hämta och jämföra semantiska resurser för vidareutnyttjande från ett och samma ställe utan dubbelarbete och extrakostnader
  • behålla sina egna dokumentations- och arkivsystem för semantiska resurser
  • förbättra resursernas indexering och synlighet
  • länka sina semantiska resurser till varandra över sektors- och nationsgränser.

Källa: https://joinup.ec.europa.eu/asset/adms/description

API 

API är ett applikationsprogrammeringsgränssnitt som program använder för att kommunicera med varandra med hjälp av olika instruktioner.

Källa: http://schoolofdata.org/handbook/appendix/glossary

Ckan

Ett system som används för att hantera data genom enhetliga rutiner för publicering, delning, sökning och vidareutnyttjande. Ckan är till för dataägare (nationella och regionala myndigheter, företag och organisationer) som vill tillgängliggöra sina uppgifter.

Källa: http://ckan.org/

CORDIS

EU-kommissionens främsta offentliga register och portal för spridning av information om alla EU-finansierade forskningsprojekt och deras resultat.

Källa: http://cordis.europa.eu/home_en.html

CSV

Filformat för kommaavgränsade data. Används ofta för utbyte av data mellan likartade applikationer. CSV-formatet används av kalkylbladsprogrammen KSpread, OpenOffice Calc och Microsoft Excel. Även många andra applikationer använder CSV för att importera eller exportera data.

Källa: http://edoceo.com/utilitas/csv-file-format

DATABAS

En samling information som är systematiskt eller metodiskt organiserad på ett sådant sätt att man kan söka och hämta enskilda bitar information på elektronisk eller annan väg.

 

Dataserie  

En samling av besläktade datamängder som består av skilda element men som kan behandlas som en enhet och öppnas eller laddas ner i ett eller flera format.

Dataskrapning  

Förfarande för att utvinna data i maskinläsbart format från orena källor, t.ex. webbsidor eller pdf-dokument. Kallas också webbskrapning eller pdf-skrapning, beroende på källan.

Källor: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

Datautvinning 

Granskning av stora datamängder för att generera ny information.

Källa: http://www.oxforddictionaries.com

Exempel: Affärskedjan Midwest använde Oracle för att analysera lokala konsumtionsmönster och upptäckte att män som köpte blöjor på torsdagar och lördagar också brukade köpa öl. Ytterligare analyser visade att dessa konsumtenter vanligtvis veckohandlade på lördagar, medan de köpte få varor på torsdagar. Midwest tolkade det som att konsumenterna ville ha öl till helgen. De använde den nya informationen för att öka omsättningen, t.ex. genom att placera ölen vid blöjorna och ha fullt pris på öl och blöjor på torsdagar.

Källa: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

 

DCAT 

En RDF-terminologi som ökar interoperabiliteten mellan datakataloger.

Se även: W3C – http://www.w3.org/TR/vocab-dcat

DCAT-AP 

En DCAT-applikationsprofil är ett enhetligt DCAT-språk som används för att beskriva dataserier i olika europeiska dataportaler.

Se även: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DCMI

Förkortning för ”Dublin Core Metadata Initiative” – ett klassificeringssystem för information på nätet som beskriver och sorterar webbsidor med hjälp av metadata.

Källa: http://dublincore.org/

Dump 

Kopiering av en stor mängd data från ett system eller ställe till ett annat.

Källa: http://www.oxforddictionaries.com

ELI

Förkortning för ”European Legislation Identifier” – ett system som gör lagstiftning tillgänglig på nätet i ett standardiserat format, så att den kan användas, delas och vidareutnyttjas över gränserna. ELI banar väg för ett semantiskt nät av officiella tidningar och författningssamlingar.

Källa: https://en.wikipedia.org/wiki/European_Legislation_Identifier

Foaf

Förkortning för ”Friend of a Friend” – ett språk för maskinläsbara beskrivningar av människor och deras relationer till andra människor och objekt. Kan användas av grupper för att beskriva sociala nätverk utan att behöva använda en central databas.

Källa: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

IMMC

Minsta antal metadataelement som måste användas vid ett utbyte av data.

Källa: http://publications.europa.eu/mdr/core-metadata/

Interoperabilitet 

Systemens förmåga att utbyta information och att använda den information som de får av varandra.

ISA 

Lösningar för att uppnå interoperabilitet mellan offentliga förvaltningar i EU.

ISA-programmet finansieras av EU-kommissionen och ska underlätta transaktioner över sektors- och nationsgränser mellan EU:s offentliga förvaltningar.

ISA² är uppföljaren till ISA, som pågick mellan 2010 och 2015. ISA² löper från 2016 till 2020.

Json

Förkortning för ”Javascript Object Notation” – ett textbaserat och öppet standardformat som används för att utbyta data i form av attributvärdepar. Json är det vanligaste dataformatet för asynkron kommunikation mellan webbläsare och server (Ajax).

Källa: https://en.wikipedia.org/wiki/JSON

Länkade data 

En metod för att publicera och koppla ihop strukturerade data. Länkade data bygger på webbstandarder som HTTP och URI, men i stället för att använda dem för att presentera informationen för människor är syftet att göra den läsbar för maskiner.

Källa: http://www.wikipedia.org

Länkade dataprinciper

Principer för ett gemensamt API för webbdata som syftar till att harmonisera dataleverantörernas många olika API-gränssnitt. Tim Berners-Lee, världswebbens skapare och initiativtagare till projektet för länkade data, har föreslagit följande principer:

  • Använd URI för att namnge objekt.
  • Använd HTTP-URI så att människor och program kan hänvisa till objekt och slå upp information (dereferera).
  • Tillhandahåll maskinläsbar information om URI-resursen med hjälp av öppna webbstandarder som RDF och Sparql.
  • Länka till andra relaterade objekt med deras URI-identifierare när du publicerar något på webben.

Källa: W3C – http://www.w3.org/TR/ld-glossary/#linked-data-principles

Mashup 

Webbsida som kombinerar information och tjänster från olika källor och som är fristående från dessa källor.

Maskinläsbara data 

Maskinläsbara data är uppgifter som kan läsas av ett datorprogram. Det finns två typer:

  • Textbaserade uppgifter som har kodats så att de kan tolkas av datorer, t.ex. mikroformat och RDFa.
  • Dataformat för datorer, t.ex. RDF, XML och Json.

Massnedladdning 

En nedladdning där filer från olika samlingar hämtas på en och samma gång.

Metadata 

Metadata är strukturerad information som beskriver, förklarar och lokaliserar informationsresurser för att underlätta sökning, vidareutnyttjande och hantering av uppgifterna. Kallas också data om data.

Källa: Niso – http://www.niso.org/publications/press/UnderstandingMetadata.pdf

Metadataregistret (MDR) 

Ett viktigt interoperabilitets- och standardiseringsverktyg. Registret innehåller definitioner av data (metadata, myndighetslistor, scheman osv.) som används av EU:s institutioner.

http://publications.europa.eu/mdr/index.html

Ontologi 

Formaliserad modell för att beskriva föremål, processer och begrepp inom ett kunskapsområde. Ontologin beskriver typer av saker (klasser), relationerna mellan dem (egenskaper) och logiska sätt att koppla ihop klasser och egenskaper (axiomer).

Källa: W3C – http://www.w3.org/TR/ld-glossary/#ontology

Parsa 

Att parsa (från engelskans parse) är att dela upp en datamängd i mindre bitar enligt bestämda regler, så att de lättare kan tolkas, hanteras och överföras av en dator.

Källa: http://www.businessdictionary.com/definition/parsing.html

PDF

Förkortning för ”Portable Document Format”. Ett filformat som används för att man ska kunna visa och utbyta dokument oavsett program, maskinvara eller operativsystem. Det är en öppen standard som sköts av Internationella standardiseringsorganisationen.

Källa: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

PSI 

Information från den offentliga sektorns databaser. Omfattar all den information som myndigheter tar fram, återger och sprider inom sin verksamhet.

Informationen kan göras tillgänglig på olika sätt (licenser) och är inte alltid öppen.

RDF 

Förkortning för ”Resource Description Framework”.

En samling internationella standarder för datautbyte på nätet. RDF använder HTTP-URI för att identifiera resurser på nätet och beskriva dem med hjälp av enkla egenskaper och värden.

Källa: W3C – http://www.w3.org/TR/ld-glossary/#rdf

RDFa

Förkortning för ”Resource Description Framework in Attributes” är en W3C-rekommendation om högkvalitativa metadata i webbdokument och går ut på att man gör tillägg i form av attribut till HTML-, XHTML- och olika XML-baserade dokumenttyper.

Källa: https://en.wikipedia.org/wiki/RDFa

Resurs 

Den fysiska manifestationen av en dataserie. Det kan röra sig om en fil eller en länk till en annan fil på nätet eller till ett API. Exempel: Om informationen tillhandahålls i flera olika format eller är uppdelad på olika områden eller tidsperioder, är varje fil en egen resurs och bör ha en egen beskrivning.

Rådata 

Obearbetade data. Kallas också primärdata.

SDMX

Förkortning för ”Statistical Data and Metadata Exchange” – ett internationellt initiativ som syftar till att standardisera och modernisera utbytet av statistik och metadata mellan internationella organisationer och deras medlemsländer.

Källa: https://en.wikipedia.org/wiki/SDMX

Semantiska webben 

En vidareutveckling av världswebben (www) bestående av maskinläsbara data i RDF-format som möjliggör standardiserade sökningar (t.ex. med Sparql).

Källa: W3C – http://www.w3.org/TR/ld-glossary/#semantic-web

SEO

Förkortning för ”Search Engine Optimisation” – sökmotoroptimering som används för att få en webbplats eller webbsida att synas så högt upp som möjligt bland träffarna i sökmotorer.

Källa: https://en.wikipedia.org/wiki/Search_engine_optimization

SOLR

En sökplattform med öppen källkod som vänder sig till företag. De viktigaste funktionerna är fulltextsökning, träffmarkering, fasettsökning, realtidsindexering, dynamiska kluster, databasintegrering och hantering av rtf-dokument (t.ex. Word eller pdf).

Källa: https://en.wikipedia.org/wiki/Apache_Solr

Sparql 

Förkortning för ”Sparql Protocol and RDF Query Language” – frågespråk för RDF-data, analogt med SQL, det standardiserade frågespråket för relationsdatabaser.

Källa: W3C – http://www.w3.org/TR/ld-glossary/#sparql

Sparql-slutpunkt 

En tjänst som tar emot Sparql-sökningar och ger svar i form av Sparql-träffar. Dataleverantörer brukar ange webbadressen till sin Sparql-slutpunkt, så att man får tillgång till deras data via ett program eller ett gränssnitt på nätet.

Källa: W3C – http://www.w3.org/TR/ld-glossary/#sparql-endpoint

Spindel 

En spindel är ett program som samlar information från webbsidor åt sökmotorer. Alla stora sökmotorer på nätet har ett sådant program, som också kallas krypare, crawler, eller bot.

Källa: http://searchsoa.techtarget.com/definition/crawler

Datainsamling från nätet kallas också dataskrapning eller skörd (harvesting). Skillnaden är att kryparen hanterar stora dataserier från webbplatsernas djupaste hörn medan dataskrapning avser insamling av information från alla typer av källor (inte bara nätet).

Källa: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

Strukturerade data 

Data i fasta fält i en post eller fil, t.ex. i relationsdatabaser eller kalkylblad. Även om informationen i XML-filer inte är platsbunden på samma sätt som traditionella databasposter, så är den ändå strukturerad, eftersom den är taggad och kan identifieras.

Källa: PC Magazine encyclopaedia – http://www.pcmag.com/encyclopedia/term/52162/structured-data

Terminologi 

Ett antal termer som samlats i ett särskilt syfte. Exempel på enkel terminologi är RDF, Foaf och DCMI. Komplexa terminologier förekommer exempelvis inom vården och används för att beskriva symtom, sjukdomar och behandlingar. Terminologier är viktiga för att man ska kunna länka och samla data. Terminologi och ontologi är överlappande termer.

Källa: W3C – http://www.w3.org/TR/ld-glossary/#vocabulary

Triplett, triplettlager 

Ett triplettlager är en särskild databas där man kan lagra och hämta tripletter med hjälp av semantiska sökningar. En triplett är ett dataobjekt bestående av subjekt, predikat och objekt, t.ex. ”Bob är 35” eller ”Bob känner Fred”.

Liksom i en relationsdatabas sparas informationen och kan hämtas med hjälp av ett sökspråk. Det speciella med ett triplettlager är att det är optimerat för tripletter. Normalt kan man inte bara söka utan också importera och exportera tripletter genom att använda RDF och andra format.

Källa: Wikipedia.org – http://en.wikipedia.org/wiki/Triplestore

URI 

Förkortning för ”Uniform Resource Identifier – en sträng av tecken som används för att identifiera en resurs. En URI kan men behöver inte vara en webbadress.

Källa: W3C – http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL 

Förkortning för ”Uniform Resource Locator” – en global identifierare som på svenska kallas webbadress och som fungerar på webben. Alla HTTP-webbadresser är URI-identifierare. URI är dock ett mer generellt begrepp än URL.

Källa: W3C – http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Förkortning för ”Uniform Resource Name” – tidigare namn för URI.

Källa: https://en.wikipedia.org/wiki/Uniform_Resource_Name

Webb 1.0 

Den första generationen internet, som kännetecknas av separata, statistiska webbplatser snarare än kontinuerligt uppdaterade loggar och sociala nätverk.

Källa: http://en.wiktionary.org/wiki/Web_1.0

Webb 2.0 

Informellt namn på den del av internet som innehåller sociala nätverk, bloggar, användarkommentarer och betygsättningar och andra människoinriktade aktiviteter.

Källa: W3C – http://www.w3.org/TR/ld-glossary/#web-2.0

Webb 3.0  

Informellt namn på den del av internet som innehåller maskinläsbara data och som möjliggör distribuerade sökningar och analyser av dem. Betraktas som synonym för semantisk webb och datawebb.

Källa: W3C – http://www.w3.org/TR/ld-glossary/#web-3.0

XML

Förkortning för ”Extensible Markup Language” – ett märkspråk med regler för kodning av dokument i ett format som kan läsas av både människor och maskiner.

Källa: https://en.wikipedia.org/wiki/XML

Öppna data från offentliga sektorn 

Information som samlas in, tas fram och betalas av myndigheter. Den är gratis, tillgänglig för alla och kan vidareutnyttjas på valfritt sätt.

Öppen standard 

En teknisk standard som inte begränsas av licenskrav. Kan också avse en standard som får användas gratis.

Källa: http://schoolofdata.org/handbook/appendix/glossary