Piekļuve Eiropas Savienības brīvi pieejamajiem datiem
EUROPAES Atvērto datu portālsGlosārijs
Menu
Pārskats Zināšanu bāze Projekti Sandbox

Glosārijs

ADMS

Resursu apraksta metadatu shēma (ADMS — Asset Description Metadata Schema) ir sadarbspējas resursu apraksta vārdnīca, kas ļauj IKT izstrādātājiem un programmētājiem apgūt un meklēt šī veida resursus. ADMS ļauj valsts iestādēm, uzņēmumiem, standartizācijas struktūrām un augstskolām:

  • aprakstīt semantiskos resursus pēc kopīgas metodes, lai tos varētu ērti meklēt, sastatīt un atrast no vienota piekļuves punkta;
  • meklēt, identificēt, izgūt un salīdzināt semantiskos resursus, lai tos atkalizmantotu no vienota piekļuves punkta, tā izvairoties no dārga un dubulta izstrādes darba;
  • saglabāt pašiem savas semantisko resursu dokumentācijas un saglabāšanas sistēmas;
  • uzlabot pašiem savu resursu indeksāciju un redzamību;
  • sastatīt semantiskos resursus starp vairākām valstīm vai sektoriem.

Avots: https://joinup.ec.europa.eu/asset/adms/description

API

Akronīms no application programming interface (lietotņu programmēšanas saskarne).

Tā ir sistēma saziņai starp datorprogrammām, līdzīga tam, kā programmētājs nosūta norādījumus starp vairākām programmām.

Avots: http://schoolofdata.org/handbook/appendix/glossary

ATVĒRTIE VALDĪBAS DATI

Dati, kurus publiskās iestādes savākušas, ieguvušas vai apmaksājušas un darījušas par velti pieejamus visu veidu atkalizmantošanas mērķiem.

ATVĒRTIE STANDARTI

Plašākā nozīmē tehniskie standarti, kas brīvi no licencēšanas ierobežojumiem. Var nozīmēt arī standartus, kas izstrādāti, nepiesaistot konkrētu piegādātāju.

Avots: http://schoolofdata.org/handbook/appendix/glossary

CKAN

Datu pārvaldības sistēma, kas nodrošina piekļuvi datiem, sniedzot rīkus, kas racionalizē datu publicēšanu, kopīgošanu, meklēšanu un izmantošanu. CKAN ir domāts datu rediģētājiem (valsts un reģionu pārvaldes iestādēm, uzņēmumiem un organizācijām), kuri vēlas padarīt savus datus atvērtus un visiem pieejamus.

Avots: http://ckan.org/

CORDIS

Galvenais publiskais portāls un repozitorijs, ko Eiropas Komisija izmanto, lai izplatītu informāciju par visiem ES finansētajiem pētniecības projektiem un to rezultātiem.

Avots: http://cordis.europa.eu/home_en.html

CSV

Comma separated values” (ar komatiem atdalītas vērtības): faila formāts, ko plaši izmanto datu apmaiņā starp dažādām vienas kategorijas lietotnēm. CSV faila formāts ir savietojams ar KSpread, OpenOffice Calc un Microsoft Excel izklājlapu lietotnēm. Daudzas citas lietotnes izmanto CSV formātu datu importēšanai un eksportēšanai.

Avots: http://edoceo.com/utilitas/csv-file-format

DATASET

Krājums ar radnieciskām datu kopām, kas satur nošķirtus elementus, ar kuriem tomēr var manipulēt kā ar vienu bloku, kuriem var piekļūt un kurus var lejupielādēt vienā vai vairākos formātos.

 

DATUBĀZE

Datubāze ir savstarpēji neatkarīgu darbu, datu vai materiālu krājums, kas sakārtots sistēmiski vai metodiski. Tiem var piekļūt katram atsevišķi elektroniskā vai kādā citā veidā.

 

DATIZRACE

Lielu, jau esošu datubāzu izpētes metode ar mērķi izveidot jaunu informāciju.

Avots: http://www.oxforddictionaries.com

“Piemēram, lielveikalu ķēde izmantoja “Oracle” lietotnes datizraces iespējas, lai analizētu vietējos iepirkšanās paradumus. Tā atklāja, ka vīrieši, kuri pērk autiņbiksītes ceturtdien un sestdien, vairumā gadījumu pērk arī alu. Dziļāka analīze parādīja, ka šie klienti parasti iepērkas visai nedēļai sestdien, savukārt ceturtdien viņi nopērk tikai dažas preces. Uzņēmums secināja, ka šie klienti pirka alu nākamajai nedēļas nogalei. Tas varēja dažādi izmantot šo jauno informāciju, lai palielinātu ienākumus. Tas, piemēram, varēja alus nodaļu pārvietot tuvāk autiņbiksīšu nodaļai. Tas varēja arī parūpēties, lai alu un autiņbiksītes ceturtdienās pārdotu par pilnu cenu.”

Avots: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

DCAT

Datu kataloga vārdnīca.

RDF vārdnīca, kas atvieglo sadarbspēju starp datu katalogiem.

Skatīt arī: W3C — http://www.w3.org/TR/vocab-dcat

DCAT-AP

Lietotnes DCAT profils. Kopīga vārdnīca, kuras pamatā ir DCAT; tā ir domāta tādu datu kopu aprakstīšanai, kas izvietotas datu portālos Eiropā.

Skatīt arī: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DCMI

Dublin core metadata initiative” (Dublinas bāzes iniciatīva attiecībā uz metadatiem): atvērta organizācija, kas atbalsta inovāciju un labu praksi metadatu dizainā un izstrādē visā metadatu ekosistēmā.

Avots: http://dublincore.org/

ELI

European legislation identifier” (Eiropas tiesību aktu identifikators): ļauj unikālā veidā identificēt valstu un ES tiesību aktus un iestādēm, profesionālajiem lietotājiem, augstskolām un iedzīvotājiem atvieglo piekļuvi tiem, to apmaiņu un atkalizmantošanu. ELI paver ceļu oficiālo vēstnešu semantiskajam tīmeklim.

Avots: https://en.wikipedia.org/wiki/European_Legislation_Identifier

FOAF

Friend of a friend” (drauga draugs) ir aprakstoša mašīnlasāma vārdnīca, kas attiecas uz personām, to darbībām, attiecībām ar citiem cilvēkiem un mērķiem. FOAF ļauj personu grupām aprakstīt sociālos tīklus bez nepieciešamības izmantot centralizētu datubāzi.

Avots: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

IMMC

Metadatu elementu minimālais kopums — IMMC bāzes metadati —, kas ir jāizmanto datu apmaiņā.

Avots: http://publications.europa.eu/mdr/core-metadata/

ISA

Interoperable Solutions for European Public Administrations” (Eiropas valstu pārvaldes iestāžu sadarbspējas risinājumi).

Tā ir Eiropas Komisijas finansēta programma, kuras mērķis ir atvieglināt pārrobežu vai starpnozaru darbības starp Eiropas publiskajām iestādēm.

Programma ISA² aptver periodu no 2016. līdz 2020. gadam un turpina iepriekšējo programmu ISA (2010.–2015. g.).

IZMETE JEB DUBLĒŠANA

Liela apjoma datu pārsūtīšana no vienas sistēmas vai atrašanās vietas uz citu.

Avots: http://www.oxforddictionaries.com

JAUCĒJPROGRAMMA

No vairākiem avotiem iegūtu vairāku datu kopu kombinēšana, lai izveidotu jaunu pakalpojumu, jaunu vizualizāciju vai jaunu informāciju.

JĒLDATI

Dati to sākotnējā stāvoklī; dati, kas nav apstrādāti, apkopoti vai pakļauti cita veida darbībām. Tos sauc arī par pirmdatiem vai sākotnējiem datiem.

JSON

JavaScript object notation” (JavaScript objektu apzīmējumu sistēma): atvērts formāts, kurš izmanto tekstu, ko var lasīt cilvēks, lai pārsūtītu datu objektus, ko veido atribūta/vērtības pāri. Tas ir datu formāts, ko visbiežāk izmanto asinhronai komunikācijai (AJAJ) starp pārlūku un serveri.

Avots: https://en.wikipedia.org/wiki/JSON

LIELAPJOMA LEJUPIELĀDE

Lejupielāde, kas satur failus no daudziem krājumiem, kas var tikt izgūti vienā reizē.

MAŠĪNLASĀMS

Mašīnlasāmi dati ir dati, kuru formātu var interpretēt datorprogramma. Ir divu veidu mašīnlasāmi dati:

  • cilvēkam lasāmas formas dati, kas ir formatēti tā, lai tos varētu saprast arī dators (piem., mikroformāti vai RDFa);
  • galvenokārt datoriem domāti datu formāti, piem., RDF, XML un JSON.

METADATI

Metadati ir strukturēta informācija, kas ļauj aprakstīt, izskaidrot vai lokalizēt informācijas resursus vai atvieglo šāda resursa izgūšanu, izmantošanu vai pārvaldību. Metadatus var definēt kā datus par datiem.

Avots: NISO — http://www.niso.org/publications/press/UnderstandingMetadata.pdf

METADATU REĢISTRS (MDR)

Metadatu reģistrs ir svarīgs sadarbspējas un standartizācijas rīks. Tas satur un uztur ES iestāžu izmantotos definīciju datus (metadatu elementus, izraudzīto iestāžu sarakstus, shēmas u.c.).

http://publications.europa.eu/mdr/index.html

ONTOLOĢIJA

Formāls modelis, kas ļauj pasniegt zināšanas kādā konkrētā jomā. Ontoloģija apraksta eksistējošo objektu tipus (kategorijas), attiecības starp šiem objektiem (rekvizīti), šo kategoriju un rekvizītu kombinēšanas loģiskos līdzekļus (aksiomas).

Avots: W3C — http://www.w3.org/TR/ld-glossary/#ontology

PARSĒŠANA

Datu bloka sadalīšana mazākās daļās saskaņā ar noteikumu kopumu tā, lai datoram būtu vieglāk šo bloku interpretēt, pārvaldīt vai pārsūtīt.

Avots: http://www.businessdictionary.com/definition/parsing.html

PDF

Portatīvais dokumentu formāts ir failu formāts, ko izmanto dokumentu iesniegšanai un apmaiņai neatkarīgi no programmatūras, aparatūras vai operētājsistēmām. Šo atvērto standartu pārvalda Starptautiskā Standartizācijas organizācija (ISO).

Avots: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

PSI

Publiskā sektora informācija: visdažādākā informācija, ko publiskā sektora struktūras vāc, izveido, pavairo un izplata daudzās darbības jomās savu institucionālo pamatuzdevumu ietvaros.

Šos datus var darīt pieejamus, pamatojoties uz dažādu veidu licencēm, kuras ne vienmēr ir atvērtas.

RĀPOŠANA

Rāpuļprogramma apmeklē tīmekļa vietnes un analizē to lapas un citu informāciju, lai izveidotu ierakstus meklētājprogrammas indeksam. Vairums meklētājprogrammu tīmeklī izmanto šī veida programmas, sauktas arī par “zirnekļiem” vai “robotiem”.

Avots: http://searchsoa.techtarget.com/definition/crawler

Kad ir runa par datu izguvi no tīmekļa, rāpošanu bieži vien jauc ar terminu “rasmošana”. Tomēr šie termini aptver dažādus jēdzienus: rāpošana attiecas uz lielapjoma datu kopu apstrādi, izmantojot šim nolūkam pašu izstrādātas rāpuļprogrammas (jeb robotus), kas izpēta tīmekļa lapu dziļākās daļas; datu rasmošana ir informācijas izguve no visu veidu avotiem (kas var arī nebūt tīmekļa vietnes).

Avots: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

RASMOŠANA

Datu izguve mašīnlasāmos formātos no resursiem, kuri var arī nebūt datu avoti (piem., tīmekļa lapas vai PDF dokumenti). Šī termina priekšā nereti min avotu (tīmekļa rasmošana, PDF rasmošana).

Avoti: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

RDF

Resource description framework” (resursu aprakstīšanas ietvars).

Starptautisko standartu grupa attiecībā uz datu apmaiņu tīmeklī. RDF standarta pamatā ir princips, ka objekti ir jāidentificē, izmantojot tīmekļa vai URI HTTP identifikatorus, un resursi jāapraksta, izmantojot vienkāršus rekvizītus un vērtības.

Avots: W3C — http://www.w3.org/TR/ld-glossary/#rdf

RDFa

Resource description framework” (resursu aprakstīšanas, ietvars, izmantojot atribūtus): W3C ieteikums, kas HTML, XHTML un dažādu veidu dokumentiem, kuru pamatā ir XML, atribūtu kategorijā pievieno vairākus paplašinājumus. Šie paplašinājumi ļauj tīmekļa dokumentos iekļaut bagātus metadatus.

Avots: https://en.wikipedia.org/wiki/RDFa

RESURSS

Kāda datu kopuma fizisks atveidojums. Resurss var būt jebkāda veida fails, saite uz failu citur tīmeklī vai saite uz API saskarni (lietojumprogrammu saskarni). Piem., ja dati tiek sniegti vairākos formātos vai iedalīti pēc dažādām jomām vai dažādiem periodiem, katrs fails ir nošķirts “resurss”, kurš ir jāapraksta individuāli.

SADARBSPĒJA

Sistēmu spēja apmainīties ar informāciju un izmantot apmainīto informāciju.

SAISTĪTIE DATI

Saistītie dati (saukti arī par “datu tīmekli”) ir strukturētu datu publicēšanas metode, kas pieļauj to iekšēju savienošanu. Šī metode pamatojas uz standarta tīmekļa metodēm, tādām kā HTTP protokols un URI, tomēr tās izmanto ne tik daudz tam, lai parādītu lasītājam domātas tīmekļa lapas, bet gan lai kopīgotu informāciju formātā, kuru automātiski var interpretēt dators.

Avots: http://www.wikipedia.org

SAISTĪTO DATU PRINCIPI

Saistīto datu principi nodrošina kopēju API saskarni datiem tīmeklī, kas ir praktiskāk nekā liels skaits tādu API saskarņu, kuras ir izstrādātas izolēti un atšķirīgi un kuras ir publicējuši dažādi datu piegādātāji. Tīmekļa izgudrotājs un saistīto datu jēdziena autors Tims Bernerss-Lī (Tim Berners-Lee) saistītajiem datiem ierosinājis šādus principus:

  • izmantot URI, lai nosauktu objektus;
  • izmantot HTTP URI, lai lietotāji un programmas varētu atsaukties uz objektiem un tos aplūkot (tiem piekļūt);
  • kad kāds aplūko URI, sniegt noderīgu informāciju, izmantojot atvērtā tīmekļa standartus, tādus kā RDF vai Sparql;
  • publicējot tīmeklī, iekļaut saites uz citiem saistītiem objektiem, minot to URI.

Avots: W3C — http://www.w3.org/TR/ld-glossary/#linked-data-principles

SDMX

Statistical data and metadata exchange” (statistikas datu un metadatu apmaiņa): starptautiska iniciatīva, kura standartizē un modernizē mehānismus un procedūras, ko starptautiskās organizācijas un šo organizāciju dalībvalstis izmanto statistikas datu un metadatu apmaiņai.

Avots: https://en.wikipedia.org/wiki/SDMX

SEMANTISKAIS TĪMEKLIS

Globālā tīmekļa (World Wide Web — www) daļa, ko veido mašīnlasāmi dati RDF formātā, kuros var veikt meklēšanu, izmantojot standartizētas metodes (piem., izmantojot Sparql).

Avots: W3C — http://www.w3.org/TR/ld-glossary/#semantic-web

SEO

Search engine optimisation” (meklētājprogrammas optimizācija): metodes, kuru mērķis iruzlabot kādas tīmekļa vietnes vai lapas redzamību rezultātos, ko nekomerciālā meklēšanā sniedz kāda meklētājprogramma.

Avots: https://en.wikipedia.org/wiki/Search_engine_optimization

SOLR

Atklātā pirmkoda platforma profesionālām meklētājprogrammām. Starp tās galvenajām funkcijām ir meklēšana pilna tekstā, atbilstību izcelšana, kategoriālā meklēšana, indeksēšana reāllaikā, dinamiskā grupēšana, datubāzu integrēšana un plašu funkcionālo iespēju dokumentu (piem., Word, PDF) apstrāde.

Avots: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL

Protokols SPARQL un vaicājumvaloda RDF (Sparql) nosaka RDF datiem domātu vaicājumvalodu, kura ir analoga strukturētajai vaicājumvalodai (SQL), ko izmanto attiecībā uz relāciju datubāzēm.

Avots: W3C — http://www.w3.org/TR/ld-glossary/#sparql

SPARQL GALAPUNKTS

Pakalpojums, kas pieņem SPARQL vaicājumus un tiem nosūta atbildes SPARQL rezultātu kopumu veidā.   Datu kopu sniedzējiem ir ieteicams norādīt sava SPARQL galapunkta URL, lai piešķirtu piekļuvi saviem datiem, izmantojot datorprogrammas vai kādu tīmekļa saskarni.

Avots: W3C — http://www.w3.org/TR/ld-glossary/#sparql-endpoint

STRUKTURĒTI DATI

Dati, kurus glabā noteiktos kāda ieraksta vai faila laukos. Relāciju datubāzes un izklājlapas ir strukturētu datu piemēri. Kaut arī XML failos datiem nav noteiktas vietas kā klasiskās datubāzēs, tie tomēr ir strukturēti, jo ir marķēti un var tikt precīzi identificēti.

Avots: PC Magazine encyclopaedia http://www.pcmag.com/encyclopedia/term/52162/structured-data

TRIJNIEKS, TRIJNIEKU KRĀTUVE (TRIPLESTORE)

Trijnieku krātuve (triplestore) ir datubāze, izveidota trijnieku glabāšanai un izgūšanai, izmantojot semantiskus vaicājumus. Trijnieks ir datu vienums, kas satur subjektu, predikātu un objektu; piem., “Bobam ir 35 gadi” vai “Bobs pazīst Fredu”.

Tāpat kā relāciju datubāzē, informācija tiek glabāta trijnieku krātuvē (triplestore) un izgūta, izmantojot vaicājumvalodu. Taču trijnieku krātuves ir optimizētas trijnieku glabāšanai un izgūšanai; ar to tās atšķiras no relāciju datubāzēm. Papildus vaicājumiem trijniekus parasti var importēt vai eksportēt RDF formātā vai citos formātos.

Avots: https://en.wikipedia.org/wiki/Triplestore

URI

Uniform resource identifier” (vienotais resursu identifikators).

Rakstzīmju virkne, kas ļauj identificēt praktiski jebkuru lietu, vai tā būtu ēka vai abstraktāks jēdziens, piem., krāsa. Šis identifikators var norādīt uz tīmekļa lapu, bet tas nav obligāti.

Avots: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL

Uniform resource locator” (vienotais resursu vietrādis).

Globāls identifikators, kas bieži tiek saukts par “tīmekļa adresi”. URL norāda uz tīmekļa lapu. Visi HTTP URL ir URI, bet nebūt ne visi URI ir URL.

Avots: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Uniform resource name” (vienots resursa nosaukums): vienotā resursu identifikatora (URI) agrākais nosaukums.

Avots: https://en.wikipedia.org/wiki/Uniform_Resource_Name

VĀRDNĪCA

Īpašam izmantojumam domāts jēdzienu kopums. Vārdnīcas var būt gan vienkārši (kā plaši izmantotie RDF schema, FOAF un Dublin core metadata element set), gan arī komplicēti glosāriji, kas satur tūkstošiem terminu, piem., veselības aprūpē, lai aprakstītu simptomus, slimības un ārstēšanu. Vārdnīcām ir ļoti svarīga loma saistītos datos, jo tās palīdz datu integrēšanā. Šī jēdziena lietojums pārklājas ar jēdzienu “ontoloģija”.

Avots: W3C — http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 1.0

Globālā tīmekļa pirmā paaudze, ko raksturo nošķirtas, statiskas tīmekļa vietnes, nevis pastāvīgi atjaunoti tīmekļa žurnāli un sociālo tīklu rīki.

Avots: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0

Globālā tīmekļa tās daļas nosaukums sarunvalodā, kas iespējo sociālos tīklus, tīmekļa žurnālus, lietotāju komentārus, vērtējumus, kā arī saistītas, uz lietotāju orientētas darbības.

Avots: W3C — http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0

Globālā tīmekļa tās daļas nosaukums sarunvalodā, kas iespējo mašīnlasāmus datus, izplatītos vaicājumus un šo datu analīzi. To uzskata par jēdzienu “semantiskais tīmeklis” un “datu tīmeklis” sinonīmu.

Avots: W3C — http://www.w3.org/TR/ld-glossary/#web-3.0

XML

Paplašināmās iezīmēšanas valoda. Tā ir iezīmēšanas valoda, kas definē noteikumu kopumu dokumentu kodēšanai formātā, kas ir gan cilvēkam lasāms, gan mašīnlasāms.

Avots: https://en.wikipedia.org/wiki/XML