Prieiga prie Europos Sąjungos atvirųjų duomenų
EUROPAES atvirųjų duomenų portalasAiškinamasis žodynėlis
Menu
Apžvalga Priemonės Mokymosi ištekliai Projektai Sandbox

AIŠKINAMASIS ŽODYNĖLIS

ADMS

Išteklių aprašymo metaduomenų žodynas (angl. Asset Description Metadata Schema) – tai semantiniams fondams aprašyti skirtas žodynas, suteikiantis IRT kūrėjams galimybę nagrinėti semantinius fondus ir atlikti jų paiešką. ADMS viešojo administravimo institucijoms, įmonėms, standartizavimo organizacijoms ir akademinei bendruomenei suteikia galimybę:

  • aprašyti semantinius fondus tuo pačiu būdu, kad IRT kūrėjai galėtų juos lengvai rasti ir atpažinti naudodamiesi vienu prieigos punktu;
  • ieškoti semantinių fondų, kurie gali būti pakartotinai naudojami, juos atpažinti, parsisiųsti ir lyginti viename prieigos punkte išvengiant dvigubo darbo ir brangių projektavimo darbų;
  • turėti savo dokumentų ir semantinių fondų kaupimo sistemą;
  • tobulinti savo pačių semantinių fondų indeksavimą ir matomumą;
  • sieti semantinius fondus tarpusavyje į tarpvalstybines ir tarpsektorines kombinacijas.

Šaltinis: https://joinup.ec.europa.eu/asset/adms/description

API 

Programų sąsaja (angl. Application programming interface).

Būdas, kuriuo kompiuterinės programos supranta viena kitą. Jį galima suprasti ir kaip būdą, kuriuo programuotojas siunčia komandas iš vienų programų į kitas.

Šaltinis: http://schoolofdata.org/handbook/appendix/glossary

ATVIRIEJI STANDARTAI 

Paprastai tai techniniai standartai, kuriems netaikomi su licencijomis susiję apribojimai. Gali reikšti ir standartus, parengtus neatsižvelgiant į konkretų pardavėją.

Šaltinis: http://schoolofdata.org/handbook/appendix/glossary

ATVIRIEJI VALDŽIOS INSTITUCIJŲ DUOMENYS 

Viešųjų įstaigų surinkti arba parengti duomenys, arba duomenys, už kuriuos tos įstaigos sumokėjo ir leido jais nemokamai naudotis bet kokiais tikslais.

 

CKAN

Duomenų valdymo sistema, suteikianti priemonių supaprastinti duomenų skelbimą, paiešką, dalijimąsi ir naudojimąsi jais ir taip užtikrinanti duomenų prieinamumą. Sistema CKAN skirta duomenų skelbėjams (nacionalinėms ir regioninėms valdžios institucijoms, bendrovėms ir organizacijoms), siekiantiems, kad jų duomenys būtų atviri ir prieinami.

Šaltinis: http://ckan.org/

CORDIS

Europos Komisijos pagrindinė vieša saugykla ir portalas, naudojamas informacijai apie visus ES finansuojamus mokslinių tyrimų projektus ir jų rezultatus skleisti.

Šaltinis: http://cordis.europa.eu/home_en.html

CSV

Kableliais skiriamų verčių (angl. comma separated values) rinkmenų formatas dažnai naudojamas duomenų mainams tarp įvairių programų. CSV formato rinkmenos gali būti naudojamos skaičiuoklės programose „KSpread“, „OpenOffice Calc“ ir „Microsoft Excel“. CSV formatą palaiko daug kitų programų, importuodamos arba eksportuodamos duomenis.

Šaltinis: http://edoceo.com/utilitas/csv-file-format

 

DCAT 

Duomenų katalogo žodynas.

Duomenų katalogų sąveikumo RDF žodynas.

Dar žr. W3C - http://www.w3.org/TR/vocab-dcat

DCAT-AP 

DCAT programos profilis. DCAT grindžiamas bendras žodynas, skirtas duomenų rinkiniams, kuriems suteikta priegloba Europos duomenų portaluose, aprašyti.

Dar žr. https://joinup.ec.europa.eu/asset/dcat_application_profile/description

 

DCMI

Dublino pagrindinių metaduomenų iniciatyva (angl. Dublin core metadata initiative) – tai atvira organizacija, remianti metaduomenų projektavimo naujoves ir geriausią patirtį visoje metaduomenų sistemoje.

Šaltinis: http://dublincore.org/

(DUOMENŲ) ANALIZĖ 

Duomenų bloko suskaidymas į mažesnes dalis pagal tam tikras taisykles, kad būtų lengviau juos aiškinti, valdyti arba perduoti kompiuteriui.

Šaltinis: http://www.businessdictionary.com/definition/parsing.html

(DUOMENŲ) BAZĖ

Duomenų bazė yra pavienių darbų, duomenų ar medžiagų, pateiktų sistemiškai ar metodiškai ir atskirai prieinamų elektroninėmis priemonėmis ar kitais būdais, rinkinys.

 

(DUOMENŲ) GAVYBA 

Didelių esamų duomenų bazių tyrinėjimas siekiant gauti naujos informacijos.

Šaltinis: http://www.oxforddictionaries.com

„Pavyzdžiui, vienas iš JAV centrinės dalies maisto produktų prekybos tinklų, pasinaudojęs „Oracle“ programinės įrangos teikiamomis duomenų gavybos galimybėmis, išnagrinėjo vietos pirkimo įpročius. Paaiškėjo, kad ketvirtadieniais ir šeštadieniais sauskelnes pirkdavę vyrai dažnai paimdavo ir alaus. Tiriant toliau nustatyta, kad šie pirkėjai paprastai šeštadieniais apsipirkdavo visai savaitei, o ketvirtadieniais įsigydavo tik keletą prekių. Mažmenininkas padarė išvadą, kad alų jie pirkdavo artėjančiam savaitgaliui. Prekybos tinklas galėtų įvairiais būdais pasinaudoti šia nauja informacija, kad padidintų savo pajamas. Pavyzdžiui, alaus lentynas galima būtų pastatyti arčiau prie sauskelnių lentynų ir užtikrinti, kad alus ir sauskelnės ketvirtadieniais būtų parduodami už visą kainą.“

Šaltinis: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

 

(DUOMENŲ) IŠKELTIS 

Didelis duomenų kiekis, iš vienos sistemos arba vietos perkeliamas į kitą.

Šaltinis: http://www.oxforddictionaries.com

(DUOMENŲ) PAIEŠKA NAUDOJANTIS ROBOTAIS 

Paieškos robotas (angl. Crawler) – tai programa, kuri lankosi interneto svetainėse, skaito jų puslapius ir kitą informaciją, kad parengtų paieškos sistemos rodyklės įrašus. Tokias programas turi visos didelės interneto paieškos sistemos. Angliškai jos dar vadinamos „spider“ arba „bot“.

Šaltinis: http://searchsoa.techtarget.com/definition/crawler

Kalbant apie duomenų gavimą iš interneto, vietoj angliško termino „crawling“ dažnai vartojami terminai „data scraping“ arba „harvesting“. Šie trys terminai reiškia ne tą patį: „crawling“ reiškia darbą su dideliais duomenų rinkiniais, kai galima sukurti savo pačių paieškos robotus („crawler“ arba „bot“), galinčius ieškoti informacijos giliausiuose tinklalapių kloduose; „data scraping“ reiškia informacijos gavimą iš bet kokio šaltinio (nebūtinai interneto).

Šaltinis: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

 

(DUOMENŲ) RINKIMAS (DATA SCRAPING)  

Duomenų gavimas iš ne vien grynųjų duomenų šaltinių (pvz., tinklalapių arba PDF dokumentų) kompiuterio skaitomu formatu. Dažnai nurodomas šaltinis (pvz., duomenų rinkimas iš interneto, duomenų rinkimas iš PDF).

Šaltiniai: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

 

DUOMENŲ RINKINYS 

Susijusių duomenų rinkinių visuma, kurią sudaro atskiri elementai, bet kuria galima naudotis kaip vienetu ir gauti arba parsisiųsti vienu arba daugiau formatų.

  

 

ELI

Europos teisės aktų identifikatorius, leidžiantis internete identifikuoti nacionalinius ir Europos Sąjungos teisės aktus ir suteikiantis prieigą prie jų, taip pat užtikrinantis valdžios institucijoms, profesionaliems naudotojams, akademinei bendruomenei bei piliečiams paprastesnę prieigą prie teisės aktų, galimybę jais keistis ir naudotis. ELI sudaro sąlygas kurti oficialiųjų leidinių semantinį saityną.

Šaltinis: https://en.wikipedia.org/wiki/European_Legislation_Identifier

FOAF

„Draugo draugas“ (angl. Friend of a friend) – tai kompiuterio skaitomas asmenų, jų veiklos ir santykių su kitais žmonėmis ir objektais aprašomasis žodynas. FOAF suteikia galimybę žmonių grupėms aprašyti socialinius tinklus nesinaudojant centralizuota duomenų baze.

Šaltinis: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

HIBRIDINĖ TAIKOMOJI PROGRAMA 

Iš įvairių šaltinių gautų kelių duomenų rinkinių derinimas siekiant sukurti naują paslaugą, vizualizavimą arba informaciją.

 

IMMC

Būtinas metaduomenų elementų rinkinys (vadinamieji IMMC pagrindiniai metaduomenys), naudojamas keičiantis duomenimis.

Šaltinis: http://publications.europa.eu/mdr/core-metadata/

 

ISA 

Europos viešojo administravimo institucijų sąveikumo sprendimai.

Tai Europos Komisijos finansuojama programa, kuria siekiama palengvinti tarpvalstybinius ir tarpsektorinius Europos viešojo administravimo institucijų veiksmus.

Programa ISA vykdyta 2010–2015 m. Jos tęsinys – 2016 m. pradėta programa ISA², kuri bus vykdoma iki 2020 m.

 

IŠTEKLIUS 

Duomenų rinkinio fizinis pavidalas. Išteklius gali būti bet kokio pobūdžio rinkmena, bet kurioje saityno vietoje esančios rinkmenos nuoroda arba API nuoroda. Pavyzdžiui, jei duomenys pateikiami keliais formatais, ne visi vienoje vietoje arba ne visi vienu metu, kiekviena rinkmena laikoma atskiru ištekliumi, kuris turėtų būti aprašytas atskirai.

 

JSON

„JavaScript“ objektų žymėjimas (angl. JavaScript object notation) – tai atvirojo standarto formatas, kuriuo, naudojant žmogaus skaitomą tekstą, perduodami duomenų objektai, kuriuos sudaro atributo ir reikšmės poros. Tai duomenų formatas, dažniausiai naudojamas naršyklės / serverio asinchroninio ryšio (AJAJ) tikslais.

Šaltinis: https://en.wikipedia.org/wiki/JSON

 

KOMPIUTERIO SKAITOMA 

Kompiuterio skaitomi duomenys – tai duomenys, pateikiami tokiu formatu, kurį gali skaityti kompiuterio programa. Kompiuterio skaitomi duomenys būna dviejų rūšių:

·      žmogaus skaitomi duomenys, kurie taip paženklinti, kad juos galėtų suprasti ir kompiuteriai, pavyzdžiui, mikroformatai, RDFa;

·      duomenų formatai, iš esmės skirti kompiuteriams, pavyzdžiui, RDF, XML ir JSON.

 

MASINIS PARSISIUNTIMAS 

Toks parsisiuntimas, kai vienu metu parsisiunčiama rinkmenų iš įvairių rinkinių.

 

METADUOMENYS 

Metaduomenys yra susisteminta informacija, kurios paskirtis – aprašyti, paaiškinti ir lokalizuoti informacijos išteklių arba kitais būdais padėti jį lengviau gauti, naudoti arba valdyti. Metaduomenys dažnai vadinami duomenimis apie duomenis.

Šaltinis: NISO - http://www.niso.org/publications/press/UnderstandingMetadata.pdf

METADUOMENŲ REGISTRAS (MDR) 

Metaduomenų registras yra svarbi sąveikumo ir standartizacijos priemonė. Jame registruojami ir saugomi apibrėžiamieji duomenys (metaduomenų elementai, institucijų pavadinimų sąrašai, schemos ir t. t.), kuriuos naudoja įvairios ES institucijos.

http://publications.europa.eu/mdr/index.html

 

NEAPDOROTI DUOMENYS 

Tai pirminiai neapdoroti duomenys, kurie nėra suvestiniai ir nėra tvarkyti kokiu nors kitu būdu. Dar vadinami pirminiais duomenimis.

 

ONTOLOGIJA 

Formalus modelis, suteikiantis galimybę rodyti konkrečios srities žinias. Ontologija – tai esybių tipų (klasių), jų tarpusavio ryšių (savybių) ir dėsningumų, kaip tos klasės ir savybės gali būti naudojamos kartu (aksiomų) aprašas.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#ontology

 

PDF

Portatyvus dokumento formatas – tai rinkmenos formatas, naudojamas dokumentams teikti ir jais keistis, kad ir kokia būtų programinė ir aparatinė įranga arba operacinė sistema. Tai atvirasis standartas, kurį prižiūri Tarptautinė standartizacijos organizacija.

Šaltinis: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

PSI 

Viešojo sektoriaus informacija (angl. Public Sector Information). Įvairi informacija, kurią viešojo sektoriaus institucijos vykdydamos savo užduotis renka, rengia, atgamina ir skleidžia įvairiausiose veiklos srityse.

Ja naudotis gali būti leidžiama pagal įvairias licencijas, ne visada nemokamas.

 

RDF 

Išteklių aprašymo modelis (angl. Resource description framework).

Duomenų mainams internete skirta tarptautinių standartų grupė. RDF pagrindas – dalykų identifikavimas naudojant saityno identifikatorius arba HTTP universaliųjų išteklių identifikatorius ir išteklių aprašymas naudojant paprastas savybes ir savybių reikšmes.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#rdf

RDFa

Išteklių aprašymo modelis, susijęs su atributais (angl. Resource description framework in attributes). Tai W3C rekomendacija, pagal kurią prie HTML, XHTML ir įvairių XML grindžiamų dokumentų pridedama atributų lygmens plėtinių siekiant įterpti į saityno dokumentus sudėtinių metaduomenų.

Šaltinis: https://en.wikipedia.org/wiki/RDFa

 

SĄVEIKUMAS 

Sistemų pajėgumas keistis informacija ir naudotis per tuos mainus gauta informacija.

 

SDMX

Statistinių duomenų ir metaduomenų mainai (angl. Statistical data and metadata exchange) – tarptautinė iniciatyva, kuria siekiama standartizuoti ir modernizuoti tarptautinių organizacijų ir joms priklausančių šalių statistinių duomenų ir metaduomenų mainų mechanizmus ir procesus.

Šaltinis: https://en.wikipedia.org/wiki/SDMX

 

SEMANTINIS SAITYNAS 

Saityno raida arba saityno dalis, kurią sudaro kompiuterio skaitomi duomenys RDF formatu ir galimybė ieškoti tos informacijos įprastais būdais (pvz., naudojantis SPARQL).

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#semantic-web

 

SEO

Paieškos sistemų optimizavimas (angl. Search engine optimisation) – tai procedūra, dėl kurios pagerėja interneto svetainės arba tinklalapio matomumas tarp naudojantis paieškos sistema atliktos paieškos rezultatų, už kuriuos nesumokėta.

Šaltinis: https://en.wikipedia.org/wiki/Search_engine_optimization

 

SOLR

Atviroji įmonių paieškos platforma. Pagrindinės jos ypatybės – paieška visame tekste, atitikčių paryškinimas, daugiaaspektė paieška, indeksavimas tikruoju laiku, dinaminis blokinių kūrimas, duomenų bazių integravimas ir raiškiųjų dokumentų (pvz., „Word“, PDF) tvarkymas.

Šaltinis: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL 

SPARQL protokolas ir RDF užklausų kalba (SPARQL) – tai RDF duomenų užklausų kalba, panaši į struktūrinę užklausų kalbą (SQL), skirtą sąryšinėms duomenų bazėms.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#sparql

„SPARQL“ PRIEIGOS TAŠKAS

SPARQL užklausų priėmimo ir atsakymų į jas (SPARQL rezultatų rinkinių) teikimo paslauga. Duomenų rinkinių tiekėjams geriausia pateikti savo SPARQL prieigos taško URL, kad jų duomenis būtų galima pasiekti naudojantis programos kodu arba interneto sąsaja.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#sparql-endpoint

STRUKTŪRINIAI DUOMENYS 

Duomenys fiksuotuosiuose įrašo arba rinkmenos laukeliuose. Struktūrinių duomenų pavyzdžiai yra sąryšinės duomenų bazės ir skaičiuoklės. Nors XML rinkmenose duomenys nėra fiksuoti kokioje nors vietoje kaip tradicinių duomenų bazių įrašai, vis dėlto jie yra struktūriniai, kadangi duomenys yra paženklinti ir gali būti tiksliai identifikuojami.

Šaltinis: PC Magazine encyclopaedia - http://www.pcmag.com/encyclopedia/term/52162/structured-data

 

SUSIETIEJI DUOMENYS 

Susietieji duomenys – tai toks struktūrinių duomenų skelbimo būdas, kad jie galėtų būti tarpusavyje susieti. Jie grindžiami standartinėmis saityno technologijomis, pavyzdžiui, HTTP ir URI, tačiau užuot naudojus jas žmonėms skaityti skirtuose tinklalapiuose, jų naudojimo sritis išplečiama taip, kad informaciją galėtų automatiškai skaityti kompiuteriai.

Šaltinis: http://www.wikipedia.org

SUSIETŲJŲ DUOMENŲ PRINCIPAI

Susietųjų duomenų principais užtikrinama saityno duomenims skirta bendra programų sąsaja, kuri yra tinkamesnė negu daug atskirų skirtingais būdais parengtų programų sąsajų, paskelbtų atskirų duomenų teikėjų. Saityno kūrėjas ir susietųjų duomenų projekto iniciatorius Tim Berners-Lee pasiūlė šiuos principus, kuriais grindžiami susietieji duomenys:

  • URI naudojimas objektams pavadinti;
  • formato HTTP URI naudojimas, kad interneto naudotojai ir vartotojo agentai galėtų nurodyti objektus ir jų ieškoti (juos pasiekti);
  • kam nors naudojantis URI, naudingos informacijos teikimas naudojantis atvirojo saityno standartais, pavyzdžiui, RDF arba „Sparql“;
  • nuorodų į kitus susijusius dalykus teikimas nurodant jų URL, kai skelbiama internete.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#linked-data-principles

 

TRIPLETAS, TRIPLETŲ SAUGYKLA 

Tripletų saugykla yra speciali duomenų bazė, skirta tripletams saugoti ir parsisiųsti naudojantis semantinėmis užklausomis. Tripletas yra duomenų vienetas, kurį sudaro subjektas, predikatas ir objektas, pavyzdžiui, „Bobui yra 35 metai“ arba „Bobas pažįsta Fredą“.

Panašiai kaip sąryšinėje duomenų bazėje, informacija laikoma tripletų saugykloje ir gaunama naudojantis užklausų kalba. Kitaip nei sąryšinė duomenų bazė, tripletų saugykla optimaliai pritaikyta tripletų laikymui ir gavimui. Be užklausų, paprastai yra ir galimybė tripletus importuoti ir eksportuoti naudojant RDF ir kitus formatus.

Šaltinis: Wikipedia.org - http://en.wikipedia.org/wiki/Triplestore

URI 

Universalusis ištekliaus identifikatorius (angl. Uniform resource identifier).

Ženklų seka, kuria galima identifikuoti kone bet ką, įskaitant fizinius pastatus ir abstrakčias sąvokas, pavyzdžiui, spalvas. Šis identifikatorius gali nurodyti tinklalapį, tačiau nebūtinai.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL 

Universalusis ištekliaus adresas (angl. Uniform resource locator).

Bendras identifikatorius, paprastai vadinamas interneto adresu. URL nurodo tinklalapį. Visi HTTP universalieji išteklių adresai yra universalieji išteklių identifikatoriai, tačiau ne visi universalieji išteklių identifikatoriai yra universalieji išteklių adresai.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Universalusis ištekliaus vardas (angl. Uniform resource name) yra nuo seno vartojamas universaliojo ištekliaus identifikatoriaus (URI) vardas.

Šaltinis: https://en.wikipedia.org/wiki/Uniform_Resource_Name

ŽODYNAS 

Tam tikru tikslu sudarytas terminų rinkinys. Žodynai gali būti paprasti, pavyzdžiui, plačiai naudojama RDF schema, FOAF ir Dublino pagrindinių metaduomenų elementų rinkinys, ir sudėtingi, turintys tūkstančius terminų, pavyzdžiui, sveikatos apsaugos srityje naudojami žodynai, kuriuose aprašomi simptomai, ligos ir gydymas. Žodynai labai svarbūs susietųjų duomenų srityje, visų pirma dėl to, kad padeda integruoti duomenis. Šio termino vartojimo sritis iš dalies sutampa su termino „ontologija“ vartojimo sritimi.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 1.0 

Pirmosios kartos saitynas, kuriam būdingos atskiros statiškos svetainės, o ne nuolat atnaujinami tinklaraščiai ir socialiniai tinklai.

Šaltinis: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0 

Taip kasdienėje kalboje vadinama ta saityno dalis, kuriai priklauso socialiniai tinklai, tinklaraščiai, naudotojų komentarai ir vertinimai bei susijusi žmonių veikla.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0  

Taip kasdienėje kalboje vadinama ta saityno dalis, kuriai priklauso kompiuterių skaitomi duomenys ir galimybė atlikti paskirstytąsias užklausas ir tuos duomenis analizuoti. Sinonimiškai vartojami terminai „semantinis saitynas“ ir „duomenų saitynas“.

Šaltinis: W3C - http://www.w3.org/TR/ld-glossary/#web-3.0

XML

Universali dokumentų ženklinimo kalba (angl. Extensible markup language). Tai ženklinimo kalba, kuria nustatomos tam tikros taisyklės, kaip koduoti dokumentus formatu, kurį gali skaityti tiek žmogus, tiek kompiuteris.

Šaltinis: https://en.wikipedia.org/wiki/XML