Pristup otvorenim podacima Europske unije
EUROPAPortal otvorenih podataka EU-aPojmovnik
Menu
Pregled Centar znanja Projekti Sandbox

POJMOVNIK

ADMS

Shema metapodataka za opis imovine (ADMS) vokabular je kojim se opisuje interoperabilna imovina s pomoću koje razvojni inženjeri u području IKT-a mogu istraživati i pretraživati interoperabilnu imovinu. Zahvaljujući ADMS-u javne uprave, poduzeća, tijela za normizaciju i akademska zajednica mogu:

  • opisati semantičku imovinu na jedinstven način na temelju kojeg je programeri mogu lako pretraživati i pronaći iz jedinstvene pristupne točke;
  • iz jedinstvene pristupne točke pretraživati, identificirati, dohvaćati i uspoređivati semantičku imovinu koja se može ponovno upotrijebiti da bi se izbjeglo udvostručivanje i skupo projektiranje;
  • održavati vlastiti sustav za evidentiranje i pohranjivanje semantičke imovine;
  • poboljšati indeksiranje i vidljivost vlastite imovine; te
  • povezati semantičku imovinu iz različitih država i sektora.

Izvor: https://joinup.ec.europa.eu/asset/adms/description

API 

Sučelje za programiranje aplikacija.

Način za međusobnu komunikaciju računalnih programa. Može se shvatiti u smislu načina na koji programer šalje upute među programima.

Izvor: http://schoolofdata.org/handbook/appendix/glossary

BAZA PODATAKA

Baza podataka je zbirka samostalnih djela, podataka ili druge građe, uređenih po određenom sustavu ili određenoj metodi i pojedinačno dostupnih elektroničkim ili drugim sredstvima.

 

CKAN

Sustav upravljanja podacima s pomoću kojeg se povećava dostupnost podataka zahvaljujući alatima kojima se pojednostavnjuju objavljivanje, razmjena, pronalaženje i uporaba podataka. CKAN je namijenjen izdavačima podataka (nacionalna vlada i jedinice regionalne samouprave, poduzeća i organizacije) koji žele svoje podatke učiniti otvorenima i dostupnima.

Izvor: http://ckan.org/

CORDIS

Primarni javni repozitorij Europske komisije i portal za širenje informacija o svim istraživačkim projektima s financijskom potporom EU-a i njihovim rezultatima.

Izvor: http://cordis.europa.eu/home_en.html

CSV

Format datoteka „vrijednosti odvojene zarezom” (engl. comma separated values) koji se uglavnom upotrebljava za razmjenu podataka među sličnim aplikacijama. Format datoteka CSV upotrebljavaju aplikacije Kspread, OpenOffice Calc i Microsoft Excel. Mnoge druge aplikacije podržavaju format CSV za uvoz ili izvoz podataka.

Izvor: http://edoceo.com/utilitas/csv-file-format

DCAT 

Vokabular kataloga podataka (engl. Data catalogue vocabulary).

Vokabular interoperabilnosti kataloga podataka u formatu RDF.

Vidjeti i: W3C – http://www.w3.org/TR/vocab-dcat

DCAT-AP 

Profil aplikacija DCAT.

Zajednički vokabular za opis skupova podataka koji su smješteni na podatkovnim portalima u Europi na temelju DCAT-a.

Vidjeti i: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DCMI

Dublinska inicijativa za osnovne metapodatke (engl. Dublin core metadata initiative), otvorena organizacija koja podržava inovacije u dizajnu metapodataka i najbolje prakse u području ekologije metapodataka.

Izvor: http://dublincore.org/

DUMP (PODATAKA) 

Prijenos velike količine podataka iz jednog sustava ili jedne lokacije u drugi sustav ili na drugu lokaciju.

Izvor: http://www.oxforddictionaries.com

ELI

Europski identifikator zakonodavstva (engl. European legislation identifier) koji omogućuje jedinstvenu identifikaciju nacionalnog i europskog zakonodavstva na internetu i pristup tom zakonodavstvu te kojim se jamči lakši pristup, razmjena i ponovna upotreba zakonodavstva za javna tijela, profesionalne korisnike, istraživače i građane. S pomoću ELI-ja stvara se semantički web za pravne novine i službene listove.

Izvor: https://en.wikipedia.org/wiki/European_Legislation_Identifier

FOAF

Prijatelj prijatelja (engl. friend of a friend) strojno je čitljiv opisni vokabular osoba, njihovih djelatnosti i njihovih odnosa s drugim osobama i objektima. S pomoću njega grupe osoba mogu opisati svoje društvene mreže bez potrebe za centraliziranom bazom podataka.

Izvor: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

IMMC

Minimalni set elemenata metapodataka, takozvani ključni metapodaci IMMC, koji se koriste u razmjeni podataka.

Izvor: http://publications.europa.eu/mdr/core-metadata/

INDEKSIRANJE (PODATAKA) (engl. CRAWLING

Program za indeksiranje (engl. crawler) program je koji posjećuje internetske stranice te iščitava njihove stranice i druge podatke da bi se stvorili unosi za indeks tražilice. Sve velike internetske tražilice imaju takve programe, koji su poznati ipod nazivom „pauk” ili „bot”.

Izvor: http://searchsoa.techtarget.com/definition/crawler

Pri ekstrakciji podataka s interneta indeksiranje se često naziva i „struganje” ili prikupljanje podataka (engl. data scraping). Postoji razlika između tih pojmova: indeksiranje se odnosi na obradu velikih skupova podataka s pomoću programa (ili botova) koje netko može samostalno razviti i koji pristupaju najdubljim dijelovima internetskih stranica; struganje podataka odnosi se na preuzimanje podataka iz bilo kojeg izvora (ne nužno s interneta).

Izvor: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

INTEROPERABILNOST 

Mogućnost sustava da razmjenjuju podatke i upotrebljavaju podatke dobivene razmjenom.

ISA 

Interoperabilna rješenja za europske javne uprave.

To je program koji financira Europska komisija radi olakšavanja prekograničnih i/ili međusektorskih transakcija između javnih uprava u Europi.

ISA² je nastavak programa ISA koji je trajao od 2010. do 2015. ISA² traje od 2016. do 2020.

JSON

JavaScript Object Notation (JSON) otvoreni je format za prijenos strukture podataka u kojem se s pomoću ljudima čitljivog teksta prenose objekti podataka koji se sastoje od parova atributa i vrijednosti. To je najčešće upotrebljavani format podataka za asinkronu komunikaciju preglednika i poslužitelja (AJAJ).

Izvor: https://en.wikipedia.org/wiki/JSON

MASHUP 

Kombinacija više skupova podataka iz različitih izvora da bi se stvorila nova usluga, vizualizacija ili informacija.

MASOVNO PREUZIMANJE (engl. BULK DOWNLOAD

Preuzimanje datoteka iz većeg broja zbirki koje je moguće dohvatiti istodobno.

METAPODACI 

Metapodaci su strukturirani podaci kojima se opisuje, locira ili na drugi način olakšava dohvaćanje ili uporaba informacijskog resursa te upravljanje njime. Metapodatke se često naziva podacima o podacima.

Izvor: NISO – http://www.niso.org/publications/press/UnderstandingMetadata.pdf

NAČELA ZA POVEZANE PODATKE

Načelima za povezane podatke stvara se zajedničko sučelje za programiranje aplikacija na internetu koje je prikladnije od mnoštva zasebnih i različito projektiranih sučelja koje programiraju pojedinačni pružatelji podataka. Tim Berners-Lee, izumitelj weba i pokretač projekta povezanih podataka, predložio je sljedeća načela na kojima se temelje povezani podaci:

  • uporaba URI-ja za imenovanje stvari;
  • uporaba HTTP URI-ja da bi ljudi i korisnički agenti mogli upućivati na stvari te ih pretraživati (engl. dereference);
  • kad netko traži određeni URI, pružanje korisnih informacija s pomoću otvorenih mrežnih normi kao što su RDF ili SPARQL;
  • uključivanje poveznica na povezane stvari koje koriste iste URI-je prilikom objavljivanja na internetu.

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#linked-data-principles

ONTOLOGIJA 

Formalni model s pomoću kojeg se može predstaviti znanje u određenoj domeni. Ontologijom se opisuju vrste stvari koje postoje (klase), odnosi među njima (svojstva) te logički načini na koje se te klase i svojstva mogu zajedno upotrijebiti (aksiomi).

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#ontology

OTVORENE NORME 

Općenito se shvaćaju kao tehničke norme koje ne podliježu ograničenjima licenciranja. Može ih se shvatiti i kao standarde koji su razvijeni neovisno o pojedinačnim proizvođačima.

Izvor: http://schoolofdata.org/handbook/appendix/glossary

OTVORENI JAVNI PODACI 

Podaci koje su prikupila, proizvela ili platila javna tijela i koji su slobodno dostupni za ponovnu uporabu u bilo koju svrhu.

PARSIRANJE (PODATAKA) 

Razbijanje grupe podataka na manje komadiće na temelju niza pravila da bi ih se lakše moglo protumačiti, upravljati njima ili ih prenositi s pomoću računala.

Izvor: http://www.businessdictionary.com/definition/parsing.html

PDF

Prenosivi format dokumenta koji se koristi za prikaz i razmjenu dokumenata neovisno o softveru, hardveru ili operativnim sustavima. To je otvorena norma koju održava Međunarodna organizacija za normizaciju.

Izvor: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

 

POVEZANI PODACI (engl. LINKED DATA

Povezanim podacima opisuje se metoda za objavljivanje strukturiranih podataka tako da ih se može međusobno povezati. Temelji se na standardnim mrežnim tehnologijama kao što su HTTP i URI, no, umjesto da s pomoću njih prikazuje internetske stranice za ljudske čitatelje, proširuje ih da bi podatke mogla automatski pročitati i računala.

Izvor: https://en.wikipedia.org/wiki/Linked_data

PSI 

Informacije javnog sektora (engl. public sector information).

To je širok spektar informacija koje prikupljaju, proizvode, koriste ili objavljuju javna tijela u mnogim područjima aktivnosti dok izvršavaju svoje institucionalne zadaće.

Ti se podaci mogu stavljati na raspolaganje u okviru različitih licencija te nisu uvijek otvoreni.

RDF 

Okvir za opis resursa (engl. resource description framework).

Sustav međunarodnih normi za razmjenu podataka na internetu. RDF se temelji na ideji identificiranja stvari s pomoću mrežnih identifikatora ili HTTP URI-ja i opisivanja resursa u pogledu jednostavnih svojstava i njihovih vrijednosti.

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#rdf

RDFa

Okvir za opis resursa atributima preporuka je organizacije W3C na temelju koje se dokumentima u formatu HTML, XHTML i XML dodaje niz nastavaka na razini atributa da bi se u mrežne dokumente uključili bogati metapodaci.

Izvor: https://en.wikipedia.org/wiki/RDFa

REGISTAR METAPODATAKA (MDR) 

Registar metapodataka važan je alat za interoperabilnost i normizaciju. U njemu se registriraju i održavaju podaci o definicijama (elementi metapodataka, popisi imenovanih tijela, sheme, itd.) koje se upotrebljavaju u raznim europskim institucijama.

Izvor: http://publications.europa.eu/mdr/index.html

RESURS 

Fizička prezentacija skupa podataka. Svaki resurs može biti datoteka bilo koje vrste, poveznica na datoteku drugdje na internetu ili poveznica na sučelje za programiranje aplikacija. Primjerice, ako se podaci dostavljaju u brojnim formatima ili podijeljeni na različita područja ili vremenska razdoblja, svaka datoteka je drugi „resurs” koji se treba pojedinačno opisati.

RUDARENJE (PODATAKA) 

Pretraživanje velikih postojećih baza podataka da bi se dobile nove informacije.

Izvor: http://www.oxforddictionaries.com

„Primjerice, jedan je američki lanac trgovina upotrijebio mogućnost rudarenja podataka s pomoću softvera poduzeća Oracle za analizu obrazaca lokalne kupovine. Otkrili su da, kad muškarci četvrtkom i subotom kupuju pelene, obično kupuju i pivo. Daljnjom analizom pokazalo se da su ti kupci svoju tjednu kupovinu namirnica obavljali subotom. Četvrtkom su kupovali samo nekoliko stvari. Lanac trgovina zaključio je da su ti kupci kupovali pivo da bi im bilo dostupno za dolazeći vikend. Te su nove informacije mogli iskoristiti na različite načine za povećanje prihoda. Primjerice, mogli su premjestiti pivo bliže pelenama. Osim toga, mogli su svakog četvrtka prodavati pivo i pelene po punoj cijeni.”

Izvor: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

SDMX

Razmjena statističkih podataka i metapodataka međunarodna je inicijativa čiji je cilj normizacija i modernizacija mehanizama i postupaka za razmjenu statističkih podataka te metapodataka među međunarodnim organizacijama i njihovim državama članicama.

Izvor: https://en.wikipedia.org/wiki/SDMX

SEMANTIČKI WEB 

Dio svjetske mreže (World Wide Web) koji se sastoji od strojno čitljivih podataka u formatu RDF koje se može pretraživati na standardne načine (npr. s pomoću jezika SPARQL).

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#semantic-web

SEO

Optimizacija za internetske pretraživače (SEO): postupak kojim se pozitivno utječe na vidljivost internetskih stranica u besplatnim rezultatima internetskih tražilica.

Izvor: https://en.wikipedia.org/wiki/Search_engine_optimization

SIROVI PODACI 

Podaci koji su u izvornom stanju te nisu obrađeni, kombinirani ili manipulirani na bilo koji način. Naziva ih se još i „primarnim” podacima.

 

SKUP PODATAKA ( engl. DATASET

Skup povezanih podataka koji se sastoji od različitih elemenata, ali se s njime može postupati kao s cjelinom te mu se može pristupiti ili ga preuzeti u jednom ili više formata.

 

SOLR

Platforma otvorenog koda za korporativno pretraživanje. Najvažnije značajke uključuju pretraživanje cijelog teksta, označavanje rezultata pretraživanja, fasetno pretraživanje, indeksiranje u realnom vremenu, dinamičke klastere, integraciju bazu podataka i obradu bogatih dokumenata (npr. u formatu Word, PDF).

Izvor: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL 

Protokolom SPARQL i jezikom za upite u formatu RDF (SPARQL) utvrđuje se jezik za pretraživanje podataka u formatu RDF analogan strukturiranom jeziku za upite (SQL) za relacijske baze podataka.

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#sparql

SPARQL KRAJNJA TOČKA (engl. SPARQL ENDPOINT

Servis koji prihvaća upite u formatu SPARQL i odgovara na njih u obliku skupova rezultata u formatu SPARQL. Najbolja je praksa za pružatelje podataka da daju URL svoje krajnje točke SPARQL da bi se njihovim podacima moglo pristupiti s pomoću programa ili putem web-sučelja.

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#sparql-endpoint

STROJNO ČITLJIVI 

Strojno čitljivi podaci su podaci u formatu koji može protumačiti računalni program. Postoje dvije vrste strojno čitljivih podataka:

  • podaci čitljivi ljudima koji su označeni tako da ih može razumjeti i računalo, primjerice mikroformati, RDFa;
  • formati podataka prvenstveno namijenjeni računalima, npr. RDF, XML i JSON.

STRUGANJE (PODATAKA) (engl. DATA SCRAPING)  

Postupak vađenja podataka u strojno čitljivom obliku iz nečistih izvora podataka, primjerice internetskih stranica ili dokumenata u PDF-u. Izraz se često upotrebljava u kombinaciji s izvorom (struganje podataka s interneta, struganje podataka iz PDF-a).

Izvori: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

STRUKTURIRANI PODACI 

Podaci koji se nalaze u fiksnim poljima unutar zapisa ili datoteke. Relacijske baze i tabelarni obrasci primjer su strukturiranih podataka. Iako podaci u XML datotekama nemaju fiksnu lokaciju kao u tradicionalnim evidencijama baza podataka, oni su također strukturirani zato što su označeni i može ih se točno identificirati.

Izvor: enciklopedija časopisa PC Magazine – http://www.pcmag.com/encyclopedia/term/52162/structured-data

TRIPLET, TRIPLESTORE 

Triplestore je namjenska baza podataka za pohranu i dohvat tripleta s pomoću semantičkih upita. Triplet je jedinica podataka koja se sastoji od subjekta, predikata i objekta, npr. „Bob ima 35 godina” ili „Bob poznaje Freda”.

Poput relacijske baze podataka, podaci se pohranjuju u triplestoreu i dohvaćaju putem jezika za pretraživanje. Za razliku od relacijske baze podataka, triplestore je baza optimizirana za pohranu i dohvat tripleta. Osim upita, tripleti se mogu uvoziti/izvoziti u formatu RDF i drugim formatima.

Izvor: Wikipedia.org – http://en.wikipedia.org/wiki/Triplestore

URI 

Usklađeni identifikator resursa (URI).

Niz kojim se može na jedinstven način identificirati gotovo sve, uključujući fizičku zgradu ili apstraktnije koncepte poput boja. Može ili ne mora biti prikaziv na internetu.

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL 

Usklađeni lokator resursa (URL).

Globalni identifikator koji se obično naziva „internetska adresa”. URL se može prikazati na mreži. Svi su HTTP URL-ovi URI-ji; međutim, nisu svi URi-ji URL-ovi.

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Usklađeni naziv resursa stari je naziv za usklađeni identifikator resursa (URI).

Izvor: https://en.wikipedia.org/wiki/Uniform_Resource_Name

VOKABULAR 

Kolekcija termina za određenu svrhu. Vokabulari mogu biti jednostavni, poput široko korištene sheme RDF, FOAF-a i skupa elemenata Dublinske inicijative za osnovne metapodatke, do složenih vokabulara s tisućama pojmova poput onih koji se upotrebljavaju u zdravstvenoj skrbi za opis simptoma, bolesti i liječenja. Vokabulari igraju vrlo važnu ulogu u povezanim podacima, posebno pri integraciji podataka. Uporaba ovog pojma preklapa se s uporabom pojma „ontologija”.

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

WEB 1.0. 

Prva generacija svjetske mreže (World Wide Web), za koju su karakteristične odvojene statičke stranice za razliku od kontinuirano ažuriranih blogova i alata za društveno umrežavanje.

Izvor: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0. 

Kolokvijalni naziv za dio svjetske mreže (World Wide Web) koji sadržava društvene mreže, blogove, korisničke komentare i ocjene te povezane aktivnosti usmjerene na ljudsku aktivnost.

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0.  

Kolokvijalni naziv za dio svjetske mreže (World Wide Web) u kojem se upotrebljavaju strojno čitljivi podaci koji se mogu pretraživati i analizirati. Sinonimi su „semantički web” i „web podataka”.

Izvor: W3C – http://www.w3.org/TR/ld-glossary/#web-3.0

XML

Proširivi jezik za označivanje (engl. Extensible Markup Language).

To je jezik za označivanje kojim se definira skup pravila za šifriranje dokumenata u formatu koji je čitljiv ljudima i strojevima.

Izvor: https://en.wikipedia.org/wiki/XML