Accesso agli open data dell'Unione europea
EUROPAPortale Open Data dell'UEGlossario
Menu

Glossario

A LETTURA OTTICA (MACHINE READABLE)

I dati a lettura ottica hanno un formato che può essere interpretato da un programma informatico. Ne esistono due tipi:

  • i dati leggibili dall’uomo, formattati in modo da essere compresi anche da computer, ad esempio microformati, RDFa;
  • i dati con formati destinati principalmente a computer, ad esempio RDF, XML e JSON.

ADMS

Asset description metadata schema.

Un vocabolario per descrivere le risorse di interoperabilità che consentono agli sviluppatori TIC di esplorare e cercare strumenti per l’interoperabilità. Permette alle pubbliche amministrazioni, alle imprese, agli organismi di normazione e al mondo accademico di:

  • descrivere le risorse semantiche in un modo comune affinché gli sviluppatori possano interrogarle in modo incrociato senza soluzione di continuità a partire da un unico punto di accesso;
  • cercare, individuare, recuperare e confrontare le risorse semantiche da riutilizzare, evitando duplicazioni e costosi lavori di progettazione tramite un unico punto di accesso;
  • mantenere il proprio sistema per documentare e conservare le risorse semantiche;
  • migliorare l’indicizzazione e la visibilità delle loro attività;
  • collegare le risorse semantiche ad altri contesti transfrontalieri e intersettoriali.

Fonte: https://joinup.ec.europa.eu/asset/adms/description

ANALISI SINTATTICA DEI DATI (DATA PARSING)

Scomposizione di un blocco di dati in parti più piccole, seguendo un insieme di regole, in modo che possa essere più facilmente interpretato, gestito o trasmesso da un computer.

Fonte: http://www.businessdictionary.com/definition/parsing.html

API

Application programming interface (interfaccia per programmi applicativi).

Grazie a questa interfaccia i programmi informatici comunicano fra di loro. È paragonabile al modo in cui un programmatore invia istruzioni fra i programmi.

Fonte: http://schoolofdata.org/handbook/appendix/glossary

BANCA DATI

Una banca di dati è una raccolta di opere, dati o elementi indipendenti disposti in modo sistematico o metodico e accessibili individualmente grazie a mezzi elettronici o di altro tipo.

 

CKAN

Comprehensive knowledge archive network.

Un sistema di gestione dei dati che rende accessibili i dati fornendo gli strumenti per semplificarne la pubblicazione, la condivisione, il reperimento e l’utilizzo. È destinato agli editori di dati (le amministrazioni nazionali e regionali, le imprese e le organizzazioni) che desiderano rendere i loro dati aperti e accessibili.

Fonte: http://ckan.org/

CORDIS

Il principale repertorio e portale pubblico della Commissione europea, utilizzato per divulgare informazioni su tutti i progetti di ricerca finanziati dall’UE e i relativi risultati.

Fonte: http://cordis.europa.eu/home_it.html

CRAWLING (DI DATI)

Un crawler è un programma che visita siti web per leggerne le pagine e acquisirne le informazioni al fine di creare delle voci per un indice di un motore di ricerca. Tutti i principali motori di ricerca sul web utilizzano un programma di questo tipo, noto anche come «spider» o «bot».

Fonte: http://searchsoa.techtarget.com/definition/crawler

Quando di parla di estrazione dei dati, spesso i termini «data scraping» o «harvesting» sono utilizzati come sinonimo di «crawling». Esiste tuttavia una differenza fra questi termini: «crawling» si riferisce alla gestione di set di dati di grandi dimensioni in cui qualcuno può sviluppare i propri crawler (o «bot») per esplorare le parti più profonde delle pagine web; «data scraping», invece, si riferisce al recupero di informazioni da qualsiasi fonte (non necessariamente dal web).

Fonte: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

CSV

Comma separated values.

Il formato di file con «valori separati da virgole» è utilizzato spesso per lo scambio di dati tra diverse applicazioni dello stesso tipo. È compatibile con i fogli di calcolo KSpread, OpenOffice Calc e Microsoft Excel. Molte altre applicazioni supportano il formato per importare ed esportare dati.

Fonte: http://edoceo.com/utilitas/csv-file-format

(DATA) SCRAPING

Il processo di estrazione di dati in formati adatti alla lettura ottica di fonti di dati non pure, ad esempio pagine web o documenti in formato PDF. Il termine è spesso preceduto dalla fonte (web scraping, PDF scraping).

Fonti: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

DATI APERTI DELLE PUBBLICHE AMMINISTRAZIONI

I dati raccolti, prodotti oppure pagati dagli organismi pubblici e liberamente accessibili per il riutilizzo per qualsiasi finalità.

DATI COLLEGATI (LINKED DATA)

I dati collegati designano un metodo di pubblicazione di dati strutturati che possono essere collegati fra loro. Si basa su tecnologie web standard quali HTTP e URI, ma invece di utilizzarle per visualizzare le pagine destinate ai lettori, le usa per condividere le informazioni in modo da renderle leggibili automaticamente dai computer.

Fonte: https://it.wikipedia.org/wiki/Linked_data

DATI GREZZI (RAW DATA)

I dati nel loro stato originale, non ancora trasformati, aggregati o manipolati in altro modo. Sono definiti anche «primari».

DATI STRUTTURATI

Dati che risiedono in campi fissi all’interno di un registro o di un file. Le banche dati relazionali e i fogli di calcolo ne sono un esempio. Anche se i dati nei file XML non hanno una collocazione fissa come gli elementi delle banche dati tradizionali, sono comunque strutturati perché sono dotati di tag e possono essere identificati con precisione.

Fonte: PC Magazine encyclopaedia — http://www.pcmag.com/encyclopedia/term/52162/structured-data

DCAT

Data catalogue vocabulary (vocabolario di catalogo di dati).

Vocabolario RDF che permette l’interoperabilità dei cataloghi di dati.

Si veda anche: W3C — http://www.w3.org/TR/vocab-dcat

DCAT-AP

DCAT application profile (profilo di applicazione DCAT).

Vocabolario comune, fondato sul DCAT, che consente di descrivere le serie di dati ospitate dei portali di dati in Europa.

Si veda anche: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DCMI

Dublin core metadata initiative.

Organizzazione aperta che sostiene l’innovazione nella progettazione dei metadati e le migliori pratiche nell’intero ecosistema dei metadati.

Fonte: http://dublincore.org/

DOWNLOAD IN MASSA

L’azione di scaricare file da raccolte multiple con un’unica operazione.

DUMP (DI DATI)

Trasferimento di una grande quantità di dati fra sistemi o posizioni diversi.

Fonte: http://www.oxforddictionaries.com

ELI

European legislation identifier (identificatore della legislazione europea).

Consente di identificare in modo univoco la legislazione nazionale ed europea e accedervi online. L’obiettivo è facilitare l’accesso, lo scambio e il riutilizzo della legislazione per le autorità pubbliche, gli utenti professionali, gli esponenti del mondo accademico e i cittadini. L’ELI spiana la strada alla creazione di un web semantico delle gazzette ufficiali.

Fonte: https://en.wikipedia.org/wiki/European_Legislation_Identifier

ENDPOINT SPARQL

Un servizio che accetta query SPARQL e fornisce risultati sotto forma di set di risultati SPARQL. I fornitori di dati seguono la buona pratica di indicare l’indirizzo URL del loro endpoint SPARQL per consentire l’accesso ai loro dati in modo programmatico o attraverso un’interfaccia web.

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#sparql-endpoint

ESTRAZIONE DI DATI (DATA MINING)

L’esame di banche dati esistenti di grandi dimensioni per produrre nuove informazioni.

Fonte: http://www.oxforddictionaries.com

«Ad esempio, una catena di supermercati alimentari del Midwest ha utilizzato la capacità di estrazione di dati del software della Oracle per analizzare le abitudini di acquisto locali. Così, la direzione ha scoperto che quando gli uomini compravano pannolini di giovedì e di sabato, di solito compravano anche della birra. Un’analisi più approfondita ha rivelato che questi clienti in genere facevano la spesa settimanale di sabato. Il giovedì compravano solo pochi articoli. È così giunta alla conclusione che i clienti compravano la birra per averla a casa nel fine settimana e che avrebbe potuto usare in vari modi queste nuove informazioni per aumentare le vendite, ad esempio spostando il reparto birra vicino a quello dei pannolini e vendendo la birra e i pannolini al prezzo pieno il giovedì».

Fonte: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

FOAF

«Friend of a friend» (amico di un amico) è un vocabolario a lettura ottica che descrive le persone, le loro attività e i loro rapporti con altre persone e oggetti. Consente ai gruppi di persone di descrivere le reti sociali senza avere bisogno di una banca dati centralizzata.

Fonte: https://en.wikipedia.org/wiki/FOAF_ %28ontology %29

IMMC

Interinstitutional Metadata Maintenance Committee.

L’insieme minimo di elementi di metadati, i cosiddetti metadati IMMC fondamentali (IMMC core metadata), da utilizzate per lo scambio di dati.

Fonte: http://publications.europa.eu/mdr/core-metadata/

INTEROPERABILITÀ

La capacità dei sistemi di scambiare informazioni e utilizzare le informazioni scambiate.

ISA

Interoperable Solutions for European Public Administrations (soluzioni di interoperabilità per le pubbliche amministrazioni europee).

Si tratta di un programma finanziato dalla Commissione europea per facilitare le operazioni tra le amministrazioni pubbliche transfrontaliere e/o intersettoriali in Europa.

ISA² fa seguito al programma ISA, svoltosi nel periodo dal 2010 al 2015, e copre il periodo dal 2016 al 2020.

JSON

«JavaScript object notation» è un formato open-standard che utilizza testo a lettura umana per trasmettere oggetti di dati costituiti da coppie di attributo-valore. È il formato di dati più comune utilizzato per la comunicazione/navigazione asincrona browser/server (AJAJ).

Fonte: https://en.wikipedia.org/wiki/JSON

MASHUP

La combinazione di più set di dati provenienti da fonti diverse per creare un nuovo servizio, una nuova visualizzazione o nuove informazioni.

METADATI

I metadati sono informazioni strutturate che descrivono, spiegano, posizionano o consentono di reperire, utilizzare o gestire più facilmente una risorsa di informazioni. Spesso sono definiti come «dati sui dati».

Fonte: NISO — http://www.niso.org/publications/press/UnderstandingMetadata.pdf

ONTOLOGIA

Un modello formale che permette di rappresentare le conoscenze in un settore specifico. Un’ontologia descrive i tipi di oggetti esistenti (classi), le relazioni tra di essi (proprietà) e le modalità logiche di utilizzo combinato delle classi e delle proprietà (assiomi).

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#ontology

PDF

Il «portable document format» è un formato di file utilizzato per presentare e scambiare documenti indipendentemente dal software, dall’hardware o dai sistemi operativi disponibili. Questo standard aperto è gestito dall’Organizzazione internazionale per la normalizzazione (ISO).

Source: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

PRINCIPI DEI DATI COLLEGATI (LINKED DATA PRINCIPLES)

I principi dei dati collegati forniscono un’API comune per i dati sul web che è più pratica rispetto a molte API diverse pubblicate separatamente dai singoli fornitori dei dati. Tim Berners-Lee, inventore del web e promotore del progetto con i dati collegati, ha proposto i seguenti principi per i dati collegati:

  • utilizzare gli URI per identificare oggetti;
  • utilizzare gli HTTP URI in modo che questi oggetti possano essere referenziati e cercati da persone e user agent;
  • fornire informazioni utili sull’oggetto quando la sua URI è dereferenziata, usando formati standard come RDF o SPARQL;
  • includere link ad altri oggetti correlati utilizzando i loro URI al momento della pubblicazione sul web.

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#linked-data-principles

PSI

Public Sector Information (informazioni del settore pubblico).

La vasta gamma di informazioni che gli enti pubblici raccolgono, producono, riproducono e diffondono in numerosi settori di attività durante lo svolgimento dei loro compiti istituzionali.

Questi dati possono essere messi a disposizione con una serie di licenze non sempre aperte.

RDF

Resource description framework (quadro di descrizione delle risorse).

Una famiglia di norme internazionali per lo scambio di dati sul web. Si basa sull’identificazione degli oggetti utilizzando identificatori web o URI HTTP e descrivendo le risorse in termini di proprietà semplici e valori di proprietà.

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#rdf

RDFa

«Resource description framework in attributes» è una raccomandazione del W3C che aggiunge una serie di estensioni nella categoria degli attributi ai formati XML, HTML e a diversi tipi di documenti basati sull’XHTML per integrare metadati ricchi nei documenti web.

Source: https://en.wikipedia.org/wiki/RDFa

REGISTRO DEI METADATI (METADATA REGISTRY, MDR)

Il registro dei metadati è un importante strumento di normalizzazione e interoperabilità. Contiene e conserva i dati di definizione (elementi di metadati, elenchi delle autorità designate, schemi ecc.) utilizzati dalle diverse istituzioni europee.

http://publications.europa.eu/mdr/index.html

RISORSA

La rappresentazione fisica di un set di dati. Ogni risorsa può essere un file di qualsiasi tipo, un link a un file sul web o un link a un’API. Ad esempio, se i dati sono forniti in vari formati o suddivisi tra zone o periodi di tempo diversi, ciascun file è una «risorsa» che dovrebbe essere descritta separatamente.

SDMX

Statistical data and metadata exchange (scambio di dati e metadati statistici), un’iniziativa internazionale per standardizzare e modernizzare i meccanismi e le procedure per lo scambio di dati e metadati statistici tra organizzazioni internazionali e Stati membri.

Fonte: https://en.wikipedia.org/wiki/SDMX

SEO

Search engine optimisation (ottimizzazione del motore di ricerca).

Attività svolte per migliorare la visibilità di un sito o di una pagina web fra i risultati gratuiti ottenuti con un motore di ricerca.

Fonte: https://en.wikipedia.org/wiki/Search_engine_optimization

SET DI DATI

Una raccolta di serie di dati correlati costituita da elementi distinti, ma che possono essere trattati come un’unità e consultati o scaricati in uno o più formati.

SOLR

Una piattaforma open source di ricerca di imprese Gli elementi principali sono la ricerca testuale, l’evidenziazione dei risultati, la ricerca per facet, l’indicizzazione in tempo reale, il raggruppamento dinamico, l’integrazione con banche dati e la gestione di documenti «ricchi» (ad esempio Word, PDF)

Fonte: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL

Linguaggio di interrogazione per dati rappresentati tramite l’RDF, analogo all’SQL (Structured Query Language) per le banche dati relazionali.

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#sparql

STANDARD APERTI

Nell’interpretazione più comune, le norme tecniche esenti da restrizioni di licenza. Può anche indicare le norme sviluppate senza associazione a un venditore specifico.

Fonte: http://schoolofdata.org/handbook/appendix/glossary

TRIPLE, TRIPLESTORE

Un triplestore è una banca dati costruita appositamente per il salvataggio e il recupero di triple attraverso ricerche (query) semantiche. Una «triple» è un’entità composta da soggetto-predicato-oggetto, ad esempio «Bob ha 35 anni» o «Bob conosce Fred».

Un triplestore è molto simile a una banca dati relazionale perché memorizza le informazioni in un triplestore e le recupera tramite un linguaggio di query. A differenza di una banca di dati relazionale, un triplestore è ottimizzato per la memorizzazione e il recupero di triple. Oltre alle query, le triple possono essere importate/esportate utilizzando l’RDF e altri formati.

Fonte: Wikipedia.org — http://en.wikipedia.org/wiki/Triplestore

URI

Uniform resource identifier (identificatore uniforme delle risorse).

Una stringa che identifica in modo univoco praticamente qualsiasi cosa, da un edificio a concetti più astratti, ad esempio i colori. Può essere o non essere risolvibile sul web.

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL

Uniform resource locator (localizzatore uniforme delle risorse).

Un identificativo globale generalmente chiamato «indirizzo web». Un URL è risolvibile sul web. Tutti gli URL HTTP sono URI; tuttavia, non tutti gli URI sono URL.

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Uniform resource name.

Definizione storica di un identificatore unico di risorsa (URI).

Fonte: https://en.wikipedia.org/wiki/Uniform_Resource_Name

VOCABOLARIO

Un insieme di termini per un determinato scopo. Esistono vari tipi di vocabolari, da quelli semplici, come ad esempio i set di metadati RDF, FOAF e Dublin core, a quelli complessi, con migliaia di termini, come quelli utilizzati nel settore dell’assistenza sanitaria per descrivere sintomi, malattie e terapie. I vocabolari svolgono un ruolo molto importante per i dati collegati, in particolare per la loro integrazione. L’uso di questo termine coincide con quello di «ontologia».

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 1.0

La prima generazione del World Wide Web, caratterizzata da siti web statici distinti anziché da weblog e social network costantemente aggiornati.

Fonte: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0

Una descrizione colloquiale della parte del World Wide Web che realizza i social network, i blog, i commenti e le valutazioni degli utenti e altre attività umane.

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0

Una descrizione colloquiale della parte del World Wide Web che attua dati a lettura automatica e la capacità di svolgere ricerche e analisi distribuite dei dati. Si considera sinonimo di «web semantico» e «web dei dati».

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#web-3.0

WEB SEMANTICO

Un’evoluzione o una parte del World Wide Web che consiste in dati a lettura a ottica in RDF e una capacità di cercare le informazioni in modi standard (ad esempio tramite SPARQL).

Fonte: W3C — http://www.w3.org/TR/ld-glossary/#semantic-web

XML

Extensible markup language.

È un linguaggio di markup che definisce una serie di norme per la codifica dei documenti in un formato a lettura ottica e leggibile dall’uomo.

Fonte: https://en.wikipedia.org/wiki/XML