Πρόσβαση στα δημόσια δεδομένα της Ευρωπαϊκής Ένωσης
EUROPAΠύλη Δημόσιων Δεδομένων της ΕEΓλωσσάριο
Menu

Γλωσσάριο

ADMS

(Αsset Description Μetadata Schema)

Tο σχήμα μεταδεδομένων για την περιγραφή στοιχείων είναι ένα λεξιλόγιο περιγραφής των στοιχείων διαλειτουργικότητας που δίνει στους/στις προγραμματιστές/-ριες ΤΠΕ τη δυνατότητα να εξερευνούν και να αναζητούν τέτοια στοιχεία. Το ADMS δίνει σε δημόσιες διοικήσεις, επιχειρήσεις, οργανισμούς τυποποίησης και ακαδημαϊκά ιδρύματα τη δυνατότητα:

  • να περιγράφουν σημασιολογικά στοιχεία με κοινό τρόπο, ώστε οι προγραμματιστές/-ριες ΤΠΕ να μπορούν χωρίς προβλήματα να τα αναζητούν και να τα εντοπίζουν από ένα ενιαίο σημείο πρόσβασης·
  • να αναζητούν, εντοπίζουν, ανασύρουν και συγκρίνουν σημασιολογικά στοιχεία για επαναχρησιμοποίηση, αποφεύγοντας τις επικαλύψεις και τη δαπανηρή εργασία σχεδιασμού μέσω ενός ενιαίου σημείου πρόσβασης·
  • να διατηρούν το δικό τους σύστημα τεκμηρίωσης και αποθήκευσης σημασιολογικών στοιχείων·
  • να βελτιώνουν τη δημιουργία ευρετηρίου και την αναγνωσιμότητα των δικών τους στοιχείων·
  • να συνδέουν σημασιολογικά στοιχεία μεταξύ τους σε διασυνοριακές και διατομεακές ρυθμίσεις.

Πηγή: https://joinup.ec.europa.eu/asset/adms/description

API 

(Application Programming Ιnterface )

Διεπαφή προγραμματισμού εφαρμογής.

Τρόπος με τον οποίο επικοινωνούν τα προγράμματα υπολογιστή μεταξύ τους. Απλούστερα, είναι ο τρόπος με τον οποίο ένας/μία προγραμματιστής/-ρια διαβιβάζει εντολές μεταξύ προγραμμάτων.

Πηγή: http://schoolofdata.org/handbook/appendix/glossary

ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ

Μια βάση δεδομένων είναι μια συλλογή έργων, δεδομένων ή άλλων ανεξάρτητων στοιχείων, τα οποία έχουν ταξινομηθεί με συστηματικό ή μεθοδικό τρόπο και είναι προσβάσιμα ξεχωριστά το καθένα με ηλεκτρονικά ή άλλου είδους μέσα.

 

CKAN

(Comprehensive Knowledge Archive Network)

Σύστημα διαχείρισης δεδομένων που καθιστά τα δεδομένα προσβάσιμα με την παροχή εργαλείων βελτίωσης της δημοσίευσης, της ανταλλαγής, της αναζήτησης και της χρησιμοποίησης δεδομένων. Το CKAN απευθύνεται στους παρόχους δεδομένων (εθνικές και περιφερειακές κυβερνήσεις, εταιρείες και οργανισμοί) που επιθυμούν να καταστήσουν τα δεδομένα τους ανοιχτά και διαθέσιμα προς όλους.

Πηγή: http://ckan.org/

CORDIS

(Community Research and Development Information Service)

Το κύριο δημόσιο αποθετήριο της Ευρωπαϊκής Επιτροπής και η πύλη διάδοσης πληροφοριών σχετικά με όλα τα ερευνητικά έργα που χρηματοδοτεί η ΕΕ και τα αποτελέσματά τους.

Πηγή: http://cordis.europa.eu/home_en.html

CSV

Ο μορφότυπος «Comma Separated Values» (τιμές διαχωρισμένες με κόμμα) ενός αρχείου συχνά χρησιμοποιείται για την ανταλλαγή δεδομένων μεταξύ διάφορων εφαρμογών της ίδιας κατηγορίας. Ο μορφότυπος αρχείου CSV μπορεί να χρησιμοποιηθεί από τις εφαρμογές KSpread, OpenOffice Calc και  Microsoft Excel spreadsheet. Πολλές άλλες εφαρμογές υποστηρίζουν τον CSV για την εισαγωγή ή την εξαγωγή δεδομένων.

Πηγή: http://edoceo.com/utilitas/csv-file-format

DCAT 

(Data Catalogue Vocabulary)

Λεξιλόγιο καταλόγου δεδομένων. Λεξιλόγιο σε μορφότυπο RDF για τη διαλειτουργικότητα των καταλόγων δεδομένων.

Βλέπε επίσης: W3C - http://www.w3.org/TR/vocab-dcat

DCAT-AP 

(DCAT Application Profile)

προφίλ της εφαρμογής DCAT. Ένα κοινό λεξιλόγιο για την περιγραφή των συνόλων δεδομένων που φιλοξενούνται σε πύλες δεδομένων στην Ευρώπη, βασιζόμενο στο DCAT.

Βλέπε επίσης: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DCMI

(Dublin core metadata initiative)

Πρωτοβουλία του Δουβλίνου για τα βασικά μεταδεδομένα: ένας ανοικτός οργανισμός που στηρίζει την καινοτομία στον τομέα του σχεδιασμού μεταδεδομένων και των βέλτιστων πρακτικών σε όλο το φάσμα μεταδεδομένων.

Πηγή: http://dublincore.org/

DUMP (ΔΕΔΟΜΕΝΩΝ) 

Μεταφορά μιας μεγάλης ποσότητας δεδομένων από ένα σύστημα ή μία θέση σε άλλο.

Πηγή: http://www.oxforddictionaries.com

ELI

(European legislation identifier)

Αναγνωριστικό ευρωπαϊκής νομοθεσίας: επιτρέπει την ενιαία αναγνώριση και την πρόσβαση σε εθνική και ενωσιακή νομοθεσία μέσω του διαδικτύου και εγγυάται την ευκολότερη πρόσβαση, την ανταλλαγή και την επαναχρησιμοποίηση της νομοθεσίας από δημόσιες αρχές, επαγγελματίες χρήστες, πανεπιστημιακούς και πολίτες.  Το ELI ανοίγει τον δρόμο για ένα σημασιολογικό ιστό νομικών και επίσημων εφημερίδων.

Πηγή: https://en.wikipedia.org/wiki/European_Legislation_Identifier

FOAF

(Friend of a friend)

Φίλος φίλου: μηχαναγνώσιμο λεξιλόγιο για την περιγραφή προσώπων, των δραστηριοτήτων τους και των σχέσεών τους με άλλα πρόσωπα και αντικείμενα. Το FOAF επιτρέπει σε ομάδες προσώπων να περιγράφουν κοινωνικά δίκτυα χωρίς την ανάγκη κεντρικής βάσης δεδομένων.

Πηγή: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

IMMC

Το ελάχιστο σύνολο στοιχείων μεταδεδομένων, ή βασικά μεταδεδομένα IMMC, που πρέπει να χρησιμοποιείται κατά την ανταλλαγή δεδομένων.

Πηγή: http://publications.europa.eu/mdr/core-metadata/

ISA 

(Interoperable Solutions for European Public Administrations)

Λύσεις διαλειτουργικότητας για τις ευρωπαϊκές δημόσιες διοικήσεις.

Πρόγραμμα που χρηματοδοτεί η Ευρωπαϊκή Επιτροπή με στόχο την απλούστευση των συναλλαγών μεταξύ διασυνοριακών και/ή διατομεακών δημόσιων διοικήσεων στην Ευρώπη.

Το πρόγραμμα ISA² είναι η συνέχεια του προγράμματος ISA, το οποίο ίσχυε το διάστημα 2010-2015. Το ISA² καλύπτει το διάστημα 2016-2020.

JSON

(JavaScript Object Νotation)

Σημειογραφία αντικειμένων JavaScript: ανοιχτός μορφότυπος που χρησιμοποιεί κείμενο αναγνώσιμο από τον άνθρωπο για να διαβιβάσει αντικείμενα των δεδομένων που αποτελούνται από ζεύγη χαρακτηριστικού/τιμής. Είναι ο συνηθέστερος μορφότυπος δεδομένων που χρησιμοποιείται για την ασύγχρονη επικοινωνία φυλλομετρητή/εξυπηρετητή (AJAJ).

Πηγή: https://en.wikipedia.org/wiki/JSON

MASHUP 

Συνδυασμός πολλαπλών συνόλων δεδομένων από πολλαπλές πηγές με σκοπό τη δημιουργία νέας υπηρεσίας, απεικόνισης ή πληροφορίας.

PDF

(Portable Document Format)

Ο μορφότυπος φορητού εγγράφου είναι μορφότυπος αρχείου που χρησιμοποιείται για την παρουσίαση και την ανταλλαγή εγγράφων ανεξάρτητα από το λογισμικό, το υλικό ή τα συστήματα λειτουργίας. Πρόκειται για ανοικτό πρότυπο που διατηρεί ο Διεθνής Οργανισμός Τυποποίησης.

Πηγή: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

PSI 

(Public Sector Information)

Πληροφορίες δημόσιου τομέα: είναι η ευρεία γκάμα πληροφοριών που οι φορείς του δημόσιου τομέα συγκεντρώνουν, παράγουν, αναπαράγουν και διαδίδουν σε πολλούς τομείς δραστηριοτήτων κατά την διεκπεραίωση των θεσμικών τους καθηκόντων.

Οι πληροφορίες αυτές μπορεί να καθίστανται διαθέσιμες βάσει διάφορων αδειών, όχι πάντα ανοικτών.

RDF 

(Resource Description Framework)

Πλαίσιο περιγραφής πόρων.

Δέσμη διεθνών προτύπων για την ανταλλαγή δεδομένων στον ιστό.  Το RDF βασίζεται στην ιδέα του εντοπισμού πραγμάτων με τη χρήση αναγνωριστικών ιστού ή HTTP URI και της περιγραφής πόρων ως προς τις απλές ιδιότητες και τις τιμές ιδιοτήτων.

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#rdf

RDFa

(Resource Description Framework in attributes)

Το πλαίσιο περιγραφής πόρων στα χαρακτηριστικά είναι μια σύσταση W3C που προσθέτει ένα σύνολο επεκτάσεων, όσον αφορά τα χαρακτηριστικά, σε  έγγραφα HTML, XHTML και άλλου τύπου XML έγγραφα για την ενσωμάτωση εμπλουτισμένων μεταδεδομένων εντός εγγράφων του ιστού.

Πηγή: https://en.wikipedia.org/wiki/RDFa

SDMX

(Statistical Data and Μetadata Εxchange)

Η ανταλλαγή στατιστικών δεδομένων και μεταδεδομένων είναι μια διεθνής πρωτοβουλία που στοχεύει στην τυποποίηση και τον εκσυγχρονισμό των μηχανισμών και των διαδικασιών ανταλλαγής στατιστικών δεδομένων και μεταδεδομένων μεταξύ διεθνών οργανισμών και των κρατών μελών τους.

Πηγή: https://en.wikipedia.org/wiki/SDMX

SEO

(Search Engine Οptimisation)

Βελτιστοποίηση της μηχανής αναζήτησης: η διαδικασία βέλτιστοποίησης της θέασης ενός ιστότοπου ή μιας ιστοσελίδας στα μη επί πληρωμή αποτελέσματα μιας μηχανής αναζήτησης.

Πηγή: https://en.wikipedia.org/wiki/Search_engine_optimization

SOLR

Πλατφόρμα ανοικτής πηγής για την αναζήτηση από επιχειρήσεις. Μεταξύ των κύριων χαρακτηριστικών της είναι η αναζήτηση πλήρους κειμένου, η καταμέτρηση των επισκέψεων, η αναζήτηση με συνθήκη, η δημιουργία ευρετηρίου σε πραγματικό χρόνο, η δημιουργία δυναμικού συμπλέγματος, η ενοποίηση βάσεων δεδομένων και ο χειρισμός «πλούσιων» κειμένων (π.χ. Word, PDF).

Πηγή: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL  

Η SPARQL (πρωτόκολλο Sparql και γλώσσα αναζήτησης RDF) είναι μια γλώσσα αναζήτησης δεδομένων RDF, ανάλογη με την SQL (Structured Query Language, δομημένη γλώσσα αναζήτησης) για σχεσιακές βάσεις δεδομένων.

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#sparql

TRIPLE, TRIPLESTORE (τριάδες, αποθετήρια τριάδων) 

Η Τriplestore είναι μια βάση δεδομένων που έχει ειδικά κατασκευαστεί για την αποθήκευση και την ανάκτηση τριάδων μέσω σημασιολογικών ερωτημάτων. Μία τριάδα είναι ενότητα δεδομένων που αποτελείται από υποκείμενο-κατηγόρημα-αντικείμενο, π.χ. «Ο Μπομπ είναι 35 χρόνων» ή «Ο Μπομπ γνωρίζει τον Φρεντ».

Όπως σε μεγάλο βαθμό και σε μία σχεσιακή βάση δεδομένων, οι πληροφορίες αποθηκεύονται σε αποθετήρια τριάδων και ανακτώνται μέσω μιας γλώσσας αναζήτησης. Αντίθετα από τις σχεσιακές βάσεις δεδομένων, ένα αποθετήριο τριάδων βελτιστοποιείται για την αποθήκευση και την ανάκτηση τριάδων. Εκτός από τα ερωτήματα, οι τριάδες μπορούν συνήθως να εισάγονται/εξάγονται σε RDF ή και άλλους μορφότυπους.

Πηγή: Wikipedia.org — http://en.wikipedia.org/wiki/Triplestore

URI

(Uniform Resource Identifier)

Ενιαίο αναγνωριστικό πόρων. Συμβολοσειρά που ταυτοποιεί με μοναδικό τρόπο κατ’ ουσίαν τα πάντα, είτε πρόκειται για ένα κτίριο είτε για πιο αφηρημένες έννοιες, όπως π.χ. τα χρώματα. Μπορεί να παραπέμπει ή όχι στον ιστό.

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL 

(Uniform Resource Locator)

Ενιαίος εντοπιστής πόρων.Γενικό αναγνωριστικό που κοινά αποκαλείται «διεύθυνση ιστού». Μια URL μπορεί να παραπέμπει στον ιστό. Όλες οι HTTP URL είναι URI· ωστόσο, όλα τα URI δεν είναι URL.

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Το όνομα ενιαίου πόρου (Uniform resource name) είναι η ιστορική ονομασία ενός ενιαίου αναγνωριστικού πόρων (URI).

Πηγή: https://en.wikipedia.org/wiki/Uniform_Resource_Name

WEB 1.0 

Η πρώτη γενιά του παγκόσμιου ιστού, που χαρακτηρίζεται από ξεχωριστούς στατικούς ιστότοπους αντί για συνεχώς επικαιροποιούμενα ιστολόγια και εργαλεία κοινωνικής δικτύωσης.

Πηγή: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0 

Η απλουστευμένη περιγραφή του τμήματος του παγκόσμιου ιστού ο οποίος χρησιμοποιεί τα μέσα κοινωνικής δικτύωσης, ιστολόγια, σχόλια χρηστών και βαθμολόγηση, καθώς και συναφείς δραστηριότητες με επίκεντρο τον άνθρωπο.

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0  

Η απλουστευμένη περιγραφή του τμήματος του παγκόσμιου ιστού που διαθέτει μηχαναγνώσιμα δεδομένα και την ικανότητα να πραγματοποιεί αναζητήσεις και αναλύσεις αυτών των δεδομένων. Θεωρείται συνώνυμη των φράσεων «σημειολογικός ιστός» και «ιστός των δεδομένων».

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#web-3.0

XML

(Extensible Markup Language)

Επεκτάσιμη γλώσσα σήμανσης: γλώσσα σήμανσης που καθορίζει μία δέσμη κανόνων για την κωδικοποίηση εγγράφων σε μορφότυπο αναγνώσιμο τόσο από τον άνθρωπο όσο και από μηχανές.

Πηγή: https://en.wikipedia.org/wiki/XML

ΑΝΑΛΥΣΗ (ΔΕΔΟΜΕΝΩΝ) 

Κατάτμηση μιας ομάδας δεδομένων σε μικρότερα τμήματα με την τήρηση ορισμένων κανόνων, έτσι ώστε να είναι ευκολότερη η ερμηνεία, η διαχείριση ή η διαβίβασή τους μέσω υπολογιστή.

Πηγή: http://www.businessdictionary.com/definition/parsing.html

ΑΝΙΧΝΕΥΣΗ (ΔΕΔΟΜΕΝΩΝ) 

Πρόκειται για πρόγραμμα που επισκέπτεται ιστότοπους και διαβάζει τις σελίδες τους και άλλες πληροφορίες προκειμένου να δημιουργήσει καταχωρίσεις για ένα ευρετήριο μηχανής αναζήτησης. Όλες οι κύριες μηχανές αναζήτησης στον ιστό διαθέτουν τέτοιο πρόγραμμα, γνωστό επίσης και ως «αράχνη».

Πηγή: http://searchsoa.techtarget.com/definition/crawler

Κατά την εξαγωγή δεδομένων από τον ιστό, ο όρος «ανίχνευση» αναφέρεται συχνά και ως «ιστοσυγκομιδή». Υπάρχει ωστόσο διαφορά μεταξύ αυτών των όρων: η εξαγωγή αφορά μεγάλες δέσμες δεδομένων, όπου κάποιος μπορεί να αναπτύξει δική του διάταξη ανίχνευσης, η οποία ανιχνεύει στα πιο βαθιά σημεία των ιστοσελίδων· η ιστοσυγκομιδή όμως αφορά την ανάκτηση πληροφοριών από οποιαδήποτε πηγή (όχι απαραίτητα από τον ιστό).

Πηγή: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

ΑΝΟΙΚΤΑ ΚΡΑΤΙΚΑ ΔΕΔΟΜΕΝΑ 

Δεδομένα που συγκεντρώνονται, παράγονται ή πληρώνονται από δημόσιους φορείς και διατίθενται δωρεάν προς επαναχρησιμοποίηση για οποιονδήποτε σκοπό.

ΑΝΟΙΚΤΑ ΠΡΟΤΥΠΑ 

Συνήθως πρόκειται για τα τεχνικά πρότυπα που δεν υπόκεινται σε περιορισμούς ως προς την άδεια. Μπορεί επίσης να πρόκειται για πρότυπα που έχουν αναπτυχθεί με τρόπο ουδέτερο ως προς τους πωλητές.

Πηγή: http://schoolofdata.org/handbook/appendix/glossary

ΑΡΧΕΣ ΣΥΝΔΕΔΕΜΕΝΩΝ ΔΕΔΟΜΕΝΩΝ

Οι αρχές συνδεδεμένων δεδομένων παρέχουν μια κοινή διεπαφή API για δεδομένα στον ιστό, η οποία είναι πιο λειτουργική από την ύπαρξη πολλών ξεχωριστών και διαφορετικά σχεδιασμένων API που δημοσιεύονται από μεμονωμένους παρόχους δεδομένων. Ο Tim Berners-Lee, εφευρέτης του ιστού και πρωτοπόρος της έννοιας των συνδεδεμένων δεδομένων, πρότεινε τις παρακάτω αρχές στις οποίες βασίζονται τα συνδεδεμένα δεδομένα:

  • να χρησιμοποιούνται URI για την ονομασία πραγμάτων·
  • να χρησιμοποιούνται HTTP URI έτσι ώστε οι ενδιαφερόμενοι και τα λογισμικά χρηστών να μπορούν να παραπέμπουν σε αυτά και να τα συμβουλεύονται  (dereferenced)·
  • όταν κάποιος συμβουλεύεται ένα URI, να παρέχει χρήσιμες πληροφορίες μέσω ανοικτών προτύπων ιστού, όπως μορφότυπων RDF ή Sparql·
  • κατά τη δημοσίευση στον ιστό, να αναφέρονται τα URI άλλων συναφών θεμάτων.

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#linked-data-principles

ΔΙΑΛΕΙΤΟΥΡΓΙΚΟΤΗΤΑ 

Ικανότητα των συστημάτων να ανταλλάσσουν πληροφορίες και να τις χρησιμοποιούν.

 

ΔΟΜΗΜΕΝΑ ΔΕΔΟΜΕΝΑ 

Δεδομένα που βρίσκονται σε σταθερά πεδία εντός φακέλου ή αρχείου. Οι σχεσιακές βάσεις δεδομένων και τα λογιστικά φύλλα είναι παραδείγματα δομημένων δεδομένων. Παρότι τα δεδομένα σε αρχεία XML δεν έχουν σταθερή θέση όπως οι παραδοσιακοί φάκελοι βάσεων δεδομένων, είναι ωστόσο δομημένα, επειδή τα δεδομένα είναι σημασμένα και μπορούν να ταυτοποιηθούν με ακρίβεια.

Πηγή: PC Magazine encyclopaedia — http://www.pcmag.com/encyclopedia/term/52162/structured-data

ΕΞΟΡΥΞΗ (ΔΕΔΟΜΕΝΩΝ)  

Η πρακτική της εξέτασης μεγάλων προϋπαρχουσών βάσεων δεδομένων με σκοπό τη δημιουργία νέων πληροφοριών.

Πηγή: http://www.oxforddictionaries.com

«Για παράδειγμα, μια αλυσίδα τροφίμων στο Midwest χρησιμοποίησε την ικανότητα εξόρυξης δεδομένων του λογισμικού Oracle για να αναλύσει τοπικά μοντέλα αγορών. Ανακάλυψε ότι, όταν άντρες αγοραστές αγόραζαν πάνες τις Πέμπτες και τα Σάββατα, συνήθιζαν να αγοράζουν επίσης μπίρες. Περαιτέρω ανάλυση έδειξε ότι οι αγοραστές αυτοί κατά κανόνα πραγματοποιούσαν τις αγορές της εβδομάδας τα Σάββατα. Αντίθετα, τις Πέμπτες αγόραζαν πολύ λίγα πράγματα. Ο έμπορος κατέληξε στο ότι αγόραζαν τις μπίρες για να τις έχουν διαθέσιμες για το Σαββατοκύριακο. Οι πληροφορίες αυτές μπορούν να χρησιμοποιηθούν από την εν λόγω επιχείρηση με διάφορους τρόπους με σκοπό την αύξηση των εσόδων. Για παράδειγμα, οι μπίρες θα μπορούσαν να τοποθετηθούν πιο κοντά στα ράφια με τις πάνες, ενώ και τα δύο είδη μπορούν να πωλούνται τις Πέμπτες στην πλήρη τιμή τους.»

Πηγή: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

 

ΛΕΞΙΛΟΓΙΟ 

Συλλογή όρων για έναν συγκεκριμένο σκοπό. Τα λεξιλόγια μπορούν να είναι είτε απλά, όπως τα ευρέως χρησιμοποιούμενα σχήματα RDF, FOAF και τα βασικά μεταδεδομένα του Δουβλίνου, είτε πολυσύνθετα λεξιλόγια με χιλιάδες όρους, όπως αυτά που χρησιμοποιούνται στον τομέα της περίθαλψης για την περιγραφή συμπτωμάτων, ασθενειών και θεραπευτικών αγωγών. Τα λεξιλόγια παίζουν σημαντικό ρόλο στα συνδεδεμένα δεδομένα· ειδικά βοηθούν στην ενσωμάτωση δεδομένων. Η χρήση αυτού του όρου συμπίπτει με τη χρήση του όρου «οντολογία».

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#vocabulary

ΜΑΖΙΚΗ ΤΗΛΕΦΟΡΤΩΣΗ 

Τηλεφόρτωση που περιέχει αρχεία από πολλαπλές συλλογές τα οποία μπορούν να ανακτώνται ταυτόχρονα.

ΜΕΤΑΔΕΔΟΜΕΝΑ 

Τα μεταδεδομένα είναι δομημένες πληροφορίες που περιγράφουν, εξηγούν, εντοπίζουν ή διευκολύνουν με άλλον τρόπο την ανάκτηση, τη χρήση ή τη διαχείριση ενός πόρου πληροφοριών. Τα μεταδεδομένα συχνά ονομάζονται και δεδομένα για δεδομένα.

Πηγή: NISO — http://www.niso.org/publications/press/UnderstandingMetadata.pdf

ΜΗ ΕΠΕΞΕΡΓΑΣΜΕΝΑ ΔΕΔΟΜΕΝΑ 

Έκφραση που αναφέρεται σε δεδομένα στην αρχική τους κατάσταση, τα οποία δεν έχουν υποστεί επεξεργασία, συγκέντρωση ή αλλοίωση με οποιονδήποτε άλλον τρόπο. Αναφέρονται επίσης ως «πρωτογενή».

ΜΗΤΡΩΟ ΜΕΤΑΔΕΔΟΜΕΝΩΝ (MDR) 

(Metadata Registry)

Το μητρώο μεταδεδομένων  είναι ένα σημαντικό εργαλείο διαλειτουργικότητας και τυποποίησης. Καταγράφει και διατηρεί δεδομένα ορισμών (στοιχεία μεταδεδομένων, καταλόγους αρχών, σχήματα κ.λπ.) που χρησιμοποιούνται από διάφορα ευρωπαϊκά όργανα.

http://publications.europa.eu/mdr/index.html

ΜΗΧΑΝΑΝΑΓΝΩΣΙΜΑ ΔΕΔΟΜΕΝΑ 

Μηχαναγνώσιμα είναι τα δεδομένα με μορφότυπο που μπορεί να ερμηνευτεί από ένα πρόγραμμα υπολογιστή. Υπάρχουν δύο είδη μηχαναγνώσιμων δεδομένων:

  • τα αναγνώσιμα από τον άνθρωπο δεδομένα που είναι σημειωμένα έτσι ώστε να μπορούν να τα κατανοήσουν και οι υπολογιστές, π.χ. μικροί μορφότυποι, RDFa·
  • μορφότυποι δεδομένων που προορίζονται κυρίως για υπολογιστές, π.χ. RDF, XML και JSON.

 

ΟΝΤΟΛΟΓΙΑ 

Επίσημο μοντέλο που επιτρέπει την παρουσίαση γνώσεων σε έναν συγκεκριμένο τομέα. Μια οντολογία περιγράφει τα είδη πραγμάτων (τάξεις), τις μεταξύ τους σχέσεις (ιδιότητες) και τους λογικούς τρόπους με τους οποίους μπορούν αυτές οι τάξεις και οι ιδιότητες να χρησιμοποιούνται μαζί (αξιώματα).

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#ontology

 

ΠΟΡΟΣ 

Η υλική αναπαράσταση ενός συνόλου δεδομένων. Πόρος μπορεί να είναι ένα αρχείο κάθε είδους, σύνδεσμος προς ένα αρχείο σε άλλη θέση του ιστού ή σύνδεσμος προς μία API. Για παράδειγμα, αν τα δεδομένα παρέχονται σε διάφορους μορφότυπους ή χωρισμένα σε διάφορους τομείς ή χρονικές περιόδους, κάθε αρχείο είναι ένας διαφορετικός πόρος που πρέπει να περιγράφεται ξεχωριστά.

ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ 

Εξέλιξη ή μέρος του παγκόσμιου ιστού που συνίσταται σε μηχαναγνώσιμα δεδομένα σε μορφότυπο RDF καθώς και στην ικανότητα αναζήτησης αυτών των δεδομένων με τυποποιημένους τρόπους  (π.χ. μέσω SPARQL).

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#semantic-web

ΣΥΓΚΟΜΙΔΗ (ΔΕΔΟΜΕΝΩΝ)  

Η διαδικασία της εξόρυξης δεδομένων σε μηχαναγνώσιμους μορφότυπους, τα οποία προέρχονται από πηγές που δεν είναι αποκλειστικά πηγές δεδομένων, για παράδειγμα ιστοσελίδες ή έγγραφα σε PDF. Συνήθως αναφέρεται μαζί και η πηγή (web scraping, PDF scraping).

Πηγές: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

ΣΥΝΔΕΔΕΜΕΝΑ ΔΕΔΟΜΕΝΑ 

Μέθοδος δημοσίευσης δομημένων δεδομένων έτσι ώστε να μπορούν να είναι αλληλένδετα. Βασίζεται σε συνήθεις τεχνολογίες ιστού, π.χ. HTTP και URI, αλλά, αντί να τις χρησιμοποιεί για ιστοσελίδες που προορίζονται για ανάγνωση από τον άνθρωπο, τις επεκτείνει στην ανταλλαγή πληροφοριών έτσι ώστε να είναι δυνατή η αυτόματη ανάγνωσή τους από υπολογιστές.

Πηγή: http://www.wikipedia.org

ΣΥΝΟΛΟ ΔΕΔΟΜΕΝΩΝ 

Μια συλλογή συναφών ομάδων δεδομένων που αποτελείται από διαφορετικά στοιχεία, αλλά ο χειρισμός της γίνεται σαν να ήταν ομάδα, και η εμφάνιση ή η τηλεφόρτωσή της μπορεί να γίνει σε έναν ή περισσότερους μορφότυπους. 

ΤΕΛΙΚΟ ΣΗΜΕΙΟ SPARQL 

Υπηρεσία που δέχεται ερωτήσεις SPARQ και επιστρέφει απαντήσεις ως σύνολα αποτελεσμάτων Sparql. Πρόκειται για βέλτιστη πρακτική προκειμένου οι πάροχοι συνόλων δεδομένων να δίνουν την URL του τελικού τους σημείου SPARQ, ώστε να παρέχουν πρόσβαση στα δεδομένα τους μέσω προγράμματος ή μέσω διασύνδεσης ιστού.

Πηγή: W3C — http://www.w3.org/TR/ld-glossary/#sparql-endpoint