Достъп до отворени данни на Европейския съюз
EUROPAПортал за отворени данни на ЕСТълковен речник
Menu
Преглед Учебни ресурси Проекти Sandbox

ТЪЛКОВЕН РЕЧНИК

ADMS

Съкращение от Asset Description Metadata Schema – „схема от метаданни за описание на активи“: речник за описване на активи за оперативната съвместимост, който дава възможност на разработчиците на информационни и комуникационни технологии (ИКТ) да изследват и търсят активи за оперативна съвместимост. ADMS позволява на публичните администрации, предприятията, органите по стандартизация и научните среди да:

  • описват семантични активи по съгласуван начин, така че те да могат да бъдат безпроблемно търсени и откривани от разработчиците на ИКТ чрез единна точка за достъп;
  • търсят, идентифицират, извличат и сравняват семантични активи с оглед на повторно използване, като се избягва дублирането и скъпото проектиране благодарение на единна точка за достъп;
  • поддържат своя собствена система за документиране и съхранение на семантични активи;
  • подобрят индексирането и видимостта на своите собствени активи;
  • свързват семантични активи в трансгранични и междусекторни условия.

Източник: https://joinup.ec.europa.eu/asset/adms/description

API 

Съкращение от Application Programming Interface – „интерфейс за приложно програмиране“.

Начин за комуникация между компютърните програми. Може да се разбира като начин, по който програмистът изпраща инструкции за взаимодействие между програмите.

Източник: http://schoolofdata.org/handbook/appendix/glossary

ГРУПОВО ИЗТЕГЛЯНЕ 

Изтегляне наведнъж на файлове от различни колекции, от които едновременно могат да бъдат извличани данни.

 

База данни

База данни е колекция от самостоятелни произведения, данни или материали, подредени по систематичен или методичен начин и индивидуално достъпни по електронен или друг път.

 

CKAN (Comprehensive Knowledge Archive Network)

Система за управление на данни, която предоставя достъп до данните чрез инструменти за рационализиране на публикуването, споделянето, намирането и използването им. CKAN е предназначена за издателите (национални и регионални правителства, предприятия и организации), които работят за предоставяне на отворен достъп до своите данни.

Източник: http://ckan.org/

CORDIS

Основното публично хранилище и портал на Европейската комисия за разпространяване на информация относно всички финансирани от ЕС научноизследователски проекти и на резултатите от тях.

Източник: http://cordis.europa.eu/home_en.html

ОБХОЖДАНЕ (ЗА ДАННИ) 

Извършва се от интернет робот (crawler), представляващ програма, която обхожда, т.е. посещава уебсайтове и чете съдържанието на страниците им и друга информация с цел създаване на записи за справочния апарат на търсачки. Всички основни търсачки в интернет разполагат с такава програма, известна също така като „паяк“ или „бот“.

Източник: http://searchsoa.techtarget.com/definition/crawler

За извличането на данни от интернет освен терминът „обхождане“ често се използва и „снемане“ или „събиране“ на данни. Съществува разлика между тези термини: обхождането се отнася до големи масиви от данни, като всеки може да разработи свои собствени интернет роботи (или ботове), които обхождат най-дълбоките части от уебстраниците; снемането на данни (data scraping), от друга страна, се отнася до извличане на информация от всякакви източници (не непременно уебстраници).

Източник: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

CSV

Файловият формат CSV (Comma Separated Values – файл, съдържащ разделени със запетая стойности) често се използва за обмен на данни между сходни приложения, т.е. приложни програми. CSV форматът може да се използва от приложенията за електронни таблици KSpread, OpenOffice Calc и Microsoft Excel. Много други приложения поддържат формата CSV за импортиране и експортиране на данни.

Източник: http://edoceo.com/utilitas/csv-file-format

МАСИВ ОТ ДАННИ 

Колекция от свързани набори от данни, съставена от отделни елементи, която обаче може да бъде третирана като едно цяло и предоставяна или изтегляна в един или повече формати.

DCAT 

Речник за каталози от данни.

Представлява речник RDF за осигуряване на оперативна съвместимост на каталози от данни.

Вижте също: W3C – http://www.w3.org/TR/vocab-dcat

DCAT-AP 

Профил на приложение DCAT. Общ речник за описване на масиви от данни, съхранявани на портали с данни в Европа, въз основа на DCAT.

Вижте също: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

ДЪМП (НА ДАННИ) 

Прехвърляне на голямо количество данни от една система или местоположение на друго.

Източник: http://www.oxforddictionaries.com

DCMI

Съкращение от Dublin Core Metadata Initiative – отворена организация, подпомагаща иновациите в проектирането на метаданни и най-добрите практики в областта.

Източник: http://dublincore.org/

ELI

Съкращение от European Legislation Identifier – „Европейски идентификатор на законодателството“, който дава възможност за еднозначно идентифициране и онлайн достъп до национално и европейско законодателство и за гарантиране на по-лесен достъп, обмен и повторно използване на законодателството от страна на обществени органи, професионални ползватели, представители на академичните среди и граждани. ELI проправя пътя към семантична мрежа на официалните вестници.

Източник: https://en.wikipedia.org/wiki/European_Legislation_Identifier

FOAF

Съкращение от Friend of a friend – „приятел на приятел“: машинночитаем описателен речник на лица, техните дейности и връзките им с други хора и предмети. FOAF позволява групи от хора да описват социални мрежи, без да се нуждаят от централизирана база данни.

Източник: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

JSON

Съкращение от JavaScript Object Notation – отворен стандарт, при който се използва четим от човека текст за обмен на обекти от данни, съставени от двойки атрибут – стойност. Това е най-популярният формат за данни, използван за асинхронна комуникация браузър/сървър (AJAJ).

Източник: https://en.wikipedia.org/wiki/JSON

СВЪРЗАНИ ДАННИ 

С понятието „свързани данни“ се описва метод за публикуване на структурирани данни, така че те да могат да бъдат свързвани помежду си. Този метод се основава на стандартни уебтехнологии като HTTP и URI, но вместо да ги използва за подаване на уебстраници за четене от хората той ги доразвива с цел споделяне на информация, която може да бъде автоматично разчитана от компютри.

Източник: http://www.wikipedia.org

ПРИНЦИПИ НА СВЪРЗАНИТЕ ДАННИ

Принципите на свързаните данни осигуряват общ интерфейс за приложно програмиране (API) за данните в интернет, който е по-подходящ, отколкото много от самостоятелно и различно проектираните API, публикувани от отделни доставчици на данни. Тим Бърнърс-Лий, изобретател на системата WWW на интернет и инициатор на проекта за свързани данни, предложи следните принципи, върху които се основават свързаните данни:

  • използване на унифицирани идентификатори на ресурси (URI) за назоваване на нещата;
  • използване на HTTP URI, така че нещата да могат да бъдат указвани и търсени от хора и потребителски агенти;
  • предоставяне на полезна информация чрез отворени интернет стандарти като RDF или SPARQL за значението на дадено URI;
  • включване на хипервръзки към други свързани неща, използвайки техните URI при публикуването в интернет.

Източник: W3C – http://www.w3.org/TR/ld-glossary/#linked-data-principles

IMMC

Минималният набор от елементи на метаданните, т.нар. основни метаданни IMMC, които да се използват при обмена на данни.

Източник: https://publications.europa.eu/mdr/core-metadata/

ОПЕРАТИВНА СЪВМЕСТИМОСТ 

Способността на системите да обменят информация и да използват обменената информация.

ISA 

Съкращение от Interoperable Solutions for (European Public) Administrations – „Оперативно съвместими решения за европейските публични администрации“.

Програма, финансирана от Европейската комисия, за улесняване на обмена на данни между публичните администрации в различни държави и сектори в Европа.

ISA² е продължението на програмата ISA, изпълнена в периода 2010 – 2015 г. ISA² се изпълнява от 2016 г. до 2020 г.

МАШИННОЧИТАЕМ 

Машинночитаеми са данните във формат, който може да бъде разчетен от компютърна програма. Съществуват два вида машинночитаеми данни:

  • читаеми от човека данни, които са маркирани, така че да са „разбираеми“ и от компютри, напр. микроформати или RDFa;
  • предназначени основно за компютри формати за данни – напр. JSON, XML и RDF.

MASHUP (СМЕСВАНЕ) 

Съчетаване на множество набори от данни от различни източници, за да се създаде нова услуга, визуализация или информация.

МЕТАДАННИ 

Метаданните представляват структурирана информация, която описва, обяснява, открива или улеснява по друг начин извличането, използването или управлението на информационни ресурси. Метаданните често се наричат данни относно данните.

Източник: NISO – http://www.niso.org/publications/press/UnderstandingMetadata.pdf

РЕГИСТЪР НА МЕТАДАННИТЕ (MDR) 

Регистърът на метаданните (Metadata Registry – MDR) е важен инструмент за оперативна съвместимост и стандартизация. В него са регистрирани и се съхраняват определителни данни (елементи на метаданни, номенклатурни списъци на административни органи, схеми и др.), използвани от различните европейски институции.

https://publications.europa.eu/mdr/index.html

ИЗВЛИЧАНЕ НА ЗНАНИЯ (ОТ ДАННИ) – DATA MINING 

Практиката на проучване на големи вече съществуващи бази данни с цел получаване на нова информация.

Източник: http://www.oxforddictionaries.com

„Така например верига за хранителни стоки в Midwest използва възможностите на софтуера Oracle за извличане на знания, с оглед да анализира местните модели на потребление. Тя откри, че когато мъже купуват памперси в четвъртък и събота, те също така са склонни да купят и бира. Допълнителен анализ показа, че тези купувачи обикновено пазаруват за цялата седмица в събота. В четвъртък обаче те купуват само няколко артикула. Търговецът заключава, че те купуват бирата за предстоящия уикенд. Веригата хранителни стоки би могла да използва тази нова информация по различни начини, за да увеличи своите приходи. Например тя би могла да премести бирата по-близо до памперсите, както и в четвъртък да продава бира и памперси без отстъпка в цената.“

Източник: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

ОНТОЛОГИЯ 

Формален модел, който позволява представянето на знанията в определена област. Онтологията описва видовете неща, които съществуват (класове), връзките между тях (свойства) и логическите начини, по които тези класове и свойства могат да се използват заедно (аксиоми).

Източник: W3C – http://www.w3.org/TR/ld-glossary/#ontology

ОТВОРЕНИ СТАНДАРТИ 

Възприемани обикновено като технически стандарти, за които няма ограничения, свързани с лицензиране. Този термин може също да се тълкува в смисъл, че те са разработени по начин, който не ги обвързва с конкретен търговец.

Източник: http://schoolofdata.org/handbook/appendix/glossary

ОТВОРЕНИ ПРАВИТЕЛСТВЕНИ ДАННИ 

Данни, които се събират, изготвят или финансират от обществени органи и се предоставят за свободна повторна употреба за всякакви цели.

СИНТАКТИЧЕН АНАЛИЗ (НА ДАННИ) 

Разбиване на блок от данни на по-малки части, следвайки набор от правила с цел по-лесно тълкуване, управление или предаване на данните от компютър.

Източник: http://www.businessdictionary.com/definition/parsing.html

PDF

Съкращение от Portable Document Format – „формат за преносими документи“: файлов формат, който се използва за представяне и обмен на документи, независимо от хардуера, софтуера или операционните системи. Отворен стандарт, поддържан от Международната организация по стандартизация.

Източник: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

ИОС 

Информация от обществения сектор – широката гама от информация, събирана, изготвяна, възпроизвеждана и разпространявана от органите от обществения сектор в много области на дейност при осъществяването на институционалните им задължения.

Достъпът до нея може да се предоставя съгласно различни лицензи, които не винаги са отворени.

НЕОБРАБОТЕНИ ДАННИ 

Израз, който се отнася до данни в първоначалния им вид, преди да са били обработени, обобщени или манипулирани по какъвто и да било друг начин. Те също така са известни като „първични“ данни.

RDF 

Съкращение от Resource Description Framework – „рамка за описване на ресурсите“.

Набор от международни стандарти за обмен на данни в интернет. RDF се основава на идеята за идентифициране на неща чрез уеб идентификатори или HTTP URI и за описване на ресурси чрез обикновени свойства и стойности на свойствата.

Източник: W3C – http://www.w3.org/TR/ld-glossary/#rdf

RDFa

Съкращение от Resource Description Framework in attributes – „рамка за описване на ресурсите чрез атрибути“: препоръка на W3C, според която към HTML, XHTML и различните видове XML-базирани документи се добавя набор от разширения на ниво атрибут с цел включване на богато съдържание от метаданни в интернет документите.

Източник: https://en.wikipedia.org/wiki/RDFa

РЕСУРС 

Физическото представяне на набор от данни. Ресурсът може да представлява файл от всякакъв вид, хипервръзка към файл другаде в интернет или хипервръзка към API. Например, ако данните се предоставят в различни формати или са разделени в различни области или периоди от време, всеки файл представлява отделен ресурс, който следва да бъде описан поотделно.

СЕМАНТИЧНА МРЕЖА 

Еволюция на или част от Световната мрежа (World Wide Web), която се състои от машинночитаеми данни в RDF формат и дава възможност за търсене на информацията по стандартни начини (например чрез SPARQL).

Източник: W3C – http://www.w3.org/TR/ld-glossary/#semantic-web

СНЕМАНЕ (НА ДАННИ) – DATA SCRAPING  

Процес на извличане на данни в машинночитаеми формати от източници, съдържащи не само данни – например уебстраници или документи във формат PDF. Често се допълва с вида на източника (снемане от уебстраници, снемане от PDF документи).

Източници: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

SDMX

Съкращение от Statistical Data and Metadata eXchange – „обмен на статистически данни и метаданни“: международна инициатива, насочена към стандартизиране и осъвременяване на процесите и механизмите за обмен на статистически данни и метаданни между международните организации и техните държави членки.

Източник: https://en.wikipedia.org/wiki/SDMX

SEO

Съкращение от Search Engine Optimisation – „оптимизация с оглед на търсачка“: процес на подобряване на забележимостта на даден уебсайт или отделна уебстраница в неплатените резултати от дадена интернет търсачка.

Източник: https://en.wikipedia.org/wiki/Search_engine_optimization

SOLR

Платформа с отворен код за търсене в корпоративна среда. Основните ѝ характеристики включват търсене в целия текст, осветяване на резултатите, фасетно търсене, индексиране в реално време, динамично формиране на клъстери, включване в бази данни и обработка на документи в богат формат (напр. Word, PDF).

Източник: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL 

Включва протокол и език за заявки за RDF данни, аналогичен на структурирания език за заявки (SQL) за релационни бази данни.

Източник: W3C – http://www.w3.org/TR/ld-glossary/#sparql

КРАЙНА ТОЧКА ЗА SPARQL 

Услуга, която въз основа на SPARQL приема заявки и връща отговори във вид на набори от резултати. Добра практика за доставчиците на данни е предоставянето на URL адреса на тяхната крайна точка за SPARQL, за да позволят програмен достъп до своите данни или достъп чрез уеб интерфейс.

Източник: W3C – http://www.w3.org/TR/ld-glossary/#sparql-endpoint

СТРУКТУРИРАНИ ДАННИ 

Данни, поместени в определени полета в запис или файл. Релационните бази данни и електронните таблици са примери за структурирани данни. Въпреки че местоположението на данните в XML файлове не е фиксирано, както в традиционните база данни, данните все пак са структурирани, тъй като са маркирани и могат да бъдат точно идентифицирани.

Източник: PC Magazine encyclopaedia – http://www.pcmag.com/encyclopedia/term/52162/structured-data

БАЗА ДАННИ ТИП TRIPLESTORE, ТРИПЛЕТ 

Triplestore е специално изградена база данни за съхранение и извличане на триплети чрез семантични заявки. Триплетът е набор от данни, съставен от подлог – сказуемо – допълнение, като например „Стоян е на 35“ или „Стоян познава Илия“.

Има голямо сходство с релационните бази данни, като информацията се съхранява в база данни тип triplestore и се извлича чрез език за заявки. За разлика от релационните бази данни triplestore е оптимизирана за съхранение и извличане на триплети. Освен заявявани триплетите обикновено могат да бъдат импортирани/експортирани, като се използват RDF и други формати.

Източник: Wikipedia.org – http://en.wikipedia.org/wiki/Triplestore

URI 

Съкращение от Uniform resource identifier – унифициран идентификатор на ресурс.

Низ, с който се идентифицира еднозначно почти всичко, включително физическа сграда или по-абстрактни понятия като цветове. Той може да препраща към уебстраница или друг ресурс в системата WWW, но и към нещо друго.

Източник: W3C – http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL 

Съкращение от Uniform resource locator – унифициран указател на ресурси.

Глобален идентификатор, обикновено наричан „интернет адрес“ или по-точно уеб адрес. URL препраща към уебстраница или друг ресурс в системата WWW. Всички HTTP URL адреси са и URI. В същото време не всички URI са URL адреси.

Източник: W3C – http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Съкращение от Uniform resource name – унифицираното наименование на ресурса: старото наименование за унифициран идентификатор на ресурс (URI).

Източник: https://en.wikipedia.org/wiki/Uniform_Resource_Name

РЕЧНИК 

Набор от термини за определена цел. Речниците могат да са опростени, като например широко използваните RDF, FOAF и набора от елементи на Dublin core metadata, или сложни, съдържащи хиляди термини, като например използваните в здравеопазването речници за описване на симптоми, болести и лечения. Речниците играят много важна роля в областта на свързаните данни, по-конкретно за подпомагане на интегрирането на данните. Използването на този термин се припокрива с това на „онтология“.

Източник: W3C – http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 1.0 

Първото поколение на Световната мрежа (World Wide Web – WWW), характеризиращо се с отделни статични уебсайтове, вместо с постоянно актуализирани уеблогове и инструменти за социални мрежи.

Източник: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0 

Разговорно наименование на частта от Световната мрежа (World Wide Web), даваща възможност за социални мрежи, блогове, коментари и рейтинги на потребителите и свързани дейности, насочени към хората.

Източник: W3C – http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0  

Разговорно наименование на частта от Световната мрежа (World Wide Web), даваща възможност за използване на машинночитаеми данни, изпращане на структурирани заявки за тези данни и тяхното анализиране. Счита се за синоним на понятията „семантична мрежа“ и „мрежа от данни“.

Източник: W3C – http://www.w3.org/TR/ld-glossary/#web-3.0

XML

От eXtensible Markup Language. Това е маркиращ език, дефиниращ набор от правила за представяне на документи във формат, който може да бъде едновременно разчитан от хора и машини.

Източник: https://en.wikipedia.org/wiki/XML