Acesso aos dados abertos da União Europeia
EUROPAPortal de Dados Abertos da UEGlossário
Menu
Apresentação Ferramentas Centro de recursos Projetos Sandbox

GLOSSÁRIO

ADATBÁZIS

Az adatbázis egymástól független alkotások, adatok vagy más anyagok rendszerbe foglalt vagy valamely módszer szerint strukturált gyűjteménye, melyben az egyes elemek elektronikusan vagy más módon külön-külön hozzáférhetőek.

 

ADMS

O esquema de metadados para a descrição de recursos (asset description metadata schema) é um vocabulário utilizado na descrição de recursos de interoperabilidade que permite aos programadores explorar e pesquisar esse tipo de recursos. O ADMS permite às administrações públicas, empresas, organismos de normalização e meios académicos:

  • descrever recursos semânticos segundo um método comum para que possam ser facilmente pesquisados, consultados e encontrados pelos programadores a partir de um único ponto de acesso;
  • pesquisar, identificar, extrair e comparar recursos semânticos para serem reutilizados a partir de um único ponto de acesso, evitando duplicações e dispendiosos trabalhos de conceção;
  • manter sistemas próprios de documentação e de armazenamento de recursos semânticos;
  • melhorar a indexação e visibilidade dos seus próprios recursos;
  • relacionar recursos semânticos em contextos transfronteiras e intersetoriais.

Fonte: https://joinup.ec.europa.eu/asset/adms/description

ANÁLISE DE DADOS 

Decomposição de um bloco de dados em partes mais pequenas de acordo com um conjunto de regras, de modo a poderem ser interpretados, geridos ou transmitidos mais facilmente por um computador.

Fonte: http://www.businessdictionary.com/definition/parsing.html

API 

Interface de Programação de Aplicações.

Trata-se de um sistema de comunicação entre programas informáticos. Comparável à forma como um programador envia instruções entre vários programas.

Fonte: http://schoolofdata.org/handbook/appendix/glossary

BASE DE DADOS

Uma base de dados é uma coletânea de obras, dados ou outros elementos independentes, dispostos de modo sistemático ou metódico e acessíveis individualmente por meios eletrónicos ou outros.

 

CKAN

Sistema de gestão de dados, que os torna acessíveis através da disponibilização de ferramentas para racionalizar a publicação, partilha, recuperação e utilização de dados. A plataforma CKAN destina-se a editores de dados (administrações nacionais e regionais, empresas e organizações) que querem que os seus dados sejam abertos e acessíveis.

Fonte: http://ckan.org/

CONJUNTO DE DADOS 

Coleção de conjuntos de dados relacionados entre si, composta por elementos distintos, mas que pode ser manipulada como uma unidade e consultada ou descarregada num ou mais formatos.

CORDIS

Principal portal e repositório público da Comissão Europeia para divulgação de informações sobre todos os projetos de investigação financiados pela UE e respetivos resultados.

Fonte: http://cordis.europa.eu/home_en.html

CSV

Formato de ficheiro com valores separados por vírgulas (comma separated values), que é frequentemente utilizado para o intercâmbio de dados entre diferentes aplicações da mesma categoria. O formato de ficheiro CSV é compatível com as aplicações de folhas de cálculo KSpread, OpenOffice Calc e Microsoft Excel. Muitas outras aplicações utilizam o formato CSV para a importação ou a exportação de dados.

Fonte: http://edoceo.com/utilitas/csv-file-format

DADOS ABERTOS DAS ADMINISTRAÇÕES PÚBLICAS 

Dados recolhidos, produzidos ou encomendados pelos organismos públicos e disponibilizados gratuitamente para qualquer tipo de reutilização.

DADOS ESTRUTURADOS 

Dados que residem em campos fixos dentro de um registo ou ficheiro. As bases de dados e folhas de cálculo relacionais são exemplos de dados estruturados. Embora os dados em ficheiros XML não sejam fixados em termos de localização, como nos registos de bases de dados tradicionais, são, apesar de tudo, estruturados porque os dados são etiquetados e podem ser claramente identificados.

Fonte: PC Magazine Encyclopaedia - http://www.pcmag.com/encyclopedia/term/52162/structured-data

DADOS LIGADOS 

Os dados ligados designam um método de publicação de dados estruturados de modo a permitir interligações. Este método assenta em tecnologias padrão da web como o protocolo HTTP e os URI que, em vez de serem utilizadas para mostrar páginas web a leitores humanos, permitem partilhar informações num formato que pode ser lido automaticamente por computadores.

Fonte: http://www.wikipedia.org

DADOS ORIGINAIS 

Dados no seu estado original, que não tenham sido tratados, agregados ou manipulado de nenhuma forma. Sinónimo de «dados primários».

DCAT 

Vocabulário de Catalogação de Dados (data catalogue vocabulary).

Vocabulário RDF que permite a interoperabilidade de catálogos de dados.

Ver também: W3C - http://www.w3.org/TR/vocab-dcat

DCAT-AP 

Perfil de Aplicação DCAT. Vocabulário comum, baseado no vocabulário de catalogação de dados, utilizado para descrever conjuntos de dados nos portais de dados europeus.

Ver também: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

 

DCMI

A Iniciativa de Metadados Dublin Core é uma organização aberta que apoia a inovação e boas práticas na conceção de metadados a nível do ecossistema dos metadados.

Fonte: http://dublincore.org/

DESCARGA DE DADOS 

Transferência de uma grande quantidade de dados de um sistema ou localização para outro.

Fonte: http://www.oxforddictionaries.com

DESCARREGAMENTO EM MASSA 

Descarregamento com ficheiros de várias coleções que podem ser recuperados de uma só vez.

ELI

Identificador Europeu da Legislação (European legislation identifier) que permite identificar e aceder à legislação nacional e europeia em linha e facilitar a consulta, o intercâmbio e a reutilização da legislação pelas autoridades públicas, os utilizadores profissionais, o meio académico e os cidadãos. O ELI abre o caminho para uma web semântica de boletins legislativos e jornais oficiais.

Fonte: https://en.wikipedia.org/wiki/European_Legislation_Identifier

EXPLORAÇÃO DE DADOS 

Método que consiste na análise de grandes bases de dados já existentes para criar novas informações.

Fonte: http://www.oxforddictionaries.com

«Por exemplo, uma cadeia de supermercados da região do Midwest recorreu às capacidades de exploração de dados de um programa informático Oracle para analisar os hábitos de compra locais. Descobriu-se que quando os homens compravam fraldas às quintas-feiras e aos sábados, também tendiam a comprar cerveja. Uma análise mais aprofundada revelou que estes consumidores faziam normalmente as suas compras semanais ao sábado, mas às quintas-feiras apenas compravam um pequeno número de produtos. A empresa concluiu que os clientes compravam a cerveja para consumi-la no fim de semana seguinte. A cadeia de supermercados poderia usar esta nova informação de diferentes formas para aumentar as receitas. Por exemplo, a empresa poderia deslocar a secção das cervejas para mais perto da secção das fraldas. Além disso, podia vender cervejas e fraldas sem descontos às quintas-feiras.»

Fonte: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

FOAF

«Amigo de Um Amigo» (friend of a friend) é um vocabulário legível por máquinas que descreve pessoas, as suas atividades e as suas relações com outras pessoas e objetos. O FOAF permite que grupos de pessoas possam descrever redes sociais sem necessidade de uma base de dados centralizada.

Fonte: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

IMMC

Conjunto mínimo de elementos de metadados, ou seja, os metadados de base do IMMC (Comité Interinstitucional de Manutenção de Metadados), que devem ser utilizados no intercâmbio de dados.

Fonte: http://publications.europa.eu/mdr/core-metadata/

INTEROPERABILIDADE 

Capacidade dos sistemas para trocar informações e utilizar as informações trocadas.

ISA 

Soluções de Interoperabilidade para as Administrações Públicas Europeias (Interoperable Solutions for European Public Administrations).

Programa financiado pela Comissão Europeia com vista a facilitar as transações transfronteiras e/ou intersetoriais entre as administrações públicas da Europa.

O programa ISA², que cobre o período de 2016 a 2020, é o sucessor do programa ISA, que teve início em 2010 e terminou em 2015.

JSON

A Notação de Objetos JavaScript (JavaScript object notation) é um formato aberto que utiliza texto legível por pessoas para transmitir objetos de dados constituídos por pares atributo/valor. É o formato de dados mais utilizados para a comunicação assíncrona navegador/servidor (AJAJ).

Fonte: https://en.wikipedia.org/wiki/JSON

LEGÍVEL POR MÁQUINA 

Os dados legíveis por máquina são dados cujo formato pode ser interpretado por um programa informático. Existem dois tipos de dados legíveis por máquina:

  • dados legíveis por pessoas que são formatados de modo a também serem entendidos por computadores, como por exemplo, microformatos, RDFa;
  • formatos de dados destinados essencialmente a computadores, por exemplo, RDF, XML e JSON.

MISTURA DE DADOS 

Combinação de diferentes conjuntos de dados provenientes de fontes múltiplas de forma a criar um novo serviço, visualização ou informação.

METADADOS 

Informações estruturadas que permitem descrever, explicar ou localizar recursos de informação, ou seja que tornam mais fácil a sua recuperação, utilização ou gestão. Os metadados também podem ser definidos como dados referentes a dados.

Fonte: NISO - http://www.niso.org/publications/press/UnderstandingMetadata.pdf

NORMAS ABERTAS 

Geralmente entendidas como normas técnicas sem restrições em matéria de licenças. Também podem designar normas elaboradas sem estarem associadas a um fornecedor específico.

Fonte: http://schoolofdata.org/handbook/appendix/glossary

ONTOLOGIA 

Modelo formal que permite a representação dos conhecimentos num domínio específico. Uma ontologia define o tipo de objetos que existem (classes), as relações entre eles (propriedades) e os meios lógicos de combinar essas classes e essas propriedades (axiomas).

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#ontology

PDF

O Formato de Documento Portátil (portable document format) é um formato de ficheiro utilizado para apresentar e trocar documentos de forma independente do software, do equipamento informático e do sistema operativo utilizados. Esta norma aberta é mantida pela Organização Internacional de Normalização (ISO).

Fonte: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

PRINCÍPIOS DOS DADOS LIGADOS

Os princípios dos dados ligados oferecem uma API comum para os dados da Internet que é mais prática do que muitas das API concebidas separadamente e de forma distinta e publicada por fornecedores de dados individuais. Tim Berners-Lee, inventor da web e iniciador do projeto dos dados ligados, propôs os seguintes princípios para os dados ligados:

  • utilizar URI para designar objetos;
  • utilizar URI em formato HTTP para que os objetos possam ser referidos e consultados (desreferenciados) por pessoas e agentes utilizadores;
  • fornecer informações úteis através de normas web abertas, como RDF ou SPARQL, quando alguém consulta um URI;
  • incluir ligações para outros objetos relacionados mencionando os respetivos URI quando da publicação na Internet.

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#linked-data-principles

PSI 

Informações do Setor Público (Public Sector Information). Vasto leque de informações que os organismos do setor público recolhem, produzem, reproduzem e divulgam em muitos domínios de atividade no âmbito das suas funções institucionais.

Essas informações podem ser disponibilizadas ao abrigo de uma série de licenças, nem todas abertas.

RASPAGEM DE DADOS  

Extração de dados em formatos legíveis por máquina a partir de fontes que não são puramente de dados, como, por exemplo, páginas web ou documentos PDF. Expressão muitas vezes seguida da fonte (raspagem web, raspagem PDF).

Fontes: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

RASTREAMENTO DE DADOS 

Um rastreador é um programa que visita sítios web e lê páginas e outras informações para criar entradas no índice de um motor de pesquisa. A maioria dos principais motores de pesquisa na Internet utilizam este tipo de programa, também conhecido por aranha ou robô.

Fonte: http://searchsoa.techtarget.com/definition/crawler

Quando se fala de extração de dados da web, muitas vezes o termo «rastreamento» (crawling) também é referido como «raspagem» (data scraping) ou «recolha» (harvesting). Há uma diferença entre estes termos: o rastreamento refere-se à gestão de conjuntos de dados de grandes dimensões reunidos através de rastreadores (crawlers ou bots) que avançam até às partes mais profundas das páginas web; a raspagem de dados, por outro lado, refere-se à extração de informações de qualquer fonte (não necessariamente sítios web).

Fonte: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

RDF 

Quadro de descrição de recursos (Resource description framework).

Família de normas internacionais para o intercâmbio de dados na web. O RDF assenta no princípio da identificação de objetos através de identificadores web ou URI em protocolo HTTP e da descrição de recursos em termos de propriedades e valores de propriedade simples.

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#rdf

RDFa

O Quadro de Descrição de Recursos em Atributos (Resource description framework in attributes) é uma recomendação do Consórcio World Wide Web (W3C) que acrescenta uma série de extensões na categoria dos atributos aos formatos HTML e XHTML e a vários tipos de documentos baseados em XML de forma a permitir a integração de metadados aos documentos web.

Fonte: https://en.wikipedia.org/wiki/RDFa

RECURSO 

Representação física de um conjunto de dados. Um recurso pode ser um ficheiro de qualquer tipo, uma ligação a um ficheiro algures na web ou uma ligação a uma interface de programação de aplicações. Por exemplo, se os dados são fornecidos em diversos formatos ou classificados em domínios ou períodos de tempo diferentes, cada ficheiro é um «recurso» diferente que deve ser descrito individualmente.

REGISTO DE METADADOS (MDR) 

O Registo de Metadados é uma importante ferramenta de interoperabilidade e de normalização. O MDR regista e mantém dados de definição (elementos de metadados, listas de autoridades designadas, esquemas, etc.) utilizados pelas diferentes instituições europeias.

Fonte: http://publications.europa.eu/mdr/index.html

SDMX

O intercâmbio de dados e metadados estatísticos (statistical data and metadata exchange) é uma iniciativa internacional que visa normalizar e modernizar os mecanismos e os procedimentos de intercâmbio de dados e metadados estatísticos entre organizações internacionais e os países membros.

Fonte: https://en.wikipedia.org/wiki/SDMX

SEO

Otimização para motores de pesquisa (search engine optimisation): processo que visa influenciar de forma positiva a visibilidade de um sítio web ou de uma página web nos resultados não pagos de um motor de pesquisa.

Fonte: https://en.wikipedia.org/wiki/Search_engine_optimization

SOLR

Uma plataforma de fonte aberta para pesquisas. As suas principais características são: pesquisa em texto integral, destaque de resultados, pesquisa facetada, indexação em tempo real, agrupamento dinâmico, integração de bases de dados e tratamento de documentos formatados (por exemplo, Word, PDF).

Fonte: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL 

O Protocolo SPARQL e Linguagem de Pesquisa RDF é uma linguagem de consulta de dados RDF, semelhante à linguagem de consulta estruturada (SQL) para bases de dados relacionais.

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#sparql

TERMINAL SPARQL 

Serviço que aceita consultas SPARQL e oferece respostas a essas consultas como conjuntos de resultados SPARQL. Trata-se de um conjunto de boas práticas para os fornecedores de conjuntos de dados cederem o URL do seu terminal SPARQL de forma a permitirem o acesso aos seus dados através de programas ou através de uma interface web.

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#sparql-endpoint

TRIPLOS, BASE DE TRIPLOS 

Uma base de triplos é uma base de dados para o armazenamento e a extração de triplos através de consultas semânticas. Um triplo é uma entidade de dados composto por sujeito-predicado-objeto como «Roberto tem 35 anos» ou «Roberto conhece Frederico».

Tal como uma base de dados relacional, as informações são armazenadas numa base de triplos e extraídas através de uma linguagem de consulta. Ao contrário de uma base de dados relacional, uma base de triplos está otimizada para o armazenamento e extração de triplos. Para além das consultas, os triplos podem geralmente ser importados/exportados utilizando RDF e outros formatos.

Fonte: Wikipedia.org - http://en.wikipedia.org/wiki/Triplestore

URI 

Identificador uniforme de recursos (uniform resource identifier).

Sequência de carateres que identifica de forma inequívoca praticamente tudo, quer seja uma construção física quer conceitos mais abstratos como as cores. Pode ou não ser resolúvel na web.

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL 

Localizador uniforme de recursos (uniform resource locator).

Identificador global vulgarmente designado por «endereço web». Um URL pode ser resolúvel na web. Todos os URL HTTP são URI, mas nem todos os URI são URL.

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Nome uniforme de recursos (uniform resource name) é como se designa tradicionalmente um identificador uniforme de recursos.

Fonte: https://en.wikipedia.org/wiki/Uniform_Resource_Name

VOCABULÁRIO 

Conjunto de termos para um fim específico. Os vocabulários podem ser simples, tais como, por exemplo, o esquema RDF, o vocabulário FOAF e o conjunto de elementos de metadados Dublin Core, ou complexos com milhares de termos, tais como os que são utilizados na prestação de cuidados de saúde para descrever sintomas, doenças e tratamentos. Os vocabulários desempenham um papel muito importante no domínio dos dados ligados, especificamente para ajudar com a integração de dados. A utilização deste termo coincide com a do termo «ontologia».

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 1.0 

Primeira geração da rede mundial de computadores caracterizada por sítios estáticos separados, em vez de blogues e ferramentas de redes sociais continuamente atualizados.

Fonte: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0 

Descrição informal da parte da rede mundial de computadores que inclui redes sociais, blogues, comentários e classificações dos utilizadores e atividades relacionadas com as pessoas.

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0  

Descrição informal da parte da rede mundial de computadores que inclui dados legíveis por máquina e que tem capacidade para executar consultas e análises distribuídas desses dados. É sinónimo das expressões «web semântica» e «web de dados».

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#web-3.0

WEB SEMÂNTICA 

Evolução ou parte da rede mundial de computadores (WWW) que consiste em dados legíveis por máquina em formato RDF e a possibilidade de consultar essa informação através de métodos normalizados (por exemplo, através do protocolo SPARQL).

Fonte: W3C - http://www.w3.org/TR/ld-glossary/#semantic-web

XML

Linguagem de marcação extensível (extensible markup language). Linguagem de marcação de dados que define um conjunto de regras de codificação de documentos num formato que é legível por pessoas e por máquinas.

Fonte: https://en.wikipedia.org/wiki/XML