Acceso a los datos abiertos de la Unión Europea
EUROPAPortal de datos abiertos de la UEGlosario
Menu
Resumen Herramientas Centro de conocimientos Proyectos

Glosario

 

ADMS

El esquema de metadatos de descripción de recursos (asset description metadata schema, ADMS) es un vocabulario que describe los recursos de interoperabilidad que permiten a los desarrolladores de TIC explorar y buscar recursos de este tipo. El ADMS permite a las administraciones públicas, las empresas, los organismos de normalización y los centros académicos:

  • describir recursos semánticos de forma común para que los desarrolladores de TIC puedan descubrirlos y hacer búsquedas cruzadas a partir de un punto de acceso único;
  • buscar, identificar, extraer y comparar a través de un punto de acceso único los recursos semánticos para que puedan reutilizarse y evitar así la duplicación de esfuerzos y costosos trabajos de desarrollo;
  • mantener su propio sistema de documentación y almacenamiento de recursos semánticos;
  • mejorar la indexación y visibilidad de sus propios recursos;
  • vincular recursos semánticos activos en contextos transfronterizos o intersectoriales.

Fuente: https://joinup.ec.europa.eu/asset/adms/description

ANÁLISIS DE DATOS 

Descomponer un bloque de datos en pedazos más pequeños, según una serie de normas, para facilitar su interpretación, gestión o transmisión informática.

Fuente: http://www.businessdictionary.com/definition/parsing.html

API 

Interfaz de programación de aplicaciones

Un modo que tienen los programas informáticos de comunicarse entre sí. Puede entenderse como la forma en que los programadores envían instrucciones entre programas.

Fuente: http://schoolofdata.org/handbook/appendix/glossary

BASE DE DATOS

Una base de datos es una recopilación de obras, datos o elementos independientes dispuestos de manera sistemática o metódica y accesibles individualmente por medios electrónicos o de otro tipo.

 

CKAN

Sistema de gestión de datos que los hace accesibles gracias a herramientas que facilitan su publicación, intercambio, búsqueda y utilización. CKAN se destina a editores de datos (administraciones, empresas y organizaciones nacionales y regionales) que quieren mantener sus datos abiertos y disponibles.

Fuente: http://ckan.org/

CORDIS

Principal portal y repositorio público de la Comisión Europea que difunde información sobre todos los proyectos de investigación financiados por la UE y sus resultados.

Fuente: http://cordis.europa.eu/home_en.html

Fuente: https://www.promptcloud.com/blog/data-scraping-vs-data-crawling

CSV

Siglas inglesas de «valores separados por coma», formato de fichero que suele emplearse para intercambiar datos entre aplicaciones diferentes aunque similares. Pueden utilizar el formato CSV aplicaciones tales como KSpread, OpenOffice Calc y Microsoft Excel. Otras muchas aplicaciones pueden admitir el formato CSV para importar o exportar datos.

Fuente: http://edoceo.com/utilitas/csv-file-format

CONJUNTO DE DATOS 

Colección de conjuntos de datos relacionados, compuesta por elementos independientes, pero que puede utilizarse como unidad a la que se accede o que se descarga en uno o varios formatos.

DATOS ABIERTOS DE LA ADMINISTRACIÓN PÚBLICA 

Datos recogidos, elaborados o financiados por organismos públicos y puestos a libre disposición para su reutilización para cualquier fin.

DATOS BRUTOS 

Datos en su estado inicial, sin haber sido tratados, agregados o manipulados de cualquier otra manera. También se denominan «datos primarios».

DATOS ENLAZADOS 

Los datos vinculados o enlazados («linked data») describen un método de publicación de datos estructurados que permite interconectarlos. Se basa en normas y tecnologías web estándar como HTTP y URI, pero, en lugar de utilizarlas para servir páginas web a lectores humanos, las amplía para compartir la información de modo que los ordenadores puedan leerla automáticamente.

Fuente: http://www.wikipedia.org

DATOS ESTRUCTURADOS 

Datos registrados en los campos fijos de un registro o archivo. Son ejemplos de datos estructurados las bases de datos relacionales y las hojas de cálculo. Aunque en los ficheros XML los datos no estén fijos en una ubicación (como en los registros de las bases de datos tradicionales), no dejan de ser datos estructurados, pues están marcados y pueden identificarse con precisión.

Fuente: PC Magazine encyclopaedia — http://www.pcmag.com/encyclopedia/term/52162/structured-data

DCAT 

Vocabulario de catalogación de datos.

Vocabulario RDF que facilita la interoperabilidad entre catálogos de datos.

Véase también: W3C — http://www.w3.org/TR/vocab-dcat

DCAT-AP 

Perfil de aplicación DCAT. Vocabulario común, basado en DCAT, que permite describir los conjuntos de datos albergados en los portales de datos europeos.

Véase también: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

DCMI

Iniciativa de metadatos «Dublin core», organización abierta de apoyo a la innovación en el diseño de metadatos y a las mejores prácticas en materia de metadatos.

Fuente: http://dublincore.org/

DESCARGA EN MASA 

Descarga de ficheros pertenecientes a varias colecciones efectuada de una sola vez.

ELI

Siglas inglesas de identificador europeo de legislación, que permite identificar de forma única y facilitar el acceso en línea a la legislación nacional y europea, de modo que las administraciones públicas, los profesionales, las instituciones académicas y los ciudadanos puedan intercambiarla y reutilizarla. ELI allana el camino hacia una red semántica de boletines y diarios oficiales.

Fuente: https://en.wikipedia.org/wiki/European_Legislation_Identifier

FOAF

«Friend of a friend» («amigo de un amigo») es un vocabulario descriptivo legible por máquina que describe personas, sus actividades y sus relaciones con otras personas y objetos. FOAF permite a grupos de personas describir redes sociales sin necesidad de una base de datos centralizada.

Fuente: https://en.wikipedia.org/wiki/FOAF_%28ontology%29

IMMC

Conjunto mínimo de elementos de metadatos, los denominados «metadatos básicos IMMC», que deben utilizarse para intercambiar datos.

Fuente: http://publications.europa.eu/mdr/core-metadata/

INTEROPERABILIDAD 

Capacidad de los sistemas de intercambiar información y utilizar la información intercambiada.

ISA 

Soluciones de interoperatividad para las administraciones públicas europeas.

Es un programa financiado por la Comisión Europea para facilitar las transacciones transfronterizas o intersectoriales entre las administraciones públicas europeas.

ISA² es el programa sucesor de ISA, que abarcó el período 2010-2015. ISA² se aplica desde 2016 hasta 2020.

ISP 

Información del sector público. Es toda la información que los organismos del sector público producen, reproducen y difunden en numerosos campos de actividad al desempeñar sus funciones institucionales.

Puede ponerse a disposición bajo toda una serie de licencias, no siempre abiertas.

LEGIBLE POR MÁQUINA 

Datos legibles por máquina son datos en un formato tal que un programa informático puede interpretarlos. Hay dos tipos de datos legibles por máquina:

  • datos en lenguaje natural, pero marcados de manera que puedan leerlos tanto personas como ordenadores; por ejemplo, microformatos o RDFa,
  • formatos de datos destinados principalmente a ordenadores, tales como RDF, XML y JSON.

JSON

«JavaScript Object Notation» es un formato abierto que utiliza lenguaje natural para transmitir objetos de datos compuestos por pares atributo-valor. Es el formato más comúnmente utilizado para la comunicación asíncrona entre navegador y servidor (AJAJ).

Fuente: https://en.wikipedia.org/wiki/JSON

MASHUP 

Combinación de conjuntos múltiples de datos procedentes de fuentes múltiples para crear un nuevo servicio, visualización o información.

METADATOS 

Por metadatos se entiende información estructurada que describe, explica, localiza o, en general, facilita obtener, utilizar o gestionar un recurso informático. A menudo se definen como "datos sobre datos".

Fuente: NISO — http://www.niso.org/publications/press/UnderstandingMetadata.pdf

MINERÍA DE DATOS 

Práctica de examinar grandes bases de datos ya existentes para generar nueva información.

Fuente: http://www.oxforddictionaries.com

«Por ejemplo, una cadena de supermercados utilizó la capacidad de extracción de datos de Oracle para analizar los hábitos de compra de la población. Se comprobó que, cuando los hombres compraban pañales los jueves y los sábados, también tendían a comprar cerveza. Un análisis más detallado demostró que estos compradores no solían hacer la compra el sábado. Pero los jueves solo compraban unos pocos artículos. El minorista concluyó que compraban cerveza para consumirla el fin de semana. Ahora el supermercado podía utilizar esta información de varias maneras para aumentar sus ingresos. Por ejemplo, podía colocar el puesto de la cerveza más cerca del puesto de los pañales. O, los jueves, vender tanto la cerveza como los pañales sin ningún descuento.»

Fuente: http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

NORMAS ABIERTAS 

Se entienden en general como normas técnicas libres de restricciones de licencias. También pueden interpretarse en el sentido de normas neutras desde el punto de vista comercial.

Fuente: http://schoolofdata.org/handbook/appendix/glossary

ONTOLOGÍA 

Modelo formal que permite representar los conocimientos de un determinado campo. Una ontología describe los tipos de cosas que existen (clases), las relaciones entre ellas (propiedades) y las formas lógicas en las que pueden utilizarse juntas esas clases y propiedades (axiomas).

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#ontology

PRINCIPIOS PARA DATOS ENLAZADOS

Los principios para datos enlazados ofrecen una API común para datos web, lo que resulta más práctico que unas API publicadas por separado y diseñadas de distintas maneras por los proveedores de datos. Tim Berners-Lee, inventor de la web y fundador del proyecto de datos enlazados, propuso los siguientes principios:

  • utilizar URI para designar cosas,
  • utilizar el HTTP de los URI para que las personas y agentes de usuario puedan localizar y consultar (desreferenciar) las cosas,
  • cuando alguien busca un URI, proporcionar información útil mediante normas web estándar, como RDF o SPARQL,
  • al publicar en la web, incluir enlaces a otras cosas relacionadas mediante su URI.

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#linked-data-principles

PDF

El «formato de documento portátil» es un formato de fichero utilizado para presentar e intercambiar documentos con independencia del software, el hardware o el sistema operativo utilizados. Es una norma abierta de la Organización Internacional de Normalización.

Fuente: https://acrobat.adobe.com/be/en/products/about-adobe-pdf.html

PUNTO FINAL (endpoint) SPARQL 

Servicio que acepta consultas SPARQL y presenta las respuestas en forma de conjuntos de resultados SPARQL. Es un conjunto de mejores prácticas para que los proveedores de conjuntos de datos faciliten el URL de su punto final SPARQL y así permitan el acceso a sus datos a través de un programa o una interfaz web.

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#sparql-endpoint

RDF 

Siglas inglesas de marco de descripción de recursos.

Familia de normas internacionales para el intercambio de datos en la web. Se basa en la idea de identificar objetos a través de identificadores web o URI de tipo HTTP y describir los recursos mediante propiedades y valores de propiedad sencillos.

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#rdf

RDFa

El marco de descripción de recursos en atributos es una recomendación del W3C que añade una serie de ampliaciones a los atributos de varios tipos de documentos HTML, XHTML y XML con vistas a integrar metadatos ricos en los documentos web.

Fuente: https://en.wikipedia.org/wiki/RDFa

RECURSO 

Representación física de un conjunto de datos. Cada recurso puede ser un fichero de cualquier tipo, un enlace a un fichero en otro lugar de la red o un enlace a una API. Por ejemplo, si los datos se suministran en varios formatos diferentes o se dividen por regiones o períodos diferentes, cada fichero es un «recurso» que debe describirse de forma individual.

RASPADO DE DATOS  

El «scraping» o raspado de datos es un proceso de extracción de datos en formato legible por máquina a partir de fuentes de datos no puros; por ejemplo, páginas web o documentos PDF. A menudo se indica la fuente (raspado de páginas web, raspado de documentos PDF).

Fuentes: http://en.wikipedia.org/wiki/Data_scraping

http://schoolofdata.org/handbook/appendix/glossary

RASTREAR (DATOS) 

Un rastreador («crawler») es un programa que visita sitios web y lee sus páginas y demás información para crear entradas en el índice de un motor de búsqueda. Todos los grandes motores de búsqueda de la web tienen un programa de este tipo, que también se denomina "spider" (araña) o "bot" (robot).

Fuente: http://searchsoa.techtarget.com/definition/crawler

Cuando se extraen datos de la web, además de rastreo («crawling»), también se utilizan los términos «scraping» («raspado») o «harvesting» («recolección»). Existe una diferencia entre estos términos: rastrear («crawling») se utiliza en relación con grandes conjuntos de datos, para los cuales alguien desarrolla su propio rastreador (o «bot»), que rastrea hasta los rincones más profundos de las páginas nuevas. En cambio, «scraping» (raspado de datos) significa recuperar información de cualquier fuente (no necesariamente la web).

REGISTRO DE METADATOS 

El registro de metadatos (siglas en inglés, MDR) es una herramienta importante para la interoperabilidad y la normalización. Permite registrar y mantener los datos de definición (elementos de metadatos, listas de autoridades nombradas , esquemas, etc.) utilizados por las distintas instituciones europeas.

http://publications.europa.eu/mdr/index.html

VOLCADO DE DATOS («data dump») 

Transferencia de un gran volumen de datos de un sistema o ubicación a otro.

Fuente: http://www.oxforddictionaries.com

SDMX

Siglas en inglés de intercambio de datos y metadatos estadísticos, iniciativa internacional destinada a normalizar y modernizar los mecanismos y procesos de intercambio de datos y metadatos estadísticos entre las organizaciones internacionales y sus países miembros.

Fuente: https://en.wikipedia.org/wiki/SDMX

SEO

Siglas inglesas de optimización de motores de búsqueda: mejorar la visibilidad de un sitio o página web dentro los resultados no de pago de un motor de búsqueda.

Fuente: https://en.wikipedia.org/wiki/Search_engine_optimization

SOLR

Plataforma comercial de búsqueda de código abierto. Sus principales características son: búsqueda de texto completo, resaltado, búsqueda por facetas, indexación en tiempo real, agrupamiento (clustering) dinámico, integración de bases de datos y tratamiento de documentos ricos (Word, PDF, etc.).

Fuente: https://en.wikipedia.org/wiki/Apache_Solr

SPARQL 

El protocolo y lenguaje de consulta RDF (SPARQL) define un lenguaje de consulta de datos RDF análogo al lenguaje de consulta estructurado (SQL) propio de las bases de datos relacionales.

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#sparql

TRIPLESTORE, TRIPLE 

Un «triplestore» es una base de datos creada específicamente para almacenar y extraer «triples» a través de consultas semánticas. Un triple es una entidad compuesta por un sujeto, un predicado y un objeto: por ejemplo, «María tiene gatos» o «Pedro conoce París».

Como en las bases de datos relacionales, la información se almacena en un «triplestore» y se extrae mediante un lenguaje de consulta. Pero, a diferencia de aquellas, los triplestores están optimizados para almacenar y extraer triples. Además de las consultas, los triples suelen poder importarse y exportarse en formato RDF y otros.

Fuente: Wikipedia.org — http://en.wikipedia.org/wiki/Triplestore

URI 

Siglas inglesas de identificador uniforme de recursos.

Cadena de caracteres que identifica de modo único prácticamente cualquier cosa, desde objetos físicos (edificios) hasta conceptos abstractos (colores). Puede o no resolverse en la web.

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-identifier

URL 

Siglas inglesas de localizador uniforme de recursos.

Identificador global comúnmente denominado «dirección». Los URL pueden resolverse en la web. Todos los HTTP son URL que también son URI, pero no todos los URI son URL.

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#uniform-resource-locator

URN

Siglas inglesas de nombre uniforme de recurso, denominación histórica de un identificador uniforme de recursos (URI).

Fuente: https://en.wikipedia.org/wiki/Uniform_Resource_Name

VOCABULARIO 

Colección de términos para un determinado propósito. Los vocabularios pueden ser desde sencillos —como los muy utilizados RDF, FOAF o el conjunto de elementos de metadatos «Dublin core» — hasta vocabularios complejos y con miles de términos, como los utilizados en sanidad para describir síntomas de enfermedades y tratamientos. Los vocabularios desempeñan un papel muy importante en los datos enlazados, sobre todo de cara a la integración de datos. En su empleo, el término se solapa con «ontología».

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#vocabulary

WEB 1.0 

Primera generación de la World Wide Web, caracterizada por sitios independientes y estáticos, en lugar de blogs y herramientas de redes sociales en continuo proceso de actualización.

Fuente: http://en.wiktionary.org/wiki/Web_1.0

WEB 2.0 

Expresión coloquial que designa aquella parte de la World Wide Web que se centra en actividades humanas: redes sociales, blogs, comentarios y calificaciones de los usuarios, etc.

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#web-2.0

WEB 3.0  

Expresión coloquial que designa aquella parte de la World Wide Web que utiliza datos legibles por máquina y la capacidad de hacer consultas distribuidas y análisis a partir de los datos así obtenidos. Se considera sinónimo de «web semántica» y «web de los datos».

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#web-3.0

WEB SEMÁNTICA 

Evolución o parte de la World Wide Web que consiste en datos legibles por máquina en formato RDF y la capacidad de consultar esta información de manera estándar (por ejemplo, a través de SPARQL).

Fuente: W3C — http://www.w3.org/TR/ld-glossary/#semantic-web

XML

Siglas de lenguaje de marcado extensible. Lenguaje marcado que define un conjunto de normas para codificar documentos en un formato legible tanto por personas como por máquinas.

Fuente: https://en.wikipedia.org/wiki/XML