Usted está aquí

FAQs

Sobre el open data

La apertura de datos públicos, también conocido como open data, consiste en poner la información que posee el sector público al alcance de todo el mundo en formatos digitales, estandarizados y abiertos, siguiendo una estructura clara que permita su comprensión. Al mismo tiempo se facilita el acceso a esta información para fomentar su reutilización.

De esta forma la sociedad, ciudadanía, empresas, universidad y cualquier otra institución, puede acceder fácilmente para informarse o para crear nuevos servicios aumentando el valor social y, en su caso, también el valor comercial.

Así pues, facilitar la información pública en formatos abiertos para que todo el mundo pueda hacer uso es ir más allá del simple proceso de permitir la reutilización de la información: es devolver a la sociedad sus datos públicos y fomentar que las utilice para todo lo que desee.

Se define un dato público como aquel que se ha registrado, recopilado o generado por cualquier medio por la Administración Pública (o por terceros por encargo de la Administración Pública), excluyendo los que estén sujetos a restricciones de privacidad, propiedad, seguridad o bien aquellos datos la publicación de los cuales podría infringir el Reglamento (UE) 2016/679 del Parlamento Europeo y del Consejo, de 27 de abril de 2016, Reglamento General de Protección de Datos o RGPD de protección de datos de carácter personal, o bien los datos que tengan regulada su publicación mediante un procedimiento administrativo.
El término dataset, de procedencia inglesa, hace referencia a un conjunto de datos que se publican en catálogos de datos para facilitar la búsqueda. El dataset, al que se accede mediante una URL, está constituido por los recursos (ficheros) y los metadatos.
Las principales formas de uso de los datos abiertos tienen que ver con su reaprovechamiento ya sea mediante aplicaciones, para elaborar diferentes formas de visualización o para su análisis con el objetivo de ayudar en la toma de decisiones. Las posibilidades son tantas como ideas tengan los ciudadanos.
Los metadatos son "datos que describen otros datos". Se trata de una tarea propia de la arquitectura de la información que sirve para comunicar información sobre un documento o sobre sus recursos que directamente se relacionan con su accesibilidad. Según la Wikipedia, los metadatos "son toda aquella información descriptiva sobre el contexto, calidad, condición o características de un recurso, dato u objeto con el fin de facilitar su recuperación, autentificación, evaluación, preservación y / o interoperabilidad".
La información es la materia prima de la sociedad actual; los datos son tremendamente útiles, por lo tanto, tiene mucho sentido que esta información se abra a toda la sociedad para que la reutilice.

Las administraciones públicas disponen de mucha información necesaria para llevar a cabo los servicios públicos que éstos soliciten. Pero esta información puede tener mucha más utilidad, por tanto, devolverla a los ciudadanos permite que estos puedan reutilizarla para otros fines y aumente el beneficio de esta información.

Un proyecto de open data debe trabajar bajo los siguientes objetivos

  • Abrir datos públicos de todos los sectores de la institución.
  • Contribuir al cambio de la cultura de la reutilización de la información pública.
  • Estimular el uso y reutilización de los datos abiertos.
  • Potenciar la iniciativa de apertura de datos públicos en otras instituciones públicas y privadas
  • Promocionar el tejido económico mediante esta iniciativa.

La Directiva Europea 2003/98 / CE, de 17 de noviembre de 2003, relativa a la reutilización de la información del sector público, estableció un conjunto de normas para el tratamiento de la información pública reutilizable. Esta fue enmendada como Directiva 2013/37/UE, el 26 de junio de 2013, y transpuesta a nivel estatal comoLey 18/2015, de 9 de julio, modificando la anterior Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público. La Ley 18/2015 tiene por objeto la regulación básica del régimen jurídico aplicable a la reutilización de los documentos elaborados o custodiados por las Administraciones y organismos del sector público.

Por otro lado, y relacionado con la apertura de datos públicos, existe normativa adicional, como es la Ley estatal 19/2013, de 9 de diciembre, de transparencia, acceso a la información pública y buen gobierno y la Ley autonómica 19/2014, de 29 de diciembre, de transparencia, acceso a la información pública y buen gobierno. Estas leyes tienen por objeto fomentar la participación ciudadana, obligando a las entidades públicas a dar cuenta a la ciudadanía, de acuerdo con el principio de responsabilidad, de su actividad y de la gestión de los recursos públicos.

Sobre el uso de los datos

Los principales formatos de los recursos publicados en el portal Open Data BCN son los siguientes:
  • CSV: Los archivos CSV (Comma-Separated Values) son un tipo de documento abierto que representa tablas con columnas separadas por comas y filas por saltos de línea.
  • XLS, XLSX: El formato XLS, XLSX hace referencia a los archivos que utiliza el programa de cálculo Microsoft Excel. Los datos están presentados en líneas y columnas.
  • XML: Los archivos XML (eXtensible Markup Language) se basan en un lenguaje desarrollado por el World Wide Web Consortium (W3C) que permite definir la gramática de lenguajes específicos para estructurar grandes documentos.
  • RDF: Los archivos RDF (Resource Description Framework) son especificaciones del World Wide Web Consortium (W3C) diseñados originalmente como modelos de metadatos. Su uso habitual es para dar una descripción conceptual a las páginas web.
  • JSON: Acrónimo de JavaScript Object Notation, es un formato de texto ligero para el intercambio de datos. Es un subconjunto de la notación literal de objetos de JavaScript aún hoy, por su amplia adopción como alternativa a XML, se considera un formato de lenguaje independiente.
  • KML: Los archivos KML (Keyhole Markup Language) especifican un conjunto de características (marcas de lugar, imágenes, polígonos, modelos 3D, descripciones textuales, etc.) para la visualización en Google Earth, Maps y Mobile, o cualquier otro software geoespacial de la aplicación de la codificación KML. Cada sitio tiene siempre una longitud y una latitud.
  • DAT: Estos archivos DAT pueden ser codificados en formato de texto plano, mientras que algunos archivos DAT se implementan con especificaciones de codificación binaria.

La clasificación basada en estrellas y desarrollada por Tim Berners-Lee permite cuantificar la calidad tecnológica del open data, en función del formato utilizado para representar los datos.

Es un esquema incremental donde cada nivel incluye el anterior.

★ Una estrella
  • Datos o documentos disponibles en la web en cualquier formato.
  • Bajo una licencia abierta no restrictiva.
  • Formato no estructurado.
  • El conjunto de datos o documento se puede visualizar en la web pero no procesar automáticamente.
  • Ejemplos: una imagen en formato JPG o PNG, o un documento escaneado en formato PDF

    .

★★ Dos estrellas
  • Datos o documentos estructurados.
  • Procesables automáticamente.
  • Formato propietario (no abierto).
  • Ejemplo: una hoja de cálculo en formato Microsoft Excel.

★★★ Tres estrellas
  • Formato estructurado y abierto (no propietario).
  • Ejemplo: la hoja de cálculo en formato CSV (valores separados por comas).

★★★★ Cuatro estrellas
  • Los datos pueden ser referenciados con direcciones web persistentes o identificadores de recursos uniformes (URI).
  • Se utilizan formatos estándares y abiertos del W3C para describir semánticamente la información.
  • Ejemplo: representación en el modelo RDF (infraestructura de descripción de recursos) de los edificios de un organismo público, con sus datos de contacto y ubicación, datos atómicos en los que se puede acceder mediante direcciones web (URI). También se podrían considerar ciertas APIs.

★★★★★ Cinco estrellas
  • Datos enlazados y descritos semánticamente con otros conjuntos de datos externos para ofrecer contexto a la información.
  • Se establecen relaciones semánticas entre la información enlazada.
  • Ejemplo: en el caso anterior, las descripciones de la ubicación de los edificios públicos podría estar enriquecida con enlaces a la DBpedia (http://dbpedia.org). Con estos enlaces se podría incluir una descripción en detalle de las localidades, regiones, o países y así tener acceso de forma directa a información socioeconómica o toponímica de estos lugares.

La excelencia técnica -cinco estrellas- se consigue cuando los datos son enlazados con otros recursos en la web mediante mecanismos semánticos, que ofrecen una interoperabilidad plena entre diferentes sistemas, y permiten una posterior reutilización mucho más eficiente.

Cada conjunto de datos tiene asociado sus propios términos de uso.

Por defecto, los recursos publicados en Open Data BCN están sujetos a una licencia CC-BY 4.0, lo que significa que se podrá realizar una reutilización de la información (copiar, adaptar, procesar, etc.) y distribuirla con la condición de citar el origen de los datos.

La clasificación de los datasets sigue la normativa estatal sin perder la capacidad de organizarse como creemos adecuado para conseguir los objetivos que como administración ciudadana nos planteamos.

Los temas y subtemas disponibles son los siguientes:

  • Población
    • Demografía
    • Sociedad y bienestar
    • Educación
  • Territorio
    • Vivienda
    • Urbanismo e infraestructuras
  • Ciudad y servicios
    • Cultura y ocio
    • Transporte
    • Medio ambiente
    • Seguridad
    • Turismo
    • Deporte
    • Participación
    • Opinión Pública
  • Administración
    • Sector público
    • Contratación
    • Recursos humanos
    • Legislación y justicia
  • Economía y empresa
    • Comercio
    • Empleo
    • Ciencia y tecnología
Para saber los conjuntos de datos publicados se debe consultar el catálogo.
Para buscar un conjunto de datos hay que dirigirse al catálogo. La búsqueda se puede realizar mediante el buscador habilitado o haciendo uso de los filtros en la parte izquierda de la pantalla.

Asimismo, el catálogo de datasets está disponible en formatos .csv, .rdf y .json, todos descargables desde la opción "API Catálogo" y también en el dataset "Catálogo de los datos abiertos del Ayuntamiento de Barcelona - Open Data BCN".

La frecuencia de actualización de los recursos de los datasets publicados en el portal se indica en el metadato "Frecuencia actualización". La gran cantidad de temas, fuentes y métodos de actualización hacen que no siempre se pueda mostrar la fecha exacta de actualización, pero sí que se indica la periodicidad de forma genérica, pudiendo ser anual, trimestral, mensual... Remarcamos, pero, que en cada periodificación, excepto incidencias no previstas, la actualización se realiza dentro de la primera mitad del periodo indicado, excepto en el caso de la actualización semanal que se realiza durante la segunda mitad.
La solicitud se puede realizar mediante la opción 'Contáctenos':
Open Data BCN publica nuevos datos de manera contínua.

La atribución al origen de los datos se hace citando su origen de manera explícita, el portal Open Data BCN, de la siguiente forma:

En el caso de permitir código HTML:

Este producto o servicio usa datos procedentes del portal Open Data BCN.

En el caso de sólo permitir texto:

Este producto o servicio usa datos procedentes del portal Open Data BCN (https://opendata-ajuntament.barcelona.cat/es).

En caso de que exista algún problema con la descarga de recursos del catálogo, hay que comunicarlo mediante la opción 'Contáctenos'

En los datasets georeferenciados se indica el sistema de coordenadas en que se publica la información. Remarcamos que los datasets que provienen de CartoBCN, indicado en el metadato 'Más información' de la ficha del dataset, se publican en el sistema oficial de referencia ETRS89 (EPSG: 25831), excepto los formatos GeoJSON, GeoPDF y KML, que siguiendo su propio estándar están en WGS84. Así mismo, Los productos cartográficos históricos se publican en el sistema ED50 (EPSG: 23031).

Algunas de las bases de datos del Ayuntamiento tienen las coordenadas XY almacenadas en milímetros, en lugar de metros, por cuestiones históricas, y también sufren un desplazamiento fijo respecto al punto de origen.

Para convertirlas en coordenadas UTM31 ED50 hay que seguir el siguiente procedimiento:

1. Dividirlas por 1.000 (o poner un punto decimal en la tercera posición por la derecha)
2. Sumarle 400.000 a las coordenadas X (poner un 4 delante)
3. Sumarle 4.500.000 n las coordenadas Y (poner un 45 delante)

Por tanto, como ejemplo tomamos estas coordenadas con formato interno:

X:30733208, Y:88007542

Y aplicamos el procedimiento especificado anteriormente, obtenemos:

X = 30733208 / 1000 = 30733.208.

30733.208 + 400000 = 430733.208

Y = 88007.542 / 10000= 88007.542

88007.542 + 4500000 = 4588007.542

Los recursos en formato .CSV son un tipo de documento en formato abierto simplificado para representar datos en forma de tabla, donde las columnas se separan por comas (,). Los campos que contienen texto o una coma han de ser cerrados entre comillas dobles (“). Estos recursos disponen dentro del portal Open Data BCN de una API CKAN habilitada.

Los ficheros CSV siguen un formato, la visualización de los cuales dependerá de la herramienta utilizada. Si se utiliza un editor de textos, los datos aparecerán en una sola línea y separadas por comas. Por otro lado la mayoría de hojas de cálculo y herramientas similares detectaran automáticamente el formato o se ofrecen opciones para presentar los datos en formatos de filas y columnas.

El modelo RDF permite especificar metadatos para describir recursos de cualquier tipo (físicos o virtuales) en la web. Este modelo se puede representar en diferentes formatos y permite el intercambio de información entre sistemas automáticos

A título de ejemplo, el catálogo de conjuntos de datos del portal Open Data BCN está representado en este formato. Esto sirve para que otras iniciativas a nivel supranacional puedan procesar y hacer operaciones, añadir sus contenidos (p.e., el European Data Portal realiza una agregación de catálogos europeos a través de descripciones en RDF).

El formato RDF/XML se puede abrir con cualquier editor de XML o de texto como Notepad++

El servicio WMS definido por el OGC produce mapas de datos espaciales referidos de manera dinámica a partir de información geográfica. Con este servicio no se obtienen los datos en si, sino una imagen que permite la representación de las mismas en formato digital.
El servicio WMTS, o servicio de mapas teselados, igual que el WMS, proporciona una imagen digital a partir de datos geográficos, pero con más alta velocidad de respuesta, ya que parte de colecciones de teselas o porciones de imágenes ya pregeneradas, a unos intervalos de escala.

El enlace a un servicio WMS desde Open Data BCN no proporciona directamente ningún mapa sino la URL de un servicio de mapas que opera con el estandard WMS (Web Map Service). Este estándard ha de ser consumido por un software GIS, como QGIS (libre), que permita conectarse con el servidor de mapas y navegar (desplazamientos, zoom...). Cualquier otro GIS, como por ejemplo ArcGIS, Geomedia... son capaces de trabajar con WMS.
También pueden ser tratados con un geoportal web que lo permita, como por ejemplo, el GeoportalBCN, el del Institut Cartogràfic i Geològic de Catalunya, o cualquier otro cliente web de mapas.
Hay que tener en cuenta que la visualización de estos servicios a escalas superiores a 1:5000 puede estar inhabilitada.

Los recursos de un dataset pueden presentar los datos de diferentes maneras.

En el caso del formato WIDE, el concepto se representa en las filas y se crea una columna para cada valor que puede tener. Por ejemplo si queremos representar la 'Población de los barrios de Barcelona' se crearía la fila para el concepto 'Población' y una columna para cada uno de los barrios.

el Raval el Barri Gòtic la Barceloneta
Población 47.489 14.734 15.104

En el caso del formato LONG el concepto se presenta en las columnas y las filas reflejarán los diferentes valores. Con el anterior ejemplo, si queremos representar la 'Población de los barrios de Barcelona' se crearían columnas con los conceptos 'Barrio' y 'Población'.

Barrio Población
el Raval 47.489
el Barri Gòtic 14.734
La Barceloneta 15.104

El formato LONG permite añadir nuevos valores de forma fácil aunque pueda ser menos intuitivo visualmente.