Usted está aquí

FAQs

Sobre el Open Data

La apertura de datos públicos - también conocido como Open Data - consiste en poner la información que posee el sector público al alcance de todo el mundo en formatos digitales, estandarizados y abiertos, siguiendo una estructura clara que permita su comprensión. Al mismo tiempo se facilita el acceso a esta información para fomentar su reutilización.

De esta forma la sociedad -ciudadanía, empresas, universidad y cualquier institución- puede acceder fácilmente para informarse o para crear nuevos servicios aumentando el valor social y, en su caso, también el valor comercial.

Así pues, facilitar la información pública en formatos abiertos para que todo el mundo pueda hacer uso (Open Data) es ir más allá del simple proceso de permitir la reutilización de la información: es devolver a la sociedad sus datos públicos y fomentar que las utilice para todo lo que desee.

Se define un dato público como aquel que se ha registrado, recopilado o generado por cualquier medio por la Administración Pública (o por terceros por encargo de la Administración Pública), excluyendo los que estén sujetos a restricciones de privacidad, propiedad, seguridad o bien aquellos datos la publicación de los cuales podría infringir la Ley orgánica 15/1999, de 13 de diciembre, de protección de datos de carácter personal, o bien los datos que tengan regulada su publicación mediante un procedimiento administrativo.
Un dataset es una colección de recursos de datos (como archivos), junto con una descripción y otra información adicional, unida a una URL. Los datasets son lo que los usuarios ven cuando buscan un dato en el buscador del Catálogo de Datasets. Cuando los datasets incluyen recursos agrupados por años, hablamos de series históricas. El Catálogo de Datasets cuenta con un gran número de series históricas pudiendo incluir para cada año recursos en diversos formatos.
Las principales formas de uso de los datos abiertos tienen que ver con su reaprovechamiento mediante aplicaciones, pero también para elaborar diferentes formas de visualización o para su análisis con el objetivo de ayudar en la toma de decisiones.

Las posibilidades son tantas como ideas tengan los ciudadanos. Existen aplicaciones de avisos sobre incidencias con el tráfico u otras que generan gráficos interactivos para navegar entre los datos disponibles con fines concretos.

De hecho, podemos distinguir diferentes usos: Alimentación de Apps (ya sean aplicaciones móvil, web, etc.), análisis de datos para estudios sobre diferentes aspectos de la ciudad, para generar negocio a partir de los datos (infomediarios) o ayudar la toma de decisiones entre otros.

Los metadatos son "datos que describen otros datos". Se trata de una tarea propia de la arquitectura de la información que sirve para comunicar información sobre un documento o sobre sus recursos que directamente se relacionan con su accesibilidad. Según la Wikipedia, los metadatos "son toda aquella información descriptiva sobre el contexto, calidad, condición o características de un recurso, dato u objeto con el fin de facilitar su recuperación, autentificación, evaluación, preservación y / o interoperabilidad".
La información es la materia prima de la sociedad actual; los datos son tremendamente útiles, por lo tanto, tiene mucho sentido que esta información se abra a toda la sociedad para que la reutilice.

Las administraciones públicas disponen de mucha información necesaria para llevar a cabo los servicios públicos que éstos soliciten. Pero esta información puede tener mucha más utilidad, por tanto, devolverla a los ciudadanos permite que estos puedan reutilizarla para otros fines y aumente el beneficio de esta información.

Un proyecto de Open Data debe trabajar bajo los siguientes objetivos

  • Abrir datos públicos de todos los sectores de la institución.
  • Contribuir al cambio de la cultura de la reutilización de la información pública.
  • Estimular el uso y reutilización de los datos abiertos.
  • Potenciar la iniciativa de apertura de datos públicos en otras instituciones públicas y privadas
  • Promocionar el tejido económico mediante esta iniciativa.

La Directiva Europea 2003/98 / CE, de 17 de noviembre de 2003, relativa a la reutilización de la información del sector público, estableció un conjunto de normas para el tratamiento de la información pública reutilizable. Esta fue enmendada como Directiva 2013/37/UE, el 26 de junio de 2013, y transpuesta a nivel estatal comoLey 18/2015, de 9 de julio, modificando la anterior Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público. La Ley 18/2015 tiene por objeto la regulación básica del régimen jurídico aplicable a la reutilización de los documentos elaborados o custodiados por las Administraciones y organismos del sector público.

Por otro lado, y relacionado con la apertura de datos públicos, existe normativa adicional, como es la Ley estatal 19/2013, de 9 de diciembre, de transparencia, acceso a la información pública y buen gobierno y la Ley autonómica 19/2014, de 29 de diciembre, de transparencia, acceso a la información pública y buen gobierno. Estas leyes tienen por objeto fomentar la participación ciudadana, obligando a las entidades públicas a dar cuenta a la ciudadanía, de acuerdo con el principio de responsabilidad, de su actividad y de la gestión de los recursos públicos.

Sobre el uso de los datos

Dependiendo del tipo de datos abiertos se pueden añadir nuevos formatos disponibles en el catálogo de datos. Con los recursos actuales, los principales formatos de datos disponibles son los siguientes:
  • csv: Los archivos CSV (Comma-Separated Values) son un tipo de documento abierto que representa tablas con columnas separadas por comas y filas por saltos de línea.
  • xls: El formato XLS hace referencia a los archivos que utiliza el programa de cálculo Microsoft Excel. Los datos están presentados en líneas y columnas.
  • xml: Los archivos XML (eXtensible Markup Language) se basan en un lenguaje desarrollado por el World Wide Web Consortium (W3C) que permite definir la gramática de lenguajes específicos para estructurar grandes documentos.
  • zip: El formato ZIP es un formato de almacenamiento que se usa para comprimir documentos, imágenes o programas.
  • rdf: Los archivos RDF (Resource Description Framework) son especificaciones del World Wide Web Consortium (W3C) diseñados originalmente como modelos de metadatos. Su uso habitual es para dar una descripción conceptual a las páginas web.
  • json: Acrónimo de JavaScript Object Notation, es un formato de texto ligero para el intercambio de datos. Es un subconjunto de la notación literal de objetos de JavaScript aún hoy, por su amplia adopción como alternativa a XML, se considera un formato de lenguaje independiente.
  • kml: Los archivos KML (Keyhole Markup Language) especifican un conjunto de características (marcas de lugar, imágenes, polígonos, modelos 3D, descripciones textuales, etc.) para la visualización en Google Earth, Maps y Mobile, o cualquier otro software geoespacial de la aplicación de la codificación KML. Cada sitio tiene siempre una longitud y una latitud.
  • dat: Estos archivos DAT pueden ser codificados en formato de texto plano, mientras que algunos archivos DAT se implementan con especificaciones de codificación binaria.
  • txt: Se trata de archivos compuestos exclusivamente por texto, sin formato (no hay información destinada a formatos o tipos de letra).

Hay una clasificación desarrollada por Tim Berners-Lee, inventor de la web y director del W3C, que permite cuantificar la calidad tecnológica del open data, mediante una clasificación basada en estrellas -con valores de una a cinco- en función del formato utilizado para representar los datos.

AEste esquema simbólico es incremental (cada estado incluye el anterior) y considera los siguientes casos:

★ Una estrella
  • Datos o documentos disponibles en la web en cualquier formato.
  • Bajo una licencia abierta no restrictiva.
  • Formato no estructurado.
  • El conjunto de datos o documento se puede visualizar en la web pero no procesar automáticamente.

Ejemplos: una imagen en formato JPG o PNG, o un documento escaneado en formato PDF.

★★ Dos estrellas
Todo lo anterior más:
  • Datos o documentos estructurados.
  • Procesables automáticamente.
  • Formato propietario (no abierto).

Ejemplo: una hoja de cálculo en formato Microsoft Excel.

★★★ Tres estrellas
Todo lo anterior más:
  • Formato estructurado y abierto (no propietario).

Ejemplo: la hoja de cálculo en formato CSV (valores separados por comas) en lugar de Microsoft Excel.

★★★★ Cuatro estrellas
Todo lo anterior más:
  • Los datos pueden ser referenciados con direcciones web persistentes o identificadores de recursos uniformes (URI).
  • Se utilizan formatos estándares y abiertos del W3C para describir semánticamente la información.

Ejemplo: representación en el modelo RDF (infraestructura de descripción de recursos) de los edificios de un organismo público, con sus datos de contacto y ubicación, datos atómicos en los que se puede acceder mediante direcciones web (URI). También se podrían considerar ciertas APIs.

★★★★★ Cinco estrellas
Todo lo anterior más:
  • Datos enlazados y descritos semánticamente con otros conjuntos de datos externos para ofrecer contexto a la información.
  • Se establecen relaciones semánticas entre la información enlazada.

Ejemplo: en el caso anterior, las descripciones de la ubicación de los edificios públicos podría estar enriquecida con enlaces a la DBpedia (http://dbpedia.org). Con estos enlaces se podría incluir una descripción en detalle de las localidades, regiones, o países y así tener acceso de forma directa a información socioeconómica o toponímica de estos lugares.

La excelencia técnica -cinco estrellas- se consigue cuando los datos son enlazados con otros recursos en la web mediante mecanismos semánticos, que ofrecen una interoperabilidad plena entre diferentes sistemas, y permiten una posterior reutilización mucho más eficiente.

Cada conjunto de datos tiene asociado sus propios términos de uso. Salvo que se especifique lo contrario de forma explícita, se permite el uso y reutilización de los conjuntos de datos expuestos en el catálogo a cualquier persona o entidad que lo desee.

Por defecto, las distribuciones de los datos del Servicio Open Data BCN estarán sujetos a una licencia CC-BY 4.0, lo que significa que se podrá realizar una reutilización de la información (copiar, adaptar, procesar, etc.) y distribuirla con la condición de citar el origen de los datos.

La clasificación de los recursos sigue la normativa estatal sin perder la capacidad de organizarse como creemos adecuado para conseguir los objetivos que como administración ciudadana nos planteamos.

Los temas y subtemas disponibles son los siguientes:

  • Población
    • Demografía
    • Sociedad y bienestar
    • Educación
  • Territorio
    • Vivienda
    • Urbanismo e infraestructuras
  • Ciudad y servicios
    • Cultura y ocio
    • Transporte
    • Medio ambiente
    • Seguridad
    • Turismo
    • Deporte
    • Participación
  • Administración
    • Sector público
    • Contratación
    • Recursos humanos
    • Legislación y justicia
  • Economía y empresa
    • Comercio
    • Empleo
    • Ciencia y tecnología
Para buscar algún dato o un dataset debes dirigirte al catálogo de datos (http://opendata-ajuntament.barcelona.cat/data/es/dataset), donde encontrarás el buscador del catálogo en la parte superior.

Por otra parte, se pueden utilizar también los filtros, que aparecen en la parte izquierda de la pantalla:

  • Temas: Haciendo clic en un tema o subtema accedes al listado de datasets correspondientes a ese tema o subtema
  • Etiquetas: Haciendo clic en una etiqueta accedes al listado de datasets con esa etiqueta
  • Formatos: Haciendo clic en un formato accedes al listado de datasets correspondientes a ese formato
  • Licencias: Haciendo clic en una licencia accedes al listado de datasets con esa licencia
  • Frecuencia: Haciendo clic en una frecuencia accedes al listado de datasets con esa frecuencia de actualización

También puedes descargarte el catálogo en formato JSON y RDF (icono que aparece en la parte superior derecha en el catálogo de datasets - API catálogo - http://opendata-ajuntament.barcelona.cat/data/es/dataset)

Si crees que hay datos que deberían abrirse y todavía no se encuentran disponibles, puedes solicitar nuevos datos en el siguiente enlace: http://www.bcn.cat/cgi-bin/consultesIRIS?id=240
Open Data BCN publica nuevos datos periódicamente, por eso recomendamos suscribirte a la newsletter mensual para estar al día de los nuevos datos publicados. De todas formas, si crees que hay que liberar unos datos en concreto puedes ponerte en contacta con nosotros para solicitar nuevos datos.

Para reutilizar los datos existentes en el catálogo citando el origen de los mismos se debe indicar de forma explícita que proceden del proyecto Open Data Barcelona, de esta forma:

En el caso de permitir código HTML:

Este producto o servicio usa datos procedentes del Servicio <a href="http://opendata-ajuntament.barcelona.cat" title="Servicio Open Data de Barcelona">Open Data BCN</a>.

En el caso de sólo permitir texto:

Este producto o servicio usa datos procedentes del Servicio Open Data BCN (http://opendata-ajuntament.barcelona.cat).

En caso de que exista algún problema con la descarga de datos sólo es necesario que nos lo hagas saber a través del formulario de contacto y nosotros resolveremos la incidencia lo antes posible.
Algunas de las bases de datos del Ayuntamiento tienen las coordenadas XY almacenadas en milímetros, en lugar de metros, por cuestiones históricas, y también sufren un desplazamiento fijo respecto al punto de origen.

Para convertirlas en coordenadas UTM ED50 hay que seguir el siguiente procedimiento:

1. Dividirlas por 1.000 (o poner un punto decimal en la tercera posición por la derecha)
2. Sumarle 400.000 a las coordenadas X (poner un 4 delante)
3. Sumarle 4.500.000 n las coordenadas Y (poner un 45 delante)

Por tanto, como ejemplo tomamos estas coordenadas con formato interno:

3073320888007542

Y aplicamos el procedimiento especificado anteriormente, obtenemos:

X = 30733208 / 1000 = 30733.208.

30733.208 + 400000 = 430733.208

Y = 88007.542 / 10000= 88007.542

88007.542 + 4500000 = 4588007.542

Los ficheros CSV siguen un formato, la visualización de los cuales dependerá de la herramienta utilizada. Si se utiliza un editor de textos, los datos aparecerán en una sola línea y separadas por comas. Por otro lado en la mayoría de hojas de cálculo y herramientas similares, se detecta automáticamente el formato o si no se ofrecen opciones para decodificar y presentar los datos en formatos de filas y columnas.

El modelo RDF permite especificar metadatos para describir recursos de cualquier tipo (físicos o virtuales) en la web. Este modelo se puede representar en diferentes formatos y permite el intercambio de información entre sistemas automáticos

Por ejemplo, el catálogo de conjuntos de datos está representado en este formato. Esto sirve para que otras iniciativas a nivel supranacional puedan procesar y hacer operaciones, añadir sus contenidos (p.e., el European Data Portal realiza una agregación de catálogos europeos a través de descripciones en RDF).