Esteu aquí

FAQs

Sobre l'Open Data

L'obertura de dades públiques - també conegut com a Open Data - consisteix en posar la informació que posseeix el sector públic a l'abast de tothom en formats digitals, estandarditzats i oberts, seguint una estructura clara que permeti la seva comprensió. Al mateix temps es facilita l'accés a aquesta informació per tal de fomentar la seva reutilització.

D’aquesta forma la societat —ciutadania, empreses, universitat i qualsevol institució— pot accedir-hi fàcilment per informar-se o per crear nous serveis augmentant el valor social i, si s’escau, també el valor comercial.

Així doncs, facilitar la informació pública en formats oberts per tal que tothom en pugui fer ús (Open Data) és anar més enllà del simple procés de permetre la reutilització de la informació: és retornar a la societat les seves dades públiques i fomentar que les utilitzi per tot allò que desitgi.

Es defineix una dada pública com aquella que s’ha registrat, recopilat o generat per qualsevol mitjà per l'Administració Pública (o per tercers per encàrrec de l’Administració Pública), excloent les que estiguin subjectes a restriccions de privacitat, propietat, seguretat, o bé aquelles dades la publicació de les quals podria infringir la Llei orgànica 15/1999, de 13 de desembre, de protecció de dades de caràcter personal, o bé les dades que tinguin regulada la seva publicació mitjançant un procediment administratiu.
Un dataset és una col·lecció de recursos de dades (com fitxers), juntament amb una descripció i altra informació addicional, unida a una URL. Els datasets són el que els usuaris veuen quan busquen una dada al cercador del Catàleg de Datasets. Quan els datasets inclouen recursos agrupats per anys, parlem de sèries històriques. El Catàleg de Datasets compta amb un gran nombre de sèries històriques podent incloure per a cada any recursos en diversos formats.
Les principals formes d’ús de les dades obertes tenen a veure amb el seu reaprofitament mitjançant aplicacions, però també per elaborar diferents formes de visualització o pel seu anàlisi amb l'objectiu d'ajudar en la presa de decisions.

Les possibilitats són tantes com idees tinguin els ciutadans. Existeixen aplicacions d’avisos sobre incidències amb el trànsit o altres que generen gràfics interactius per navegar entre les dades disponibles amb finalitats concretes.

De fet, podem distingir diferents usos: Alimentació d’Apps (ja siguin aplicacions mòbil, web, etc.), anàlisi de dades per a estudis sobre diferents aspectes de la ciutat, per generar negoci a partir de les dades (infomediaris) o ajudar a la presa de decisions entre altres.

Les metadades són “dades que descriuen altres dades”. Es tracta d’una tasca pròpia de l’arquitectura de la informació que serveix per comunicar informació sobre un document o sobre els seus recursos que directament es relacionen amb la seva accessibilitat. Segons la Wikipèdia, les metadades "són tota aquella informació descriptiva sobre el context, qualitat, condició o característiques d'un recurs, dada o objecte amb la finalitat de facilitar la seva recuperació, autentificació, avaluació, preservació i/o interoperabilitat".
La informació és la matèria primera de la societat actual; les dades són tremendament útils, per tant, té molt sentit que aquesta informació s’obri a tota la societat perquè la reutilitzi.

Les administracions públiques disposen de molta informació necessària per dur a terme els serveis públics que aquests sol·liciten. Però aquesta informació pot tenir molta més utilitat, per tant, retornar-la als ciutadans permet que aquests la puguin reutilitzar per a altres finalitats i augmenti el benefici d’aquesta informació.

Un projecte d'Open Data ha de treballar sota següents objectius

  • Obrir dades públiques de tots els sectors de la institució.
  • Contribuir al canvi de la cultura de la reutilització de la informació pública.
  • Estimular l’ús i reutilització de les dades obertes.
  • Potenciar la iniciativa d’obertura de dades públiques en altres institucions públiques i privades
  • Promocionar el teixit econòmic mitjançant aquesta iniciativa.

La Directiva Europea 2003/98 / CE, de 17 de novembre de 2003, relativa a la reutilització de la informació del sector públic, va establir un conjunt de normes per al tractament de la informació pública reutilitzable. Aquesta va ser esmenada com Directiva 2013/37/UE, el 26 de juny de 2013, i transposada a nivell estatal com Llei 18/2015, de 9 de juliol, modificant l'anterior Llei 37/2007, de 16 de novembre, sobre reutilització de la informació del sector públic. La Llei 18/2015 té per objecte la regulació bàsica del règim jurídic aplicable a la reutilització dels documents elaborats o custodiats per les administracions i els organismes del sector públic.

D'altra banda, i relacionat amb l'obertura de dades públiques, existeix normativa addicional, com és la Llei estatal 19/2013, de 9 de desembre, de transparència, accés a la informació pública i bon govern i la Llei autonòmica 19/2014, de 29 de desembre, de transparència, accés a la informació pública i bon govern. Aquestes lleis tenen com a objecte fomentar la participació ciutadana, obligant a les entitats públiques a donar compte a la ciutadania, d'acord amb el principi de responsabilitat, de la seva activitat i de la gestió dels recursos públics.

Sobre l'ús de les dades

Depenent de del tipus de dades obertes es poden afegir nous formats disponibles al catàleg de dades. Amb els recursos actuals, els principals formats de dades disponibles són els següents:
  • csv: Els arxius CSV (Comma-Separated Values) són un tipus de document obert que representa taules amb columnes separades per comes i files per salts de línia.
  • xls: El format XLS fa referència als arxius que fa servir el programa de càlcul Microsoft Excel. Les dades estan presentades en línies i columnes.
  • xml: Els arxius XML (eXtensible Markup Language) es basen en un llenguatge desenvolupat pel World Wide Web Consortium (W3C) que permet definir la gramàtica de llenguatges específics per estructurar grans documents.
  • zip: El format ZIP és un format d’emmagatzematge que s’usa per comprimir documents, imatges o programes.
  • rdf: Els arxius RDF (Resource Description Framework) són especificacions del World Wide Web Consortium (W3C) dissenyats originalment com a models de metadades. El seu ús habitual és per donar una descripció conceptual a les pàgines web.
  • json: Acrònim de JavaScript Object Notation, és un format de text lleuger per a l'intercanvi de dades. És un subconjunt de la notació literal d'objectes de JavaScript encara avui, per la seva àmplia adopció com a alternativa a XML, es considera un format de llenguatge independent.
  • kml: Els arxius KML (Keyhole Markup Language) especifiquen un conjunt de característiques (marques de lloc, imatges, polígons, models 3D, descripcions textuals, etc) per a la visualització a Google Earth, Maps i Mobile, o qualsevol altre programari geoespacial de l'aplicació de la codificació KML. Cada lloc té sempre una longitud i una latitud.
  • dat: Aquests arxius DAT poden ser codificats en format de text pla, mentre que alguns arxius DAT s'ìmplementen amb especificacions de codificació binària.
  • txt: Es tracta d’arxius composats exclusivament per text, sense format (no hi ha informació destinada a formats o tipus de lletra).

Hi ha una classificació desenvolupada per Tim Berners-Lee, inventor de la web i director del W3C, que permet quantificar la qualitat tecnològica de l'open data, mitjançant una classificació basada en estrelles -amb valors d'una a cinc- en funció del format utilitzat per a representar les dades.

Aquest esquema simbòlic és incremental (cada estat inclou l'anterior) i considera els següents casos:

★ Una estrella
  • Dades o documents disponibles a la web en qualsevol format.
  • Sota una llicència oberta no restrictiva.
  • Format no estructurat.
  • El conjunt de dades o document es pot visualitzar a la web però no processar automàticament.

Exemples: una imatge en format JPG o PNG, o un document escanejat en format PDF.

★★ Dos estrelles
Tot l'anterior més:
  • Dades o documents estructurats.
  • Processables automàticament.
  • Format propietari (no obert).

Exemple: un full de càlcul en format Microsoft Excel.

★★★ Tres estrelles
Tot l'anterior més:
  • Format estructurat i obert (no propietari).

Exemple: el full de càlcul en format CSV (valors separats per comes) en lloc de Microsoft Excel.

★★★★ Quatre estrelles
Tot l'anterior més:
  • Les dades poden ser referenciades amb adreces web persistents o identificadors de recursos uniformes (URI).
  • S'utilitzen formats estàndards i oberts del W3C per a descriure semànticament la informació.

Exemple: representació en el model RDF (infraestructura de descripció de recursos) dels edificis d'un organisme públic, amb les seves dades de contacte i ubicació, dades atòmiques a les quals es pot accedir mitjançant adreces web (URI). També es podrien considerar certes APIs.

★★★★★ Cinc estrelles
Tot l'anterior més:
  • Dades enllaçades i descrites semànticament amb altres conjunts de dades externes per oferir context a la informació.
  • S'estableixen relacions semàntiques entre la informació enllaçada.

Exemple: en el cas anterior, les descripcions de la ubicació dels edificis públics podria estar enriquida amb enllaços a la DBpedia (http://dbpedia.org). Amb aquests enllaços es podria incloure una descripció al detall de les localitats, regions, o països i així tenir accés de forma directa a informació socioeconòmica o toponímica d'aquests llocs.

L'excel·lència tècnica -cinc estrelles- s'aconsegueix quan les dades són enllaçades amb altres recursos a la web mitjançant mecanismes semàntics, que ofereixen una interoperabilitat plena entre diferents sistemes, i permeten una posterior reutilització molt més eficient.

Cada conjunt de dades té associat els seus propis termes d'ús. Llevat que s'especifiqui el contrari de forma explícita, es permet l'ús i reutilització dels conjunts de dades exposades en el catàleg a qualsevol persona o entitat que ho desitgi.

Per defecte, les distribucions de les dades del Servei Open Data BCN estaran subjectes una llicència CC-BY 4.0, el que significa que es podrà realitzar una reutilització de la informació (copiar, adaptar, processar, etc.) i distribuir-la amb la condició de citar l'origen de les dades.

La classificació dels recursos segueix la normativa estatal sense perdre la capacitat de organitzar-se com creiem adequat per aconseguir els objectius que com administració ciutadana ens plantegem.

Els temes i subtemes disponibles són les següents:

  • Població
    • Demografia
    • Societat i benestar
    • Educació
  • Territori
    • Habitatge
    • Urbanisme i infraestructures
  • Ciutat i serveis
    • Cultura i oci
    • Transport
    • Medi ambient
    • Seguretat
    • Turisme
    • Esport
    • Participació
  • Administració
    • Sector públic
    • Contractació
    • Recursos humans
    • Legislació i justícia
  • Economia i empresa
    • Comerç
    • Ocupació
    • Ciència i tecnologia
Consulteu el catàleg directament en http://opendata-ajuntament.barcelona.cat/data/ca/dataset
Per tal de cercar alguna dada o un dataset has de dirigir-te al catàleg de dades (http://opendata-ajuntament.barcelona.cat/data/ca/dataset), on trobaràs el cercador del catàleg en la part superior.

D'altra banda, es poden utilitzar també els filtres, que apareixen en la part esquerra de la pantalla:

  • Temes: Fent clic en un tema o subtema accedeixes al llistat de datasets corresponents a eixe tema o subtema
  • Etiquetes: Fent clic en una etiqueta accedeixes al llistat de datasets amb eixa etiqueta
  • Formats: Fent clic en un format accedeixes al llistat de datasets corresponents a eixe format
  • Llicències: Fent clic en una llicència accedeixes al llistat de datasets amb eixa llicència
  • Freqüència: Fent clic en una freqüència accedeixes al llistat de datasets amb eixa freqüència d'actualització

També pots descarregar-te el catàleg en format JSON i RDF (icona que apareixe a la part superior dreta en el catàleg de datasets - API catàleg -http://opendata-ajuntament.barcelona.cat/data/ca/dataset)

Si creus que hi ha dades que haurien d’obrir-se i encara no es troben disponibles, pots sol•licitar noves dades al següent enllaç: http://www.bcn.cat/cgi-bin/consultesIRIS?id=239
Open Data BCN publica noves dades periòdicament, per això recomanem suscriure't a la newsletter mensual per estar al dia de les noves dades publicades. De totes formes, si creus que cal alliberar unes dades en concret pots posar-te en contacte amb nosaltres per sol•licitar noves dades.

Per reutilitzar les dades existents en el catàleg citant l'origen dels mateixos s'ha d'indicar de manera explícita que procedeixen del projecte Open Data Barcelona, d'aquesta manera:

En el cas de permetre codi HTML:

Aquest producte o servei fa servir dades procedents del Servei <a href="http://opendata-ajuntament.barcelona.cat" title="Servei Open Data BCN">Open Data BCN</a>.

En el cas de només permetre text:

Aquest producte o servei fa servir dades procedents del Servei Open Data BCN (http://opendata-ajuntament.barcelona.cat).

En cas de que existeixi algun problema amb la descàrrega de dades només cal que ens ho faci saber mitjançant el formulari de contacte i l'atendrem el més aviat possible.
Algunes de les bases de dades de l’Ajuntament tenen les coordenades XY emmagatzemades en mil·límetres, enlloc de metres, per qüestions històriques, i també pateixen un desplaçament fixe respecte el punt d’origen.

Per convertir-les en coordenades UTM ED50 cal seguir el següent procediment:

1. Dividir-les per 1.000 (o posar un punt decimal a la tercera posició per la dreta)
2. Sumar-li 400.000 a les coordenades X (posar-hi un 4 davant)
3. Sumar-li 4.500.000 a les coordenades Y (posar-hi un 45 davant)

Per tant, com a exemple prenem aquestes coordenades amb format intern:

3073320888007542

I apliquem el procediment especificat anteriorment obtenim :

X = 30733208 / 1000 = 30733.208.

30733.208 + 400000 = 430733.208

Y = 88007.542 / 10000= 88007.542

88007.542 + 4500000 = 4588007.542

Els fitxers CSV segueixen un format, la visualització dels quals dependrà de l’eina utilitzada. Si s’utilitza un editor de textos, les dades apareixeran en una sola línia i separades per comes. Per altra banda en la majoria de fulls de càlcul i eines similars o bé es detecta automàticament el format o sinó s’ofereixen opcions per descodificar i presentar les dades en format de files i columnes.

El model RDF permet especificar metadades per descriure recursos de qualsevol tipus (físics o virtuals) a la web. Aquest model es pot representar en diferents formats i permet l'intercanvi d'informació entre sistemes automàtics

Per exemple, el catàleg de conjunts de dades està representat en aquest format. Això serveix perquè altres iniciatives a nivell supranacional puguin processar i fer operacions afegir els seus continguts (p.e., l'European Data Portal realitza una agregació de catàlegs europeus a través de descripcions en RDF). El nostre catàleg es troba en format RDF/XML i, per tant, es pot obrir amb qualsevol editor de XML o de text com Notepad++.