Open Data BCN. 12-11-2015 En Lluís Esquerda és desenvolupador i es dedica professionalment a l’extracció de dades, una disciplina encara incipient però que anirà a l’alça per la importància creixent de la gestió de grans quantitats de dades, el conegut com a Big Data, per a empreses i institucions. Ens citem amb en Lluís per parlar del seu projecte CityBikes, que reuneix les dades dels serveis públics de lloguer de bicicletes de fins a 365 ciutats del món, entre elles Barcelona, a on va iniciar la singladura d’aquesta aventura estretament lligada amb les dades obertes. Amb en Lluís descobrim el perfil dels desenvolupadors com a usuaris de dades obertes, i reflexionem sobre l’accés a la informació pública.

Quin ús feu de les dades públiques els desenvolupadors?
Els desenvolupadors detecten que hi ha una carència i busquen la forma per solucionar-la, i un mitjà per aconseguir-la. Les dades són un banc de dades per crear un nou producte.

Com va començar Citybikes?
Jo era usuari del Bicing i vaig trobar la necessitat de saber on hi havia estacions, i saber si hi havia bicicletes o no. En aquell moment no hi havia l’aplicació per Android, i vaig fer l’aplicació per fer-la servir jo mateix. Aleshores no hi havia la font de dades oberta, i va ser quan vaig entendre que hi havia dualitat de dades, i un mitjà alternatiu per accedir-hi que se’n diu scraping.

En què consisteix l’scraping?
És el fet de connectar-se a una pàgina web i extreure’n la informació directament tal com està representada. Vaig detectar que aquest mateix problema passava a altres ciutats, i vaig afegir més ciutats al sistema. Avui dia ja suportem 365 ciutats. Algunes provenen de fonts de dades obertes, com ara el Bicing, i altres de dades que no s’han obert.

Precisament a Barcelona vau començar obtenint les dades per mitjà d’scraping...
En alguna hackathon es va fer públic que aquestes dades estaven en obert, i quan van tornar-se accessibles vam començar a accedir-hi. Cal entendre el cost que té per les institucions poder oferir dades. Jo mateix pensava que era trivial.

Citybikes, però, al principi era una aplicació mòbil...
Sí, però fa anys que la vaig deixar a banda. Ara s’ha convertit en un proveïdor de dades, i un canal per mostrar-ne la importància. Citybikes intenta ser un exemple de tot el que es pot aconseguir quan les dades són obertes, i el poder de reutilització que tenen. El que fa ara és unificar l’estructura d’aquestes dades per poder comparar entre ciutats.

Per què arriba aquest canvi?
Havia de buscar una idea més enllà del que estava fent. Moltes vegades els desenvolupadors creem coses pel simple fet de fer-les sense pensar en la motivació. I és quan ja vaig tenir l’app construïda que me’n vaig plantejar el seu sentit. Als markets ja hi ha moltes aplicacions i el cost de mantenir-la és elevat. La qüestió era com podia fer que el projecte seguís tenint sentit, ja que tard o d’hora en sortiria una altra i, en canvi, si et converteixes en proveïdor el que fas és facilitar que la gent creï aplicacions, i el projecte és més rellevant.

Això, i una convicció ferma amb l’obertura de dades...
Quan soluciones un problema és molt important solucionar-lo també per a la resta de persones. No hi ha manera de protegir aquestes dades si es volen mantenir privades. Quan una empresa vol mantenir-les privades i al final aconsegueixes accedir a elles queda en relleu que no es poden protegir de cap forma. De manera que si el meu projecte volgués ser una aplicació tard o d’hora algú podria extreure les dades del meu projecte. El millor és ser obert, i permetre que tothom pugui participar del projecte, i fer-lo créixer.

Té model de negoci Citybikes?
No n’hi ha.

És un servei altruista que dóna servei a 365 ciutats. Quants accessos teniu comptabilitzats?
És difícil de monitoritzar però ara mateix estem comptabilitzant unes 300 peticions per minut, si barregem des d’un usuari que fa servir una app que es connecta a la meva plataforma, fins a altres proveïdors que accedeixen a la font de dades de forma contínua.

Coneixes els teus clients?
No volia controlar què es fa amb les dades perquè tenen un valor inherent. No s’hauria de fer un control de què es fa amb les dades.

Com s’ha dut a terme l’expansió geogràfica?
S’ha fet en forma d’arbre. En el moment en què vaig donar suport al Bicing, vaig adonar-me que el mateix codi servia per accedir al sistema de Saragossa, i el de València va donar suport a moltes altres xarxes al món. A Paris i Dublin tenien el mateix problema...

Tot està recollit en una llibreria...
Al principi duplicava molt codi però després es va convertir en una llibreria Python que unifica totes les fonts de dades sota el mateix model. La llibreria és el secret, les dades estan al servidor. Aquesta llibreria li serviria a qui fos per seguir en el projecte.

Parles de Pybikes...
Citybikes és un projecte comunitari. Pybikes és la llibreria Python que, al ser oberta, implica que si algú a Itàlia vol afegir els sistemes de la seva ciutat automàticament tot el sistema està suportat sense que hagi hagut de fer res.

L’app està completament arraconada?
Va haver-hi un moment en què l’app va ser molt popular a França. Quant a descarregues, unes 30.000, i d’usuaris actius en compto uns 1.000 o 2.000. Però ja fa anys que no estic treballant-hi.

Va triomfar a algun altre indret?
A Miami va haver-hi cert interès però no va arribar enlloc. La part pública volia, però la privada no. És la típica dualitat.

Abans ja n’havies parlat d’aquest concepte. En què consisteix?
És el que conec com el segrest de les institucions. L’ajuntament té un pacte amb una empresa que no inclou la cessió de les dades, i quan vol fer alguna cosa depèn contínuament de l’empresa.

Apps de referència com Citymapper també utilitzen Citybikes...
Sí, en diverses ciutats com a font per a les ciutats que no tenen les dades obertes.

I que obtens mitjançant scraping...
Sí, en obert o scraping. Existeix una tercera via no gaire elegant que és accedint a una api privada no documentada.

La fi justifica els mitjans?
Durant molts anys vaig creure-ho, i a vegades la fi justifica els mitjans. És una força de pressió perquè hi ha una cosa que és privada, i en el moment en què la fas pública, la gent la fa servir, i un cop la gent ja l’està fent servir no hi ha cap més remei que fer-la pública. Tant les empreses com els ajuntaments prefereixen ser ells els proveïdors.

En aquest sentit, què defensa la filosofia hacker?
Fer obert el que és privat. En la societat actual tot pot avançar de formes que no podem concebre. Moltes vegades no podem concebre el que encara no s’ha creat. L’ésser humà no té la capacitat d’entendre el que encara no existeix, però sí té la capacitat de que un cop una cosa es crea nova, assimilar-la de cop i ja és una realitat. La filosofia hacker defensa que no hi ha cap raó per posar les portes que fan que la informació no sigui oberta, perquè el que s’està fent és tallar tota la capacitat creadora de les dades, i tota la capacitat d’avançar d’una forma completament descentralitzada. Cada vegada que es tiren a terra aquestes portes s’obre la porta a que una persona pugui treballar amb coses que abans no hi eren.

T’hi has trobat amb Citybikes?
Sí, molta gent jove que ho troben com una font útil per practicar. Que creen una aplicació que després és la catapulta cap a crear més coses. En el procés ja han estat aprenent. Citybikes també intenta fomentar aquest procés, i que alguna part d’aquesta filosofia activista es quedi en ells.

Com?
Per exemple, si tenen una aplicació i veuen que tot el sistema de Citybikes és públic i lliure, llavors decideixen que la seva app també serà lliure. O de cop comencen a contribuir a PyBikes. Ara hi ha tres col•laboradors molt actius i al llarg de la història n’hi ha hagut quinze. No n’he conegut cap però són gent que ha aportat el seu gra de sorra al projecte.

L’han fet créixer..
Justament la setmana passada entre dues persones van afegir al voltant de 78 sistemes nous. La meva feina ha estat supervisar.

Com és que la filosofia hacker es dóna especialment al col•lectiu dels desenvolupadors?
Passa a la informàtica perquè sempre viu un dia després de la realitat. La informàtica viu en el futur. I com tota eina creadora, desperta la curiositat. La curiositat és un dels principals elements que incentiven la creativitat. I quan ja tens accés a tot això de forma lliure, la curiositat no té cap barrera que la privi de saber com funcionen les coses.

Filosofia que es trasllada també en l’ús d’eines informàtiques...
Poc a poc totes les solucions lliures estan reemplaçant solucions privades en el camp de la informàtica. Tenim dues alternatives: llicències a través de Microsoft, o bé el món de les eines que se’ns donen de forma simple i altruista simplement perquè creïs.

Com a desenvolupador què demanes a un portal de dades obertes?
Una llicència de reutilitzador clara i visible, que estigui actualitzat i que estigui en format accessible per als desenvolupadors. També que les dades siguin completes i que siguin fàcils de cercar.

Què n’opines dels formats més utilitzats?
El CSV i el JSON són avui dia els formats estrella. L’XML té una complexitat inherent i està pensat per a dades molt complexes. La meva opinió és que cada format té un motiu, i mai està bé que hi hagi un dogma.

En qualsevol cas, cal fomentar l’obertura de dades...
Que les administracions obrin tot el que puguin perquè la gent té més incentiu i se li pot donar millor fer-ne aplicacions. Només que una persona pugui reutilitzar les dades ja és més que justificat.

Què demanaries a una carta als Reis?
Legislar perquè qualsevol empresa privada que ofereixi serveis públics estigui obligada a oferir les dades obertes, sempre que respectin la privacitat dels usuaris. Que la propietat de les dades correspongui a l’administració corresponent, i per tant, a la societat. No hi ha cap raó pràctica perquè cap empresa reservi el dret a fer públics, o no, els seus horaris. S’aprofiten de la seva posició rellevant per establir una mena de pràctica monopolista.

En qualsevol cas, l’obertura de dades va a l’alça...
És curiós veure l’evolució. Primer érem la gent que volia accedir a aquestes dades. Aquest missatge va arribar a les institucions, i el següent pas és que aquest missatge arribi a les empreses.

Algun projecte futur en ment?
Les dades sempre és el meu tema. Ara l’empresa a on treballo m’encarrego d’extracció de dades en massa. Els meus projectes futurs aniran per aquí.