Pau Agulló és director de Kernel Anayltics i cofundador amb cinc apassionats més de Barcelona i les dades de BCN Analytics, una comunitat d’analistes de dades nascuda el passat 13 de novembre a la capital catalana. El seu objectiu és posar Barcelona al mapa de l’analítica mundial, divulgar aquesta disciplina i els seus usos i tècniques, demanar l’obertura de noves dades i difondre treballs fets a partir de l’anàlisi d’aquestes dades. O el que és el mateix, “posar en marxa un cercle virtuós”.

En què consisteix l’analítica de dades?
Intentar entendre a partir de dades històriques fenòmens i comportaments individuals o agregats, habitualment a partir de factors explicatius també construïts a partir d’aquestes dades. La idea és, en alguns casos, fer prediccions sobre la seva evolució futura, i per tant, vincular-hi decisions operatives i organitzatives.

Què vol fer BCN Analytics?
Pretén agrupar la comunitat que es dedica a l’anàlisi avançat de dades de Barcelona per compartir experiències i coneixements, i beneficiar la ciutat en la qual operem, que és Barcelona.

Com ho fareu?
Hi haurà sessions monotemàtiques on es discutiran aplicacions pràctiques de les dades per permetre que els agents de la ciutat –persones, empreses i organitzacions- guanyin avantatge competitiu gràcies a l’anàlisi avançat de dades, i crearem un repositori de dades amb formats estandarditzats per proporcionar dades gratuïtament i una plataforma en la qual distribuir i difondre els resultats.

Per què servirà?
Com més ampli sigui aquest repositori més creuaments de dades podem fer. Una aplicació pràctica seria entendre el mercat immobiliari o el vot de les persones en funció de les seves característiques poblacionals o identitàries.

Quina difusió em fareu?
Volem difondre a tants llocs com sigui possible. Tindrem un bloc en el qual hi publicarem mapes, informes, gràfics i resultats, difondrem a mitjans de comunicació online i en cada esdeveniment que fem seleccionarem els tres millors anàlisis per donar-los especial difusió.

Quins esdeveniments organitzareu?
Per una banda, volem facilitar l’intercanvi d’experiències i coneixements per part de la comunitat que es dedica a l’analítica, amb actes trimestrals monotemàtics pensats per a un públic professional expert, i també volem facilitar l’anàlisi sofisticat de dades georeferenciades, destinat un perfil més hacker, amb llibreries de codi i eines de visualització.

“L’analítica pretén fer prediccions sobre l’evolució futura i vincular-hi decisions operatives"

La llengua vehicular serà l’anglès?
És la nostra idea perquè una part molt important de la comunitat parla anglès i té un coneixement deficient de les altres llengües, i perquè volem que sigui visible a fora de Barcelona, Catalunya i Espanya. Ara bé, en farem un ús raonable.

Quins perfils professionals hi ha darrere la comunitat?
Gent que fan un ús intensiu de les dades i gent que ha d’interactuar amb aquests perfils, com un director de màrqueting que no analitzi dades directament però que hagi de relacionar-s’hi. També hauria d’interessar a professionals de l’anàlisi de dades, investigadors de l’àmbit acadèmic i al sector públic. La percepció és que el sector privat va bastant per davant en l’ús avançat de dades.

Quins projectes teniu previstos a nivell de ciutat?
El nostre rol no és tan de directors com de facilitadors. Tenim algunes idees de coses que es poden fer interessants amb aquestes dades però en realitat volem que sigui la creativitat dels analistes que decideixi quines coses es poden fer. Només volem posar la plataforma i les dades, i que siguin els usuaris que dirigeixin aquesta aventura.

En quin punt us trobeu ara mateix?
Volem posar en marxa un cercle virtuós: comencem amb un nucli mínim de dades que ja està força bé, esperem que en surtin uns resultats interessants, i armats amb aquests resultats interessants tornarem a trucar a la porta d’organitzacions de tot tipus, públiques i privades, per demanar que alliberin més bases de dades amb la promesa i expectativa que si alliberen més dades podran tenir resultats que també són interessants per a ells.

Com valoreu el nivell d’obertura de dades de les administracions catalanes?
Bo però millorable. S’han fet passos molt interessants, i ho celebrem i encoratgem, i realment hi ha moltes més dades que uns anys enrere, i s’ha avançat en la direcció correcta, però nosaltres som ambiciosos i volem que n’hi hagi més, i quantes més n’hi hagi, més interessants, rics i complets seran les anàlisis.

Comptareu amb el vostre propi repositori de dades obertes..
Volem ser un punt de trobada d’aquestes dades però no necessitem tenir-les nosaltres físicament. Volem que quan la gent vagi a buscar aquestes dades vinguin al nostre portal però a vegades voldrà dir que estan en un servidor nostre i altres donarem un codi que si l’executen les anirà a buscar a la pàgina que toqui i se les descarregarà automàticament.

“Ens agradaria afegir l’etiqueta d’analytics als atributs que fan Barcelona reconeguda internacionalment"

Quin tractament donareu a la visualització? Quines eines proposeu?
De moment estem explorant CartoDB, inAtlas i properament incorporarem InstaMaps, de l’Institut Cartogràfic. Tecnològicament no ens casem amb ningú, senzillament facilitem les coses. En les formacions que fem als analistes apostarem per certes tecnologies però són lliures de fer-ne servir d’altres.

I l’anàlisi de dades, amb R?
R és un programa de tractament avançat estadístic i permet manipular, analitzar i aplicar qualsevol mena de tècniques estadístiques. Funciona com qualsevol llenguatge executant ordres sobre bases de dades, i obtenint-ne resultats. L’avantatge d’R és que és llenguatge lliure, i compartit per tota la comunitat que s’hi dedica a al món. Contínuament es desenvolupen noves tècniques compartides de manera gratuïta amb tota la comunitat. Les farem accessibles i les ensenyarem a les classes de formació.

Parleu que voleu fer de Barcelona un hub europeu de l’analítica..
Totes les ciutats tenen uns atributs que es corresponen amb què són diferencials. Barcelona ja té uns certs atributs pels quals és reconeguda internacionalment. A nosaltres ens agradaria afegir l’etiqueta d’analytics a totes les altres que té.

Hi ha base?
Creiem que hi ha empreses que estan fent coses molt punteres en analytics: empreses que fan servir dades internes seves com King Entertainment, que té la quarta base de dades més gran del món d’usuaris, o la Caixa, que és el banc que està fent coses més sofisticades a tot l’Estat, entre d’altres. A Barcelona i a Catalunya hi ha un teixit molt divers d’empreses, un teixit universitari molt bo, programes d’anàlisi de dades molt interessants i punters, empreses consultores molt especialitzades, iniciatives, des d’Open Data de l’Ajuntament, la Generalitat o l’Idescat, que ho estan facilitant, i també uns quants esdeveniments amb els quals Barcelona és referència com la mobilitat i smart cities, que lliguen de manera natural amb aquest projecte.

Quines ciutats són referent en matèria d’anàlisi de dades?
Estem competint amb les grans ciutats europees. A Estats Units, els sospitosos habituals: San Francisco, perquè les empreses online generen gran quantitat de dades com Facebook, LinkedIn, Netflix, i també Boston i Chicago. A Europa, Londres i Berlin són les que a priori tenen més massa crítica, però clar, d’això i de 10.000 coses més. Londres té moltes iniciatives interessants, un portal d’Open Data de l’administració pública increïble i ens van per davant, però hi ha marge per atrapar-la. Que hi hagi empreses internacionals online que instal•lin la seu aquí com King, Vistaprint o les empreses d’eCommerce de Barcelona, és positiu.

Tothom parla del Big Data com a tendència de futur..
Els softwares i hardwares tradicionals no tenen prou capacitat per analitzar els grans volum de dades no estructurades generades per organitzacions o capturades de manera massiva a Internet. La digitalització de processos i les empreses online fan que es generi una gran quantitat de dades que necessiten tecnologies i tècniques Big Data per analitzar-les, i anirà creixent els pròxims anys. A on s’aconseguiran experiències més exitoses i menys, i quin ús en faran les organitzacions públiques i privades, encara està per veure.