Sumar, restar… Predir

Les matemàtiques, la informàtica i la gestió de les dades es combinen per pronosticar comportaments humans

Predir el futur ja no és matèria exclusiva de programes de la TDT en horaris intempestius. Pronosticar ha esdevingut tendència. I aviat es convertirà en negoci suculent i en peatge obligat per millorar la gestió pública. Aquestes són almenys les prediccions -valgui la redundància- de Gábor Lugosi, professor del departament de matemàtiques de la Universitat Pompeu Fabra, i Ferran Antoni Mazaira, matemàtic i consultor a McKinsey&Company. Com es pot predir? Qui ho fa? Quins beneficis se n'obtenen? Les respostes ja no són auguris.

Els bancs comencen a predir els xecs fraudulents, i les administracions, els embussos de trànsit. Tot prové d'una idea simple: "Com a massa, som molt previsibles", sentencia Lugosi. A partir de certs patrons de comportament que es repeteixen i amb l'ajuda d'algorismes, es poden elaborar models matemàtics per dibuixar el futur. I aquesta informació es pot fer servir per prendre decisions estratègiques en els negocis o per planificar millor els recursos públics.

La idea de predir és antiga. Lugosi situa als anys 50 i 60 les primeres prediccions amb màquines. Però l'esclat no es produeix fins fa cinc anys, segons Mazaira, que ho atribueix a la millora dels algorismes i de la tecnologia. Mazaira assegura que l'ús dels models matemàtics "és més una realitat americana que europea". Aquest llicenciat en matemàtiques per la Universitat Politècnica de Catalunya creu que aviat aquest tipus de previsions seran "al cor dels negocis" i que apareixeran noves empreses basades en l'anàlisi de les dades. De moment, els sectors que s'han abocat als models matemàtics són la banca i les asseguradores. Segons Mazaira, els segueixen les telecomunicacions i, en una "tercera onada", el sector públic i el comerç.

Possibilitats infinites

Què es pot avançar? Per Lugosi, hi ha "possibilitats infinites". Comenta que els models matemàtics es poden utilitzar en medicina, per diagnosticar millor, o en altres camps, per exemple per predir les retencions de trànsit. Mazaira, per la seva banda, afirma que al sector públic dels EUA prediuen quins són els segments de població 25 vegades més evasors d'impostos que la mitjana. I afegeix que es pot pronosticar quins perfils podran pagar o no un crèdit, com també l'èxit d'una cita arranjada a través d'internet.

Hi ha experiències en molts àmbits. Als Estats Units, una companyia agrícola ha adquirit una empresa de dades per predir el rendiment de la collita en funció de dades de la qualitat del terreny i de dades històriques de pluges. A Galícia investigadors del CSIC estan enllestint algorismes per predir, tres mesos per endavant, quins seran els trenta dies que concentraran més incendis.

Predir més, perdre menys

L'encerten, els algorismes? Les xifres parlen per si soles: Mazaira explica que el Citizens Bank va reduir les pèrdues per frau un 20% pronosticant xecs sense fons i que un agregador d'hotels va multiplicar per set la taxa de reserves amb un model matemàtic orientat a pronosticar els gustos dels clients online . En el camp de la seguretat, com va informar l'ARA el 12 d'octubre passat, la policia de Los Angeles va aconseguir reduir un 13% els robatoris i furts amb el sistema PredPol, per predir els delictes. I en el cas del comerç, segons un informe de la consultora McKinsey, es poden incrementar un 60% els marges de benefici esprement les dades que hi ha a l'abast.

Per Mazaira, els models matemàtics que fan servir les empreses avui per pronosticar el demà són fruit de la intersecció de tres conjunts: les matemàtiques, la informàtica i el negoci. Les matemàtiques i l'estadística ajuden a dissenyar el model i a interpretar-lo; la informàtica l'aplica i, finalment, la part més empresarial el lidera. Mazaira veu unitats de dades en les empreses del futur. Però, de moment, les companyies es preparen netejant i organitzant bé les seves dades.

Privacitat i altres polèmiques

El matemàtic de la UPC puntualitza que, tot i que ara es disposa de moltes dades, no en calen tantes per encertar les previsions. I posa l'exemple d'un banc que, amb registres de 150.000 persones, ja va poder dissenyar eines per vaticinar qui pagaria els deutes. I va incrementar un 10% els recobraments amb un 20% menys de costos. Fins ara, les companyies feien servir sobretot dades internes. Però comencen a fixar-se en dades públiques d'arreu, com ara les de les xarxes socials. Mazaira explica el cas d'un model per predir el pagament d'un crèdit basat en dades de Facebook, Twitter i LinkedIn. Les empreses rastregen comentaris en forma de queixa sobre la situació econòmica a Facebook i miren amb lupa les connexions a LinkedIn. "Típicament, una persona que és molt activa a les xarxes paga més o la pots localitzar més fàcilment", afirma.

El treball amb les dades avança ràpid, molt més que la regulació per protegir-les. Lugosi adverteix que es pot fer un bon ús de les dades, però també se'n pot fer un ús perniciós. A més de la protecció de la privacitat, també hi ha polèmica sobre si caminem cap a un món més personalitzat però menys plural. Mazaira afirma que el futur és "l'internet de la descoberta", on les pàgines, segons el que vam comprar ahir, ens diuen què ens pot agradar comprar avui. ¿Però no ens estan emmascarant la resta? Són qüestions que s'hauran de veure, en comptes de preveure-les. De moment, el que és clar és que les xifres d'avui amaguen els secrets de demà. I que descobrir-los, a través de les matemàtiques i la informàtica, s'ha convertit en el nou negoci.

Es busquen científics de dades

L'economista en cap de Google, Hal Varian, va assegurar fa uns anys que la feina d'estadístic seria la més sexi aquesta dècada. Sexi o no, el que queda clar és que el perfil d'un tècnic que sàpiga treballar i analitzar les dades serà clau. I els qui tenen més nas i habilitats per a tot plegat són matemàtics, informàtics i enginyers en telecomunicacions. La consultora Gartner pronostica 4,4 milions de feines lligades al big data el 2015. I McKinsey pronostica 1,5 milions de directius amb sensibilitat per les dades per al 2018 als Estats Units. Amb aquests horitzons, la formació en aquest camp s'accelera. I a Barcelona l'any que ve hi haurà un màster en la ciència de les dades promogut per la Barcelona Graduate School of Economics.

Les dades són 'trendies'

Les dades estan en boca de tothom. Sentim a parlar de big data , open data o dades obertes, de ciutats intel·ligents gràcies a les dades… Per què són tan trendies , les dades? Segurament, perquè cada vegada som més conscients del volum de dades que generem. I dels riscos i oportunitats que això comporta. El repte serà treure'n el significat, convertir les dades en informació útil que no amenaci la privacitat. Les administracions estan pujant a aquest tren. La Generalitat disposa del portal de dades obertes i també del portal de la transparència. Als Estats Units, l'administració Obama, que ja va obrir les dades fa temps, va posar en marxa l'any passat una unitat per tractar-les.