DÍGITS I ANDRÒMINES
Misc 05/04/2014

Els secrets de la Gigafoto

Confeccionar-la ha estat molt més complicat del que els organitzadors esperaven

i
Albert Cuesta
4 min

Si els participants a la Via Catalana hem trigat més de mig any a poder-nos buscar a la Gigafoto, la imatge panoràmica de més de 172.000 milions de píxels d’amplada que l’Assemblea Nacional Catalana (ANC) ha publicat aquesta setmana a la web gigafoto.assemblea.cat, és perquè confeccionar-la ha estat molt més complicat del que els organitzadors esperaven. Segons Galdric Peñarroja, coordinador del projecte a l’ANC, inicialment s’havia previst combinar les 112.000 fotografies -captades per 800 fotògrafs voluntaris- mitjançant aplicacions estàndard, però aviat es va comprovar que estan pensades per a altres situacions, com els paisatges estàtics i les imatges esfèriques. Per això a finals de setembre es va implicar en la Gigafoto el Vicorob, el grup de recerca sobre visió per computador i robòtica de la Universitat de Girona.

Habitualment, els investigadors que dirigeix Joan Martí treballen en dos àmbits: l’anàlisi d’imatges mèdiques, com l’assistència al diagnòstic de càncer de mama comparant dues mamografies practicades amb sis mesos de diferència, i l’exploració del fons marí amb vehicles controlats a distància que capten milers d’imatges destinades a formar un mosaic per a ús dels biòlegs. Però en el cas de la Via Catalana les condicions han estat molt diferents. No es podien aplicar els algoritmes habituals perquè no tots els fotògrafs van proporcionar fotos de la mateixa resolució, ni amb el mateix tipus de fitxer (la majoria són JPG, però també n’hi ha de BMP i RAW), ni tothom va respectar la convenció de noms per identificar-los. Algú fins i tot hi va incloure marques d’aigua fent publicitat dels seus serveis.

Però, sobretot, el tipus de contingut és completament diferent: entre dues fotografies consecutives hi pot haver canvis de perspectiva, distància i il·luminació que Martí qualifica de “brutals”, les persones que apareixen a totes dues s’hauran mogut amb tota seguretat, i alguns fotògrafs només van incloure un participant en les fotos consecutives tot i que les instruccions en demanaven dos. Per això, abans de procedir a la unió del mosaic, uns 200 voluntaris de l’ANC van dedicar dues setmanes de Nadal a l’anomenat CataClic, un procés manual consistent a marcar amb el ratolí fins a quatre punts de les persones que es repeteixen d’una fotografia a la següent, generalment els peus o els ulls. Fet això, els ordinadors del Vicorob -PC convencionals, equipats amb molta memòria RAM- van dedicar una mitjana de 90 minuts a fer la composició dels 3.000 fitxers (375 MB d’imatges) que formen de mitjana cadascun dels 784 trams de la Via, fins als 295 GB que pesa la Gigafoto en total. En aquest sentit, gairebé es pot parlar d’una terafoto, perquè conté 172 gigapíxels. Els trams tenen una amplada d’entre 100.000 i 200.000 píxels, segons la resolució de les imatges originals, i contenen diverses versions per als nivells de zoom de la visualització a la pàgina web. També hi ha les fotografies per descarregar, que tenen un màxim de sis megapíxels. En total, uns vuit milions de fitxers.

Tot i l’algoritme, la composició final mostra alguns errors, com les persones bicèfales o sense cap que han donat lloc a les bromes sobre mutants que han circulat aquests dies. Però Nuno Gracias, de l’equip del Vicorob, no els dóna importància i recorda que la proporció és mínima. Assegura que està molt satisfet del resultat, tenint en compte els recursos dedicats: disposen d’algoritmes encara més precisos, però que triguen mitja hora per a cada fotografia. L’investigador apunta la possibilitat d’aprofundir en l’anàlisi de les imatges, mitjançant el reconeixement de cares i la detecció de grups familiars. Tot i això, descarta cap intenció de creuar les fotos de la Via amb les xarxes socials per identificar els participants. Josep Miralles, informàtic de l’ANC, assegura que tampoc està previst fer un cens de participants a la Via comptant les persones que apareixen a la Gigafoto: “No seria realista, perquè només tindria en compte la primera fila, i en els trams més densos hi havia molta més gent al darrere”.

Una web de capacitat limitada

Durant les primeres hores de disponibilitat de la Gigafoto va ser difícil accedir a la web per veure i descarregar les imatges. La capacitat dels servidors es va veure superada per una demanda provocada, segons Miralles, per l’expectació del compte enrere previ a les 17.14 del dia 1. Els deu servidors contractats a Amazon Web Services estaven configurats per ampliar-se automàticament segons l’evolució del trànsit, però no van poder atendre la sobtada allau inicial de peticions dels internautes més ansiosos, i la sobrecàrrega es va propagar a la base de dades abans que fos possible posar en servei fins a 27 servidors més. Amb el pas de les hores el col·lapse va anar disminuint, i dimecres ja es van atendre normalment 701.000 visites -més del doble que les 260.000 del primer dia-, amb uns 6.000 usuaris connectats per minut. Els tècnics de l’ANC recorden que el pressupost destinat a publicar la Gigafoto ha estat molt baix i que sempre han descartat la possibilitat d’ampliar recursos mitjançant patrocinis, per tal de mantenir la independència de l’entitat. Per tant, si voleu assegurar la màxima disponibilitat web de la pròxima iniciativa de l’ANC, hauríeu d’anar pensant a fer-vos-en socis.

stats