Publicitat
Publicitat

Allà on els ordinadors ens guanyen

AlphaGo, el sistema d’intel·ligència artificial construït per DeepMind, filial de Google, acaba de derrotar el campió humà Lee Se-dol per 4 a 1, en el torneig del joc d’estratègia go. Per què és important, això?

AlphaGo, el sistema d’intel·ligència artificial construït per DeepMind, filial de Google, acaba de derrotar el campió humà Lee Se-dol per 4 a 1, en el torneig del joc d’estratègia go. Per què és important, això? Al cap i a la fi, el 1997 els ordinadors van superar els humans en els escacs, quan el Deep Blue d’IBM va guanyar Garri Kaspàrov. Així doncs, ¿per què és significativa la victòria d’AlphaGo?

Com els escacs, el go és un joc d’estratègia enormement complex en el qual no intervenen la casualitat ni la sort. Dos jugadors col·loquen unes peces blanques o negres sobre la quadrícula formada per dinou línies verticals i dinou d’horitzontals; quan les peces queden envoltades pels quatre costats per les de l’altre color es retiren del tauler, i el jugador que conserva més peces al final de la partida guanya.

A diferència del que passa amb els escacs, però, no hi ha cap humà que pugui explicar com es juga al go al màxim nivell. Resulta que els jugadors més bons no poden acabar d’accedir als raonaments que ells mateixos fan per assolir un rendiment tan alt. Aquesta ignorància sobre un mateix és habitual en moltes habilitats humanes, des de la conducció d’un cotxe enmig del trànsit fins al fet de reconèixer una cara. El filòsof i científic Michael Polanyi va resumir d’una manera molt bonica aquest estrany estat de coses: “Sabem més del que podem explicar”. És un fenomen que es coneix com la paradoxa de Polanyi.

La paradoxa de Polanyi no ens ha impedit utilitzar els ordinadors per dur a terme tasques molt complicades, com ara gestionar nòmines, optimitzar itineraris de vol, dirigir trucades telefòniques i calcular impostos. Però com us podria dir qualsevol que hagi escrit un programa informàtic tradicional, automatitzar aquestes activitats ha requerit una precisió meticulosa per explicar exactament què ha de fer l’ordinador.

Aquest sistema de programar ordinadors és molt limitat, i no es pot aplicar en tota una sèrie de camps, com el go, en què sabem més coses de les que podem explicar, o en altres tasques com reconèixer objectes quotidians en fotografies, traduir entre llengües humanes i diagnosticar malalties. Tot plegat són tasques en què el sistema de programació basat en regles ha fracassat estrepitosament al llarg dels anys. Deep Blue va assolir el seu rendiment sobrehumà gairebé per pura força informàtica: el van alimentar amb milions d’exemples de partides d’escacs perquè pogués examinar totes les possibilitats i decidir el moviment més òptim. El problema és que hi ha moltes més partides de go possibles que no pas àtoms a l’Univers, de manera que ni tan sols els ordinadors més ràpids poden emular-ne una part significativa. Per acabar-ho d’adobar, normalment tampoc queda gens clar quins possibles moviments cal començar a explorar.

Què ha canviat? Les victòries d’AlphaGo il·lustren vívidament la força d’un nou plantejament per mitjà del qual, en lloc d’intentar programar estratègies intel·ligents en un ordinador, construïm sistemes que poden aprendre estratègies guanyadores gairebé sols, veient exemples reeixits i exemples que no han funcionat.

Com que aquests sistemes no es basen en el coneixement humà respecte a la funció que han de complir, no estan limitats pel fet que nosaltres sabem més del que podem explicar.

AlphaGo utilitza simulacions i algorismes de cerca tradicionals per ajudar-lo a decidir certs moviments, però el veritable avenç és la capacitat de superar la paradoxa de Polanyi. Ho va fer trobant estratègies guanyadores tot sol, sobre la base d’exemples i de l’experiència. Els exemples han sortit d’enormes col·leccions de partides de go entre jugadors de primer nivell, reunides al llarg dels 2.500 anys d’història del joc. Per entendre les estratègies que van portar a la victòria en aquestes partides, el sistema va utilitzar un plantejament conegut com l’aprenentatge profund, que ha demostrat una capacitat notable per esbrinar patrons i entendre què és important en grans bases de dades.

L’aprenentatge que té lloc al nostre cervell és un procés de formació i enfortiment de connexions entre les neurones. Els sistemes d’aprenentatge profund es basen en un plantejament anàleg, fins al punt que se’n deien xarxes neuronals. Construeixen milers de milions de nodes i connexions en un software, utilitzen “conjunts formatius” d’exemples per reforçar connexions entre estímuls (una partida de go en marxa) i respostes (el moviment següent), i després exposen el sistema a un nou estímul i veuen quina és la seva resposta. AlphaGo també va jugar milions de partides contra ell mateix, utilitzant una altra tècnica anomenada aprenentatge de reforç per recordar els moviments i les estratègies que han funcionat bé.

L’aprenentatge profund i l’aprenentatge de reforç ja fa un temps que existeixen, però fins fa poc no era gens clar fins a quin punt eren potents, i fins on es podien estendre. De fet, encara no ho és, però les aplicacions milloren a un ritme vertiginós, i no es veu on tenen el límit. I les aplicacions són múltiples: reconeixement de la parla, detecció de targetes de crèdit fraudulentes, radiologia i patologia. Ara hi ha màquines que poden reconèixer cares i conduir cotxes, dos dels exemples que Polanyi va apuntar com a àrees en les quals sabem més del que podem explicar.

Encara ens queda un llarg camí per recórrer, però les implicacions són profundes. Igual que quan James Watt va donar a conèixer el motor de vapor fa 240 anys, els canvis alimentats per la tecnologia es propagaran arreu de la nostra economia durant els pròxims anys, però no hi ha cap garantia que tothom se’n pugui beneficiar per igual. Entendre i abordar els reptes socials desencadenats pel ràpid progrés tecnològic continuen sent tasques que cap màquina pot fer per nosaltres.