ELS RISCOS DEL ‘BIG DATA’

Què és un algoritme?

Els algoritmes són un seguit d’ordres que es construeixen a partir de models aproximats de la realitat i que funcionen amb dades

2 min
Els algoritmes s’escriuen en llenguatges de programació que els ordinadors puguin entendre.

BarcelonaEl terme algoritme es fa servir molt més ara que quan el matemàtic persa del segle IX del qual deriva, Muhammad ibn Musa al-Khwarizmi, dissenyava mètodes per resoldre equacions de primer i segon grau. Les raons són clares: ara hi ha més dades i més capacitat de càlcul. Però d’algoritmes, que no són més que un conjunt d’instruccions que tenen per objectiu executar una tasca, n’hi ha hagut sempre. La recepta d’un pastís de xocolata o d’una paella valenciana són algoritmes. La manera d’encendre foc amb dos bastons és un algoritme. La tècnica de caça que fan servir alguns grups d’orques, quan expulsen aire mentre giren sota les seves preses per atrapar-les en un cilindre de bombolles, és un algoritme, en aquest cas generat i transmès d’una manera prelingüística. També ho són les danses nupcials de l’au del paradís o les cançons de bressol.

Avui d’algoritmes n’hi ha a tot arreu. Quan pitgem el botó del pis on volem anar en un ascensor, s’executa un algoritme: l’ascensor utilitza informació prèvia per moure’s amunt o avall i per aturar-se en el moment adequat. Com és ben sabut, gairebé tot el que fem a internet està mediat per algoritmes que poden arribar a ser molt sofisticats. Ara bé, tots els algoritmes han de complir una sèrie de condicions, la més important de les quals és que les instruccions es puguin dur a terme en un nombre finit de passos. En cas contrari, l’algoritme no serveix de res. Si el temps necessari per fer un pastís de xocolata supera l’edat de l’Univers, potser més val que triem una altra recepta.

Els algoritmes complexos actuals, que funcionen gràcies a grans quantitats de dades, es construeixen a partir de models, que no són més que abstraccions i simplificacions del funcionament d’un sistema real. N’hi ha de simples, que actuen a partir de dades fàcils d’obtenir, i n’hi ha de complicats, i sovint incomplets, que funcionen amb les dades que poden aconseguir. El cas que Michael Lewis explica al llibre Moneyball és dels primers: utilitzar les dades històriques de jugadors de beisbol per optimitzar el rendiment d’un equip. Les dades existeixen i són rellevants per predir l’actuació d’un jugador i, de passada, de tot l’equip.

Ara bé, quan es vol predir la capacitat de tornar un préstec, hi ha moltes dades rellevants que no existeixen. Els models són, aleshores, més aproximats perquè utilitzen dades de situacions semblants que s’han produït en el passat. Per respondre a la pregunta de si anirà bé la botiga que el sol·licitant vol obrir amb els diners del préstec, l’ideal seria tenir informació de moltes botigues iguals que la mateixa persona hauria obert fins al moment en llocs semblants, com passa amb els jugadors de beisbol. Però, i si és la primera botiga que vol obrir?

Els models en què es basen els algoritmes que treballen amb grans quantitats de dades poden tenir forats que donin lloc a incertesa en les prediccions. I la incertesa implica que la probabilitat d’error a l’hora de fer una predicció concreta és més alta. Per això és especialment important saber com es dissenyen els algoritmes i amb quines dades s’alimenten a l’hora de refinar-los.

10 algoritmes que passaran a la història
  • Google L’evolució del primer algoritme de cerca que va llançar Google el 1999, conegut com a Page Rank, avui ja té en compte si un web conté contingut plagiat o ofensiu. El motor de cerca més utilitzat del món s’actualitza gairebé cada dia.
  • Amazon L’èxit de la plataforma que concentra el 40% de les vendes online es basa en un algoritme que puntua venedors i que genera un sistema de preus dinàmics i de recomanacions obtingudes amb sistemes d’aprenentatge profund.
  • Netflix La plataforma que ha canviat la manera de consumir sèries i pel·lícules té un sistema de recomanacions basat en l’historial de cerca de cada usuari i en com ha interaccionat amb el contingut (com l’ha puntuat, si l’ha visualitzat fins al final, etc.).
  • Xarxes socials Tot i que n’hi ha de molt diversos, tots els algoritmes de les xarxes socials tenen l’objectiu de mostrar contingut rellevant i personalitzat a cada usuari per optimitzar la publicitat. Això ho fan amb sistemes de puntuació de contingut que es basen en les accions de milions d’usuaris.
  • Spotify L’aplicació que ha revolucionat la manera d’escoltar música utilitza les accions dels usuaris i un etiquetatge exhaustiu d’artistes i cançons per proposar música que l’oient no ha escoltat mai dins de la plataforma.
  • Cites Aplicacions com Tinder o Match.com han utilitzat tant la informació que aporten els usuaris d’ells mateixos com les valoracions que fan d’altres usuaris per canviar les maneres de trobar parella.
  • Repartiment Les empreses de repartiment utilitzen algoritmes que puntuen els riders perquè tinguin preferència a l’hora de triar encàrrecs i horaris, cosa que potser optimitza el servei però que penalitza cada vegada més alguns repartidors.
  • Uber La pionera en el servei de transport de persones a demanda funciona amb un algoritme que genera tarifes dinàmiques i que valora amb criteris opacs els conductors per mantenir-los o acomiadar-los, segons han denunciat alguns xofers.
  • Predicció de crims Els anomenats programes de predicció de la criminalitat utilitzen algoritmes basats en xarxes neuronals per decidir on es cometran delictes i si una persona té més probabilitat de reincidir. Un conjunt de més de 2.000 experts en intel·ligència artificial els han criticat perquè contenen biaixos racials i socioeconòmics.
  • Finances La compravenda de valors financers a les borses de tot el món està parcialment automatitzada gràcies a algoritmes sofisticats. Als Estats Units el 70% de les transaccions les fan màquines. A Espanya, un 40%.
stats