23/04/2016

‘Big data’ i whisky de malta

4 min
‘Big data’ i whisky de malta

Fins aquesta setmana creia que Loch Lomond era una marca de whisky que Hergé s’havia inventat per a l’edició revisada del 1966 de L’illa negra, l’episodi de les aventures de Tintín ambientat a Escòcia. Ara no només sé que el Loch Lomond existeix de debò, sinó també que el seu sabor és més semblant al del Glenmorangie que al del Glenfarclas que tinc a casa. I no és perquè l’hagi tastat, sinó gràcies a les dades del Single Malt Sampler, una visualització que mostra gràficament el grau de proximitat entre 86 marques de whisky escocès, calculada a partir de les 12 característiques de tast assignades per tastadors experts que figuren a la base de dades oberta de la universitat de Strathclyde. Si tingués una destil·leria, amb aquest gràfic podria saber quin tipus de whisky he d’elaborar per diferenciar-me dels que hi ha al mercat. Si el meu negoci fos una licoreria, sabria quina marca pot agradar als clients que me’n compren habitualment una altra.

Inscriu-te a la newsletter Sèries Totes les estrenes i altres perles
Inscriu-t’hi

Aquesta és només una de les imatges que podeu trobar a The art of analytics, una galeria virtual de visualitzacions de dades creades amb l’eina Aster de Teradata. Aquesta empresa nord-americana es dedica des de fa més de 35 anys a l’anàlisi de dades massives, en competència amb Oracle i IBM, i presumeix de tenir entre els seus clients 18 dels 20 bancs, 19 de les 20 operadores de telecomunicacions, les sis companyies aèries i 14 de les 20 cadenes de distribució més grans del món. Les recomanacions que ens fan Netflix i les botigues iTunes i App Store d’Apple estan calculades amb sistemes de Teradata. I aquí des de la Seguretat Social fins al BBVA, passant per Air Europa, Movistar, Vodafone, Orange i la direcció general de Trànsit els fan servir per extreure informació de la quantitat enorme de dades que acumulen sobre clients i transaccions.

Altres visualitzacions de The art of analytics reflecteixen els sectors que ja estan fent servir l’anàlisi de dades massives. Amb el big data les companyies de telefonia poden saber quines operadores rivals estan trucant als seus clients per proposar-los un canvi; l’empresa de logística Maersk sap quant li costa reparar cada contenidor amb el qual ha transportat ferralla per poder ajustar les tarifes al cost de manteniment; una entitat del tercer sector pot saber quins són els problemes principals que els seus assistents socials identifiquen en les peticions d’ajuda de les famílies i destinar així els recursos de manera més eficient; una companyia d’assegurances pot preveure quina és la probabilitat que una reclamació sigui fraudulenta i assignar-hi un inspector per estudiar-la a fons. Analitzant més de 60.000 rutes directes d’aviació comercial servides per 500 companyies aèries de tot el món es comprova que British Airways s’assembla molt a Lufthansa, mentre que Air France és més pròxima a les aerolínies dels EUA.

A la convenció europea que Teradata ha celebrat aquests dies a Hamburg hem conegut altres casos d’aplicació de les dades massives a la indústria, explicades per clients de l’empresa. L’alemanya BMW no només té en circulació sis milions de cotxes connectats que aporten en temps real dades de trànsit que reverteixen en els altres vehicles de la marca. A més, els sensors incorporats en aquests vehicles en registren de manera continuada les prestacions i permeten al concessionari certificar el tracte que els ha donat el propietari anterior quan arriba l’hora de vendre’ls de segona mà. Es veu que aquesta possibilitat és molt apreciada a la Xina. Monsanto, el gegant nord-americà de la biotecnologia agrícola, ofereix als agricultors una plataforma de sensors instal·lats a la maquinària i al camp mateix que serveixen per optimitzar el rendiment de les collites i gestionar els subproductes. En aquest cas la vinculació amb les dades de previsió meteorològica és evident. En canvi potser no ho és tant que Tesco, la cadena britànica de supermercats, estigui pendent del temps: però el cas és que tenen comprovat que si no està previst que plogui el cap de setmana següent han de reforçar les existències d’amanides, carn per fer a la brasa i carbó, perquè els clients aprofitaran per fer una barbacoa al pati amb els amics.

Stephen Brobst, el director de tecnologia de Teradata, resumeix tots aquests casos en una frase: “No pots gestionar el que no has mesurat”. I la capacitat de mesurar-ho tot està creixent de manera vertiginosa: els 9.000 milions de sensors que ja hi ha al món -cada fitxa de joc als casinos de Las Vegas en porta un- seran més de 20.000 milions abans que s’acabi aquesta dècada. Per això els proveïdors de tecnologia d’anàlisi de dades segueixen ampliant la velocitat i la capacitat dels seus sistemes, tenint en compte factors com ara que la memòria baixa de preu -però no tan de pressa com creix el volum de dades a analitzar-, que ja no es pot preveure l’execució nocturna d’alguns processos perquè a les empreses que operen a tot el món ja no existeix la nit, i que en aquesta mena d’aplicacions cal distingir entre les dades “fredes” i les “calentes”: el 90% de les consultes d’informació afecten menys del 20% de les dades acumulades.

Davant les previsibles reticències dels consumidors a tota aquesta acumulació de dades, Brobst adverteix que aspirar a qualsevol nivell de privadesa és “delirar”: a Londres t’enregistren 100 càmeres de vídeo només mentre vas i tornes de casa a la feina. El màxim que podem esperar és que els recol·lectors d’aquestes dades no en facin un ús incorrecte. I en aquest sentit reconeix que els ciutadans europeus, amb Alemanya i Suècia al capdavant, confien més en els seus governs que els dels EUA. Deu ser per això que Teradata està a punt d’obrir a Alemanya un centre de dades per atendre els seus clients d’Europa.

stats