CIÈNCIA

¿És possible que un robot detecti la sàtira amagada al llenguatge?

Científics de la UPF reben un premi per crear una eina que ho fa

Mario Martín Matas

14/10/2015

3 min

Barcelona“Jordi Pujol torna la medalla d’or que li va ser concedida als Jocs Olímpics del 92”. Aquest tuit, que destil·la una certa ironia, ja pot ser classificat adequadament per un programari creat expressament per detectar la sàtira. Aquesta màquina, ideada per un grup de científics, està dissenyada per discriminar, amb més o menys encert, si darrere dels 140 caràcters que conformen els missatges de la popular xarxa social s’hi amaga o no una dosi d’humor.

Francesco Barbieri, Francesco Ronzano i Horacio Saggion són els tres investigadors de la UPF que han desenvolupat aquest programari. Per això han guanyat el premi al millor article científic en l’últim congrés anual de la Societat Espanyola per al Processament del Llenguatge Natural. La idea de fons és avançar en el disseny d’una màquina que, algun dia, sigui capaç de detectar la ironia o la sàtira que s’amaga en el llenguatge i que, paradoxalment, de vegades ni els humans som capaços de detectar.És una de les limitacions evidents amb què s’enfronten. No tothom entén igual una broma o un acudit i, per tant, programar una màquina perquè ho faci difícilment tindrà un caràcter universal. Una altra limitació té a veure amb el context en què es diu una cosa. El mecanisme ideat pels investigadors de la UPF s’ha centrat en el text que incorporen els tuits, però què passa si aquests tuits tenen un enllaç associat, o una imatge que enriqueix la frase inicial? “Em sembla molt difícil que algun dia alguna màquina sigui capaç de detectar la sàtira amagada en el llenguatge en una situació no controlada”, apunta Saggion, que recorda que els treballs actuals es centren en “situacions artificials creades al laboratori”.

Cargando

No hay anuncios

Fa anys que nombrosos grups d’investigadors treballen en aquest camp del llenguatge, però els coneixements encara són a les beceroles, diu Saggion. El seu grup s’ha centrat en l’anàlisi de tuits en castellà, agafant bona part dels avenços d’altres grups que ja ho havien fet en anglès. Segons explica, el seu mecanisme és capaç de detectar correctament el 70% dels tuits que analitza i, tot i que encara hi ha molt de marge de millora, es tracta d’un percentatge força elevat. Al cap i a la fi, els tuits són una situació concreta, més fàcil de discriminar que una conversa oberta entre dues persones en què, per exemple, el llenguatge gestual o el to de veu utilitzat també pot amagar dobles sentits o missatges contraris al que diuen les simples paraules. “La nostra màquina pot afegir aspectes addicionals que milloraran la detecció, i hi estem treballant, però passaran molts anys abans que una màquina pugui detectar la ironia en una situació oberta i improvisada”, afegeix.

Dos anys de feina

Cargando

No hay anuncios

L’equip de Saggion fa dos anys que desenvolupa la seva màquina. La base per programar-la van ser 6.000 tuits reals fets per quatre comptes diferents de Twitter. Dos mitjans de comunicació considerats seriosos - El País i El Mundo -, i dos més d’humor - El Mundo Today i la revista El Jueves -. A partir d’aquí, i gràcies a diversos algoritmes que tenen en compte, per exemple, la positivitat o negativitat d’una paraula, miren de classificar el tuit. Òbviament, sense tenir en compte la font emissora, perquè això desvirtuaria tota la feina. “Els nostres algoritmes no arriben a la perfecció”, reconeix Saggion, tot i que els primers passos ja estan fets.

En el seu cas concret, han trobat dificultats en algunes interseccions temàtiques i en cert vocabulari superposat. També hi ha problemes per discriminar paraules inventades, que no estan recollides en cap diccionari normatiu, o bé que tenen una accepció diferent. És per això que el grup de recerca del departament de tecnologies de la informació i les comunicacions ja treballa per reduir el 30% d’errors. A més a més, també té previst avançar més enllà del Twitter i ampliar l’ús de la màquina a altres tipus de textos escrits.

Cargando

No hay anuncios

De fet, si tot fos tan fàcil, el programari ideat per Barbieri, Ronzano i Saggion no passaria per alt ironies evidents que de moment no és capaç de discriminar. “El govern espanyol regala al rei Joan Carles I l’armadura d’Ironman per assegurar-li que continuarà sent inviolable” o bé “Felip VI busca a Blablacar acompanyants per al trajecte que farà el seu Rolls-Royce durant la seva coronació” són exemples clars de tot el camí que encara falta per córrer en aquest camp.