Intel·ligència artificial per descriure les fotos a les persones cegues

Facebook crea un sistema d'etiquetatge totalment automàtic que identifica els elements principals d'una imatge

Auri Garcia Morera
2 min
El sistema d'etiquetatge automàtic de Facebook, en acció. / FACEBOOK

BarcelonaEls usuaris de Facebook publiquen a la xarxa social 2.000 milions d'imatges cada dia. Fins ara, el contingut d'aquestes fotos quedava fora de l'abast de les persones cegues, ja que els sistemes de lectura de pantalla només els recitaven el nom de l'autor i el text publicat juntament amb la imatge, que sovint és un comentari que no descriu el que ja es pot apreciar mirant-la.

A partir d'aquest dimarts, els usuaris de les aplicacions per a iPhone i iPad amb el lector de pantalla configurat en anglès podran gaudir d'una experiència radicalment diferent, ja que Facebook començarà a descriure el contingut de les fotos per a les persones cegues, amb un nou sistema d'etiquetatge automàtic que utilitza intel·ligència artificial.

Al vídeo de presentació, Facebook mostra exemples com una actualització amb el text "Amb els meus col·legues de la universitat al meu lloc preferit, a punt per a un cap de setmana fantàstic" i una fotografia d'un bosc. Fins ara les persones cegues es quedaven sense saber quin lloc era, i amb el nou sistema el lector de pantalla els diu: "La imatge pot contenir: arbre, cel, exterior".

Segons detallen en aquest article els responsables d'accessibilitat de Facebook, el sistema utilitza una xarxa neuronal profunda, que imita el funcionament de les neurones del cervell, i té milions de paràmetres d'aprenentatge. A diferència d'altres sistemes, l'aprenentatge és supervisat per humans, i la primera versió s'ha limitat a una selecció amb només un centenar de conceptes.

Facebook ha optat per començar a desplegar aquesta funció amb prudència, assegurant que les etiquetes assignades tenen molta fiabilitat, per evitar relliscades com la de Google Photos, amb un sistema de classificació automàtica que durant els primers dies en funcionament va confondre dos joves negres amb goril·les.

Després que un dels afectes denunciés la situació a través de Twitter i generés una gran polèmica, un portaveu de Google va demanar disculpes per l'error i va assegurar que hi havia molta feina per fer en l'etiquetatge automàtic d'imatges i que l'empresa ja havia començat a estudiar com es podien prevenir aquest tipus d'errors en el futur.

Twitter va anunciar fa uns dies una funció per introduir descripcions manualment  / TWITTER

Fa uns dies Twitter va anunciar una nova funció amb el mateix objectiu que Facebook, però sense cap mena d'automatització. Les seves aplicacions mòbils per a iOS i Android permeten als usuaris introduir descripcions de les fotografies de manera manual, que després es posen a disposició dels sistemes de lectura de pantalla.

La possibilitat de recórrer a descripcions creades manualment per humans ha estat expressament descartada per Facebook, que considera que és una opció que no pot funcionar "a gran escala i sense introduir un retard en l'experiència dels usuaris". La seva tecnologia permet fer-ho automàticament i, segons diu l'empresa, amb "precisió raonable".

stats