Una eina pionera de la UPF permet a les persones sordes fer ràdio
El sistema és un prototip que converteix a veu sintètica el que es diu en llengua de signes catalana
BarcelonaLa lluita per l’accessibilitat de tothom als mitjans de comunicació, no només com a receptors sinó també com a emissors, ha fet un pas important. La Universitat Pompeu Fabra (UPF) ha desenvolupat SignarIA, una eina que possibilita a les persones sordes adquirir una veu sintètica amb la qual fer ràdio. El projecte neix arran de la necessitat de resoldre un repte que es va plantejar a la facultat de periodisme d’aquesta institució: com fer participar en els tallers de ràdio la Berta, la primera alumna amb sordesa que s’inscrivia en el seu grau?
SignarIA es basa en la construcció d’una veu electrònica el més natural possible. La persona sorda s’expressa amb llengua de signes catalana i un aparell anomenat Computer Vision descodifica el missatge. Aleshores entra en joc la figura del donant de veu, que en molts casos s’espera que sigui un familiar de la persona amb discapacitat auditiva. La idea de fons és combinar l’empremta sonora latent de la persona sorda amb la prosòdia i l’articulació del donant, que haurà entrenat un sistema d’intel·ligència artificial. El resultat és una veu sintètica personalitzada que té el timbre potencial de la persona que la fa servir. Una cosina de la Berta, de la seva mateixa edat, ha estat la donant.
La principal aportació del sistema és que aquesta conversió entre llengua de signes i veu es fa en directe i en temps real, de manera que la persona pot intervenir en un programa de ràdio i veure com la seva parla signant es converteix en so que pot sentir-se en àudio, a través de les ones o d’internet. Al mateix temps, a través del portàtil, l'usuari pot llegir el que diuen, també en directe, els altres participants en el programa. A partir d'aquí, tot és a punt perquè, el curs que ve quan faci tercer, la Berta pugui assumir les quinze hores setmanals del taller de ràdio que hi ha al programa educatiu, durant deu setmanes.
La manera de funcionar permet afinar molt el missatge. Per cada frase signada, el sistema proposa tres missatges: el primer és literal, el segon aporta context i el tercer conté més creativitat. Amb una màquina amb pedals, l'usuari pot escollir quin dels tres s'adapta millor al que vol dir (o pot descartar-los i generar tres propostes noves). A partir d'aquí, la intel·ligència artificial va coneixent l'estil i la manera de fer de la persona que ho utilitza, i va perfilant cada vegada millor les seves prediccions.
El projecte s’ha impulsat des de la UPF, però s’ha fet amb aliança de We Are Mortensen, l’empresa que ha aportat la tecnologia capaç de fer-ho possible. De moment, està en fase de prototip i la universitat ja ha creat dos grups de discussió: un amb persones sordes signants per analitzar els usos potencials de l’eina i valorar-ne l’impacte, i l’altre amb professorat de la facultat de comunicació per explorar l’aplicació d’aquesta tecnologia tant a l’aula com als locutoris de ràdio. Entre les aplicacions que es veuen més immediates hi ha, per exemple, la utilització en judicis, per garantir als testimonis sords que allò que queda registrat respon fidelment a la seva voluntat.
També s'està treballant en fer el camí invers: que allò que diuen les altres veus participants es transformi a llengua signada, a través d'un avatar creat per intel·ligència artificial. La UPF ha iniciat contactes amb altres centres de recerca que hi estan treballant per mirar de fomentar avenços en aquest sentit. La idea de fons és aconseguir que persones com la Berta no hagin de renunciar a la seva llengua materna, que és la llengua de signes catalana, en el seu cas.
Dades d’accés obert
Un altre dels beneficis del projecte SignarIA és que ha generat un corpus important de dades que es posen en règim de lliure accés, amb l’ànim d’estimular la recerca en el reconeixement i la síntesi de la llengua de signes catalana (LSC). Fruit d’aquesta tasca, combinada amb la feina del grup de recerca en LSC Lab del departament de Traducció i Ciències del Llenguatge de la mateixa universitat, i la de la cooperativa Laifari SCS, s’ha creat una metodologia innovadora per a la creació de dades sintètiques que inclou, per exemple, la conjugació de verbs en llengua de signes catalana. Així, es poden generar exemples lingüístics de manera sistemàtica i escalable, la qual cosa pot facilitar l’aprenentatge d’aquesta llengua.
L’eina es va presentar aquest dimarts en una jornada que va comptar amb les ponències dels dos investigadors principals, Marcel Mauri i Roger Cassany, a banda dels enginyers del projecte, Xavi Vinaixa i Inés Broto. Durant l’acte, la lingüista Gemma Barberà i la coordinadora Cecilia Barba van presentar els resultats qualitatius del projecte. La trobada va incloure també una taula rodona titulada "Periodisme i inclusió, l’assignatura pendent", durant la qual es va abordar la manca de representació de les persones sordes als mitjans de comunicació.
"És una tecnologia que s'adapta a nosaltres i no el clàssic cas de quan nosaltres ens hem d'adaptar a una tecnologia", valora Cassany. "Hi ha, per tant, una reivindicació també de la sobirania tecnològica, que neix de les nostres necessitats i no ve imposada per les grans corporacions. És per això que és una tecnologia oberta, al servei de les universitats i centres de recerca".