22/04/2023

Ja no som parlants de català

4 min
Logo de Google

Ja no som parlants de català. Ara som, sobretot, usuaris de català. Som consumidors i creadors de contingut. Les nostres interaccions a la xarxa són contribucions al corpus lingüístic d’internet i les podem fer o bé en la nostra llengua o en alguna altra amb més usuaris. Com que al territori digital l’acte comunicatiu implica la possibilitat de guanyar visibilitat, la tria lingüística és altament significativa: la llengua es lliga al capital simbòlic i a l’econòmic. No és pas res de nou, però els estudis demostren que en el terreny tecnològic es produeix una amplificació tant de les jerarquies sociolingüístiques (entre llengües i entre variants) com de l’homogeneïtzació. 

Inscriu-te a la newsletter Pensem Les opinions que et fan pensar, t’agradin o no
Inscriu-t’hi

Ara bé, no tot està relacionat amb la rendibilitat econòmica i el poder. La tendència de marginar encara més allò que ja és als marges és una característica intrínseca de la intel·ligència artificial en general. En primer lloc, perquè les mostres extretes d’internet amb què s’entrenen les màquines ja contenen biaixos. Agafem l’exemple dels articles de la Viquipèdia, que sabem que es fan servir per entrenar el famós ChatGPT. Si analitzem aquesta font, veurem que la majoria de redactors de la Viquipèdia són homes i que aproximadament el 80% de les biografies són d’homes. Això es tradueix en un clar biaix de gènere, tant pel contingut descriptiu dels articles com pel punt de vista des d’on s’articula el discurs. El biaix, a més, s’amplifica, ja que la màquina prioritza allò que és més recurrent. Aquest tipus de funcionament seria el segon punt: els sistemes d’aprenentatge automàtic, fins i tot si són d’aprenentatge profund (deep learning), estan programats per detectar la freqüència en la correlació. Així doncs, inevitablement, la IA que genera o tradueix textos estandarditza i simplifica. Empobreix i homogeneïtza la llengua. I amplifica biaixos. Per tant, al territori digital es produeix una doble marginalització: la de l’aprenentatge automàtic (machine learning) i la de l’interès capitalista.

Com a usuaris de català, el destí de la nostra llengua es lliga més que mai a l’eficiència econòmica o, en el millor dels casos, a la bona voluntat de les macroempreses tecnològiques. Per contrarestar aquestes inèrcies, el projecte Aina –que depèn de la Generalitat i del Govern de les Illes Balears– treballa per la presència del català, en totes les seves variants, com a llengua tecnològica. Més enllà dels esforços governamentals, la presència del català en les eines tecnològiques també està supeditada a les nostres contribucions al corpus de la xarxa. A la vitalitat i l’ús de la llengua a internet. En aquest sentit, el prestigi digital del català ha patit un cop dur darrerament. Alguna cosa ha canviat en el funcionament del motor de cerca de Google i els resultats ja no respecten la configuració de preferència idiomàtica. Sense entrar en detalls, ara cal ser tan esforçat per accedir a la versió en català d’un web, que aviat es convertirà en un “afegit” prescindible. Sigui quin sigui el motiu de fons que hi ha rere el nou algoritme de cerca, el canvi de Google es converteix en una intervenció ideològica de conseqüències nefastes per a una llengua com la nostra. Des de l’aliança per a la presència digital del català, ja es treballa per revertir la situació. 

Malauradament, aquestes croades lingüístiques al territori digital ens arriben sense haver fet els deures de normalització a peu de carrer. I sense que encara hàgim pogut resoldre altres temes essencials de política lingüística. Resulta força irònic que la pàgina web de la UE dedicada a promoure el multilingüisme a la xarxa no estigui disponible en català. La UE advoca per la diversitat lingüística, però sempre dintre dels límits que els poders establerts –com l’espanyol– fixen. Perquè, ho sap tothom i és profecia, l'homogeneïtzació cultural és un requisit per a la concentració de poder i capital. “En tota la terra es parlava una sola llengua i es feien servir les mateixes paraules”. Així comença el relat de la Torre de Babel al Gènesi. Per evitar l'ascensió imparable de l’ésser humà, Déu desarticula el poder social creant la diversitat lingüística. Però la maledicció bíblica de Babel també es pot llegir com un remei contra l’imperialisme. La diversitat cultural és la nostra gran eina per evitar que els poders hegemònics continuïn eixamplant-se. Si, com moltes veus defensen, natura i cultura són un continuum, preservar els ecosistemes lingüístics és tan fonamental com preservar els sistemes biològics. 

Diu la sociolingüista Marina Massaguer que tots som política lingüística. En el terreny digital, aquesta afirmació esdevé encara més transcendent, perquè les nostres contribucions en català al corpus digital són indispensables tant per a la supervivència de la llengua com per a la necessària diversitat cultural global. I més: per ara, encara som alguna cosa més que usuaris de català.

Elvira Prado-Fabregat és artista, filòloga i investigadora en 'performance studies'
stats