La IA en català

"He vist al professor": la IA propaga faltes en català (per influència del castellà)

Un estudi de la UPF alerta que l'entrenament de la IA en anglès i castellà té conseqüències per a la llengua

26/02/2026

BarcelonaUn estudi de la Universitat Pompeu Fabra (UPF) demostra que les eines d'intel·ligència artificial generativa (IA) més populars propaguen faltes en català perquè estan entrenades en castellà, a banda de l'anglès: es propaguen formes no normatives en les estructures gramaticals i el lèxic català per influència d'aquestes llengües globals. L'estudi, liderat pel professor Thomas Brochhagen del departament de traducció i ciències del llenguatge de la UPF i publicat a la revista Linguamática, és pioner a demostrar el biaix cap al castellà.

Inscriu-te a la newsletter LlenguaEn català i sense complexos
Inscriu-t’hi

Per a la investigadora Mireia Almena (UPF), "les IA no només reprodueixen el llenguatge, sinó que també influencien la seva evolució i poden tenir un impacte molt més gran en llengües com el català, amb menys volum de contingut escrit en mitjans digitals, que sobre d’altres idiomes amb més parlants i capacitat de producció de textos com l’anglès, l’espanyol o el xinès". Per això, demanen a les institucions que treballin per millorar aquests biaixos. De fet, la Fundació Accent Obert ja ha anunciat que faran passar els exàmens oficials dels estudiants catalans a les IA més populars per avaluar-ne el coneixement de català i de cultura catalana, per objectivar les mancances en aquest camp.

Cargando
No hay anuncios

Escampar errors

L'estudi ha analitzat sis models tecnològics, com ChatGPT i Gemini, a partir d’un corpus d’avaluació de 160 oracions, corresponents a vuit estructures gramaticals diferents que solen plantejar dubtes pel que fa a l’ús de la preposició adequada. Per exemple, en el cas de l’ús o no de la preposició davant d’objecte directe. En castellà es fa servir preposició mentre que en català la norma general és no fer-ne servir. És a dir, diríem "he visto al profesor" en castellà i "he vist el professor" en català. També han detectat errors per factors aliens al castellà en frases com "No soc gens propens d'enfadar-me [seria a enfadar-me] per bajanades".

Cargando
No hay anuncios

A l'hora de triar preposicions normatives o no, les IA multilingües s’equivoquen en un 55% dels casos per influència del castellà i en un 4% dels casos per altres motius, segons l'estudi. Les IA monolingües s'equivoquen en un 27% dels casos.