La IA europea no parlarà català si no és llengua oficial

La incorporació del català a les eines de traducció oficials de la UE no és un problema de manca de dades, sinó de reconeixement institucional

22/03/2026

Que es pugui parlar en català a l’hemicicle i que els ciutadans puguin fer consultes i rebre respostes en aquesta llengua és una de les conseqüències més vistoses i comentades que es derivarien de l’oficialitat del català a la Unió Europea. Però tot i la seva importància, pràctica i simbòlica, aquest reconeixement també tindria avantatges en el desenvolupament tecnològic. De fet, és un element vital per potenciar aquest desenvolupament.

“L’oficialitat portaria més demanda i més inversió sostinguda en eines lingüístiques per al català, com ara traducció i interpretació automàtica”, afirma Maite Melero, que dirigeix el grup de recerca de Traducció Automàtica de l’AI Institute al Barcelona Supercomputing Center (BSC-CNS) i és una de les responsables del projecte AINA, que té l’objectiu de garantir la presència del català en l’era digital.

Cargando
No hay anuncios

Una de les eines que incorporaria el català seria el traductor neuronal d’última generació eTranslation, el sistema de traducció automàtica oficial de la Comissió Europea. Actualment, aquest sistema tradueix cap a i des de les 24 llengües oficials de la UE, així com cap a l’àrab, el xinès, l’islandès, el japonès, el noruec, el rus, el turc i l’ucraïnès.

Cargando
No hay anuncios

Una de les peces essencials d'aquest sistema de traducció és la base de dades IATE (Interactive Terminology for Europe), que recull tota la terminologia utilitzada a les institucions europees. Va ser creat el 1999 i a la seva web dona una resposta explícita i clara sobre per què certes llengües no hi estan incloses: “La versió pública de l’IATE conté les 24 llengües oficials de la Unió Europea”.

Un obstacle polític, no tecnològic

La integració del català a eTranslation no suposa un problema tecnològic. “Al principi ens deien que per incorporar el català necessitaven grans corpus de dades paral·leles entre català i anglès. Quan en el context d'AINA vàrem compilar aquestes dades, la resposta va ser que ara l'obstacle no era tècnic sinó polític”, explica Melero. El TERMCAT, en col·laboració amb la UOC, ha traduït els termes de l’IATE al català.

Cargando
No hay anuncios

La presència de la nostra llengua a eTranslation és cabdal, perquè aquest traductor no està només a disposició de les institucions de la UE, sinó que també s’ofereix de forma gratuïta a les administracions públiques nacionals, ens locals i regionals, petites i mitjanes empreses, el món acadèmic i les organitzacions no governamentals. Imaginem, doncs, la repercussió que tindria.

Actualment, el català disposa d'una base sòlida de recursos lingüístics digitals. El projecte AINA ha generat corpus –gran conjunt de textos en format digital que permet entrenar eines lingüístiques– més que suficients per poder-lo incorporar a eTranslate i a altres eines d’intel·ligència artificial. Com a exemple, AINA ha creat CATalog, un corpus textual massiu compost per més de 17.400 milions de paraules repartides en més de 34 milions de documents procedents de fonts molt diverses.

Cargando
No hay anuncios

“El volum i la diversitat que hi ha en els corpus en català és molt superior als d’altres idiomes”, explica Albert Cuesta, periodista especialitzat en tecnologia que ha elaborat l’estudi La IA en el futur de les llengües europees no hegemòniques, publicat recentment per les fundacions Irla, Coppietters i Accent Obert. “Els corpus de l’irlandès, el maltès, les llengües bàltiques, l’eslovè, l’eslovac, el croat i l’hongarès –afegeix– estan força esbiaixats cap al contingut jurídic, com a fruit del seu caràcter oficial dins de la UE, que obliga a traduir les normatives comunitàries”.

Cuesta remarca que la UE ha estat pionera en la regulació de la IA amb la llei d’intel·ligència artificial del juny del 2024. I considera que “tot i que la llei no esmenta directament les llengües, pot afavorir la inclusió de les no hegemòniques. La Directiva de Serveis Digitals, que complementa la regulació de la IA, exigeix que les plataformes en línia proporcionin termes i condicions en totes les llengües oficials de la UE, suport al client multilingüe i interfícies localitzades”.

Cargando
No hay anuncios

Aquest expert en tecnologia, firma habitual de l'ARA, considera que l’oficialitat, a part del prestigi que aportaria, faria més fàcil un dels objectius de la Fundació Accent Obert, que treballa entre altres coses per promoure la presència del català en l’àmbit digital, com ara en aplicacions o en productes. L’any passat, per exemple, va aconseguir que la xinesa BYD i Seat Cupra l'incorporessin als seus automòbils. Però remarca que “també hi juga a favor la demanda implícita de català per part dels ciutadans catalanoparlants, configurant els seus ordinadors i mòbils amb el català com a idioma preferit. Per això tenim en marxa la campanya configura.cat”.

Tots aquests avenços necessiten recerca prèvia. Per a Melero, l’oficialitat permetria obtenir “moltes més dades paral·leles i terminologia institucional de qualitat i donaria un impuls a la recerca, perquè el català estaria present sempre en estàndards d’avaluació, en recursos oberts i en projectes europeus.”

Cargando
No hay anuncios

Seria, doncs, una forma d'estimular el mercat i augmentar els recursos per a la recerca i la innovació amb solucions tecnològiques que incloguin la nostra llengua. A banda, òbviament, de respectar els drets digitals dels catalanoparlants.