De la Norma a l’AINA: la normalització digital del català

El Govern engega el projecte AINA per garantir l’ús del català en serveis i aplicacions d'Intel·ligència Artificial (IA) i de Tecnologies del Llenguatge

3 min
El conseller Puigneró, durant la presentació del projecte AINA

Una nena eixerida que es deia Norma es va convertir l'any 1982 en la imatge de la campanya del Govern per la normalització del català. Aquella nena ens recordava que "El català és cosa de tots". Avui, 30 anys després, arriba AINA, el projecte del Govern per garantir el català en l'era digital.

Impulsat pel Departament de Polítiques Digitals, amb la col·laboració del Barcelona Supercomputing Center, AINA pretén dotar el català dels recursos digitals i lingüístics perquè esdevingui una llengua competitiva al món digital i assegurar-ne així la seva supervivència futura.

La Norma

No estem parlant d’un assistent de veu com l'Alexa o la Siri; de l'AINA podríem dir, en certa manera, que és la seva mestra. De fet, AINA permetrà generar els recursos lingüístics necessaris per facilitar el desenvolupament del català en serveis i aplicacions d'Intel·ligència Artificial (IA) i de Tecnologies del Llenguatge, com ara assistents de veu, traductors automàtics o agents conversacionals en català.

En un primer moment s’ha creat el corpus del català —en la varietat estàndard— més gran elaborat mai fins ara, amb 1.770 milions de paraules amb metadades de context. Ara, amb l’impuls del Departament de Polítiques Digitals, es crearan nous corpus per incorporar les diferents variants dialectals del català, diferents registres lingüístics (col·loquial, literari, administratiu, etc.) i arxius de veu i imatge. La Corporació Catalana de Mitjans Audiovisuals (CCMA) aportarà tot el seu repositori documental.

El proper pas serà entrenar la xarxa neuronal perquè aprengui el català tot generant models de la llengua, de la parla i per a la traducció. Tots els models que es crearan estaran a disposició de totes aquelles empreses o entitats que les vulguin fer servir, ja que es publicaran en obert i amb llicències permissives.

El projecte té un pressupost de 13,5 M€, que es finançaran amb els fons NextGenerationEU, i arrenca amb una aportació inicial de 250.000 € del Departament de Polítiques Digitals.

Això ha de permetre que el català faci un salt qualitatiu i quantitatiu en l’ecosistema digital. De fet, el món digital és avui una oportunitat i un repte per a la llengua catalana. Actualment, les tecnologies de veu i les aplicacions i interfícies de veu per a l’accés al món digital són estratègiques per al desenvolupament ple de la llengua en tots els sectors. La interacció entre les persones i la tecnologia ha entrat en una nova fase on cada vegada menys es fa a través de dispositius com el teclat, el ratolí o les pantalles tàctils, per donar pas a una nova forma d’interacció més natural a través de la veu i la parla. I aquest fet atorga especial rellevància a la llengua, que esdevé un dels principals vehicles d’interacció.

Assegurar el futur de la llengua

L’objectiu últim és que la ciutadania pugui participar en català en el món digital al mateix nivell que els parlants d’una llengua global, com ara l’anglès, i evitar així l’extinció digital de la llengua.

El projecte ha estat batejat amb el nom d'AINA en homenatge a la filòloga menorquina Aina Moll, figura central de la promoció i la normalització del català i primera directora general de Política Lingüística de la Generalitat de Catalunya del 1980 al 1988. Ella va ser l'artífex del llançament, el 1982, de la primera campanya institucional de sensibilització sobre l'ús de la llengua "El català, cosa de tots", que, amb el popular personatge de la Norma al capdavant, tenia com a objectiu conscienciar la societat sobre la situació sociolingüística del català. Un any després, s'aprovava la primera llei de normalització lingüística. A més a més, AINA conté una referència a la tecnologia AI (intel·ligència artificial en anglès) que farà possible la normalització del català en l'àmbit digital.

stats