DÍGITS I ANDRÒMINES

Com ensenyar-li català a un altaveu

Els sistemes de les majordomes digitals d’Amazon i Google han començat el procés d’entrenament de veu que permetrà dialogar amb elles també en català

Tot indica que la veu acabarà sent la nostra manera preferent d’interactuar amb la tecnologia. Gràcies als progressos en intel·ligència artificial, les ordres verbals i el diàleg amb les màquines en llenguatge natural substituiran en molts casos la manipulació de botons, els clics de ratolí i els tocs sobre una pantalla tàctil. Cadascun dels gegants digitals ha creat la seva majordoma digital -en parlo en femení perquè pràcticament totes tenen veu de dona-: la Siri d’Apple, l’Alexa d’Amazon, l’Assistant de Google i la Bixby de Samsung són les més populars a Occident, i saben comunicar-se en anglès, en espanyol i en altres idiomes amb centenars de milions de parlants.

En canvi, els parlants de llengües més modestes com el català encara no tenim aquesta possibilitat. Si volem dialogar amb qualsevol de les majordomes digitals esmentades -o amb alguna de les desenes menys conegudes aquí- hem de canviar d’idioma i parlar en algun dels pocs que entenen. Si més no, fins ara: tant Amazon com Google, responsables d’Alexa i Assistant, tot just han iniciat el procés d’entrenament en català de les seves respectives intel·ligències artificials, les més populars en el nostre mercat. Les dues empreses s’afegeixen així a una tercera iniciativa, Common Voice de la fundació Mozilla, que ja porta uns mesos en marxa. Els tres projectes tenen un aspecte en comú: demanen als consumidors catalanoparlants que siguin ells els que li ensenyin català a la plataforma. Però cadascun ho fa de manera diferent.

Common Voice: llegir i verificar

El català és un dels idiomes amb què Mozilla vol construir el corpus parlat en què basarà un futur assistent propi per al seus navegadors web, a més d’oferir-lo en règim de codi obert a qualsevol empresa o institució interessada. Per participar en el seu entrenament us heu de donar d’alta a voice.mozilla.org i triar l’idioma que voleu ajudar a entrenar -en el nostre cas, el català-, supervisats per voluntaris de SoftCatalà. A partir d’aleshores, des de l’ordinador o el telèfon mòbil, podeu donar la vostra veu, llegint en veu alta cadascuna de les frases que aniran apareixent a la pantalla del dispositiu, o bé validar frases llegides per altres participants. Per a cada frase cal indicar si considereu que està ben llegida o no.

Tant la donació de la veu pròpia com la verificació de veus alienes es poden repetir tantes vegades com es vulgui. Els experts consideren que calen entre 1.000 i 1.200 hores d’entrenament per considerar que un idioma està preparat per sortir a producció. Actualment, el català porta assolida una quarta part d’aquest volum recomanat.

Google Assistant: llegir cobrant

Google ha optat per entrenar la seva Assistant igual que Mozilla: mostrant fragments de text a la pantalla de l’ordinador o el telèfon per tal que els usuaris les llegeixin en veu alta, havent indicat prèviament la seva edat i gènere. Val a dir que els textos que cal llegir no són tan estructurats com els de Common Voice, i sovint no tenen cap sentit aparent. A més, no es pot escoltar o corregir el que acabem de llegir, ni verificar el que altres persones han llegit. De fer això se n’encarrega l’empresa Lionbridge de serveis lingüístics, a qui Google sembla que ha contractat per al procés d’entrenament en diversos idiomes, inclòs el català. Un aspecte destacable és que la participació dels usuaris és remunerada: Lionbridge ofereix 10 euros per llegir 200 fragments de text, un import que s’abonarà mitjançant PayPal i que augmenta fins als 25 euros si el lector és menor d’edat, previ consentiment patern.

No espereu fer-vos rics ensenyant català a Google Assistant. No es tracta d’ingressar 10 euros per cada lot de 200 frases. Cada participant pot llegir-ne només 200, de manera que els màxims honoraris possibles són 10 euros i prou. Si encara hi teniu interès, us podeu inscriure en aquesta adreça.

Alexa: ensenya’m jugant

Amazon és la tercera empresa que ens proposa ensenyar català a la seva majordoma digital Alexa, i fent-ho de manera enginyosa: transformant l’entrenament en un joc verbal dinamitzat per l’Alexa mateixa, que li va demanant a l’usuari (en espanyol o en l’idioma que tingui configurat) que li doni (ara ja en català) ordres (“ Dime que apague las luces ”, “ Pídeme que añada un producto de cocina a la lista de la compra ”) o li faci consultes (“ Piensa en un músico que te guste y pregúntame cuándo editó su primer disco ”, “ Pregúntame qué tiempo hará mañana en una ciudad que te gustaría visitar ”).

Per participar-hi cal descarregar l’aplicació mòbil d’Alexa, crear un perfil d’usuari -si sou clients d’Amazon ja el teniu- i activar la skill (així anomena Amazon les aplicacions per a la plataforma- anomenada Cleo). Fet això, només cal ordenar-li a l’Alexa que obri Cleo -“ Alexa, abre Cleo ”- i seguir les indicacions del sistema. Al final de cada sessió, l’usuari obté recompenses en forma de medalles virtuals, sense cap altre valor que l’orgull d’haver-hi col·laborat.

S’hi pot participar fent servir només l’aplicació mòbil, però resulta més divertit fer-ho dialogant amb un altaveu connectat a Alexa, com els Amazon Echo. Val a dir que al principi costa una mica acostumar-se a rebre instruccions en espanyol -o anglès, o francès- i atendre-les en català, però s’acaba agafant el costum. En aquest cas tampoc no és possible revisar ni rectificar les frases que hem dit, i, tot i que suposadament l’Alexa reconeix les veus de diverses persones per a un únic perfil, encara no he aconseguit que Cleo comptabilitzi per separat les de cada membre de la família.

Quan parlaran en català?

Tant Amazon com Google han declinat indicar cap data per al desplegament de l’idioma català en les seves respectives majordomes digitals. Ni tan sols admeten que estiguin entrenant-les en el nostre idioma. Però, considerant que gairebé el 80% dels catalans voldrien poder parlar en català amb el seu assistent virtual -enquesta de GESOP per a la direcció general de Política Lingüística- i que el govern de la Generalitat ha acordat exigir als proveïdors de tecnologia que tots els productes que disposin d’interfície de veu incloguin almenys el català, que no quedi perquè nosaltres no hi hem posat el nostre gra de sorra.