28/09/2023

Internet està a punt d'empitjorar, i molt

5 min
Les inicials de la intel·ligència artificial (AI en anglès) sobre la placa mare d'un ordinador.

Fa poc Greg Marston, un actor de veu britànic, va descobrir per casualitat a internet el Connor: un clon de la seva veu generat per IA a partir d’una gravació seva del 2003. Era la seva veu pronunciant paraules que mai havia dit.

Inscriu-te a la newsletter Pensem Les opinions que et fan pensar, t’agradin o no
Inscriu-t’hi

Aquell any va fer un enregistrament per a IBM i, més tard, va firmar un document que autoritzava la companyia a utilitzar-lo per a finalitats molt diverses. No cal dir que aleshores a Marston no se li va acudir que IBM pogués fer servir res que no fossin les frases exactes que havia enregistrat. Vet aquí, però, que gràcies a la intel·ligència artificial IBM va poder vendre el seu tall de veu de fa dècades a webs que l’aprofiten per crear una veu sintètica capaç de dir qualsevol cosa. Marston va descobrir fa poc que la veu que se sentia a la web del torneig de Wimbledon durant un partit era la seva. (IBM ha dit que és conscient de la preocupació de Marston, i n’està parlant directament amb ell.)

Aquesta desagradable situació explica per què molts dels creadors més coneguts del país han posat el crit al cel. Vivim un moment de desgast de la confiança, perquè ens adonem que les nostres aportacions a un espai públic es poden aprofitar, monetitzar i fins i tot utilitzar per competir amb nosaltres mateixos. Em preocupa la perspectiva que, quan aquest desgast sigui ja total, els nostres espais públics digitals estiguin encara més contaminats de continguts poc fiables.

Ja hi ha artistes que estan traient les seves obres de X –abans Twitter– perquè la companyia ha dit que aprofitaria les dades de la seva plataforma per alimentar la seva IA. Els guionistes i actors de Hollywood han estat fent vaga en part perquè volen assegurar-se que el seu treball no s’introduirà en sistemes d’IA que les empreses puguin utilitzar per substituir-los. Alguns mitjans de comunicació, com ara The New York Times i la CNN, han afegit fitxers al seu lloc web per impedir que els xatbots d’IA n’extreguin continguts.

Els escriptors estan presentant demandes contra empreses dedicades a la IA, acusant-les d’introduir els seus llibres en les dades d’entrenament d’aquestes webs. OpenAI ha al·legat, en un procés judicial a part, que l’ús de dades amb drets d’autor per alimentar els sistemes d’IA és legal, segons la disposició d’“ús legítim” (fair use) de la llei de drets d’autor dels Estats Units.

Mentre els creadors de continguts de qualitat impugnen l’ús que es fa del seu treball, els continguts de caràcter dubtós elaborats per la IA irrompen a l’esfera pública. NewsGuard ha identificat 475 webs de notícies i informació generades per IA en 14 idiomes. La música creada a partir d’intel·ligència artificial està inundant els llocs web de streaming i genera així drets d’autor per a estafadors. Els llibres elaborats mitjançant IA –com ara una guia per buscar bolets que pot induir a errors en la identificació d’exemplars molt verinosos– són tan freqüents a Amazon que aquesta companyia demana als autors que s’autopubliquin les obres a la seva plataforma Kindle i que també hi facin constar si han recorregut a la intel·ligència artificial.

La intel·ligència artificial és capaç de generar productes culturals.

És un cas clàssic de la típica tragèdia dels béns comunals: un recurs comú es veu perjudicat pels interessos lucratius d’uns quants. L’exemple tradicional és el d’uns terrenys públics on pastura el bestiar. Si no hi ha límits, els propietaris de bestiar tenen un incentiu per sotmetre aquelles terres a un pasturatge excessiu i destruir-ne així el valor per a tothom.

A internet també hi tenim elements que són béns comunals. Tot i els seus amagatalls tòxics, encara hi ha moltes webs plenes de dinamisme al servei del bé públic: llocs com la Viquipèdia i els fòrums de Reddit, en què uns voluntaris de bona fe comparteixen sovint coneixements i s’esforcen per mantenir a ratlla els actors nocius.

Però aquests béns comunals estan sent ara sobreexplotats per cobdicioses companyies tecnològiques que volen aprofitar tota la saviesa i experiència dels humans, l’humor, les anècdotes i els consells que troben en aquestes webs per alimentar els seus lucratius sistemes d’intel·ligència artificial.

Penseu, per exemple, que els voluntaris que desenvolupen i mantenen la Viquipèdia confiaven que el seu treball s’utilitzaria de conformitat amb les condicions estipulades a la seva web, que exigeixen que se’n citi la font. Ara, però, es veu que hi ha usuaris que debaten si disposen d’algun recurs legal contra els xatbots que reprodueixen els seus continguts sense citar la Viquipèdia.

Els organismes reguladors també intenten trobar-hi una solució. La Unió Europea es planteja un primer paquet de restriccions globals per a la IA que exigiria un grau concret de transparència en els sistemes d’intel·ligència artificial generativa, com ara uns resums de les dades protegides amb drets d’autor que han introduït als seus sistemes.

Seria un pas endavant en la bona direcció, perquè molts sistemes d’IA no revelen totes les dades amb les quals s’han alimentat. Han sigut sobretot els periodistes els que han tret a la llum les tèrboles dades que s’amaguen sota la lluent superfície dels xatbots. Una investigació acabada de publicar a la revista The Atlantic ha revelat que més de 170.000 llibres piratejats s’han introduït en les dades d’entrenament de Llama, el xatbot d’intel·ligència artificial de Meta. I una investigació del Washington Post ha descobert que el ChatGPT d’OpenAI es basa en dades extretes sense consentiment de centenars de milers de llocs web.

Però amb la transparència no n’hi ha prou per reequilibrar el poder entre els que veuen com s’exploten les seves dades i les empreses disposades a treure un profit econòmic d’aquesta explotació.

Tim Friedlander, fundador i president de l’Associació Nacional d’Actors de Veu, ha demanat a les empreses d’IA que adoptin unes normes ètiques. Diuen que els actors necessiten que es respectin tres C: consentiment, control i compensació.

En realitat, tots nosaltres necessitem aquestes tres C. Tant si som actors professionals com si només publiquem imatges a les xarxes socials, tothom ha de tenir dret a decidir si consent que la seva vida a les xarxes alimenti les màquines gegants de la IA.

I per donar aquest consentiment o no, no s'haurien d'haver de buscar i clicar un munt de botons d’inhabilitació difícils de trobar, que és cap on va el sector.

La compensació és més difícil de calcular, sobretot perquè ara com ara la majoria de bots d'IA són sobretot serveis gratuïts. Però no us equivoqueu: la indústria de la IA té plans de fer diners amb aquests sistemes, i quan en faci haurà de passar comptes amb els que han vist com el seu treball ha servit per fer créixer aquests beneficis.

Estan en joc els mitjans de vida de gent com Marston. L’actor calcula que el seu clon fet amb IA ja li ha fet perdre algunes feines i li rebaixarà considerablement els ingressos en el futur. Ha contractat un advocat per demanar una indemnització: “Mai he acceptat ni consentit que em clonessin la veu perquè es pogués sentir o escoltar en públic i em fes així la competència a mi mateix”.

Però fins i tot els que no veiem la nostra feina amenaçada directament per la IA de vegades volem escriure una novel·la, compondre una cançó, gravar un vídeo a TikTok o fer una broma a les xarxes socials. Trobo preocupant que, si no tenim cap protecció contra els excessos en la captura de dades per a la IA, ens arribi a semblar que no té cap sentit intentar crear res per publicar a les xarxes. I això seria una autèntica tragèdia.

Copyright The New York Times

Julia Angwin és periodista d'investigació
stats