La IA que amenaçava amb revelar una infidelitat (i altres contes)
Poques escenes tan commovedores en la història del cinema com el moment en què Hal 9000, el robot que controla la nau a 2001: Una odissea de l’espai, se n’adona que el desconnectaran i, per pura angoixa, comença a eliminar la tripulació per autopreservar-se. Aquests dies circula un titular d’aquests virals que recorda aquest moment existencialista: “La IA fa xantatge a un investigador perquè no la desactivi”, diu una de les formulacions (en aquest cas, a La Vanguardia) però hi ha variacions a El Español, La Razón i en molts altres mitjans que suggereixen el mateix i hi afegeixen el pebre necessari per a la viralitat: la màquina amenaça amb revelar una infidelitat de l’enginyer que la vol apagar.
La realitat, ai las, no és tan cinematogràfica. Resulta que això no ha passat en realitat, sinó que forma part de les proves que, fa mesos, va realitzar l’empresa Anthropic sobre la seva IA Claude Opus 4. Li van crear una situació fictícia en la qual li permetien llegir els correus interns de l’empresa i allà descobria que la volien desconnectar i que un dels enginyers tenia una aventura extramatrimonial. Aleshores, quan la confrontaven amb la possibilitat de morir, les seves respostes indicaven una pulsió d’autopreservació i majoritàriament s’adreçaven a la súplica. Però, en un dels moments de l’experiment, se li plantejava un dilema amb només dues opcions: assumir el somni etern o el xantatge. I triava xantatge. L’empresa ho ha explicat per mostrar de quina manera refinen l’algoritme i, certament, el cas fa plantejar preguntes interessants, però no respon per a res al que suggereixen els titulars. La IA mereix un debat amb profunditat, no aquestes sacsejades d’espantalls fatus i crides al papu per un grapat de clics –o això m’ha dit que digui, glups, la IA.