Las nuevas herramientas de clonación de voz facilitan la disolución de la frontera entre realidad e ilusión. Las consecuencias de sembrar la duda sobre la verdad y la mentira pueden ser peligrosas.
Una arriesgada evolución que se puso en marcha con la invención del mouse.
En la «La República», escrita hacia el 400 a.c., Platón cuenta la alegoría de la caverna. Un grupo de esclavos viven encadenados en una cueva oscura. Del exterior sólo ven las sombras que proyecta en la pared la luz del fuego. Como nunca han visto nada más, suponen que esas sombras son la realidad del exterior. Platón utiliza esta alegoría para sugerir que la comprensión humana de la realidad puede ser igual de limitada: sólo vemos «sombras» y asumimos que eso es todo lo que hay.
Los sentidos pueden engañarnos. Si sólo nos basamos en ellos nunca podremos escapar completamente de la caverna. Sin embargo, a través del estudio de la filosofía y la ciencia podemos acercarnos a la realidad. Sabemos, por ejemplo, que la Tierra no es plana a pesar de que nuestros sentidos nos sugieren lo contrario.
Cuanto más comprendamos la realidad y nos pongamos de acuerdo sobre ella, menos espacio habrá para las teorías conspirativas, la división y la manipulación.
En este contexto, es lamentable que, tras décadas de progreso, estemos retrocediendo a la caverna de Platón en algunos ámbitos. No en los de la ciencia, que está prosperando, pero la digitalización ha hecho que nuestra comprensión de los fenómenos cotidianos implosione lentamente.
Desdibujando las líneas: realidad versus ilusión digital
La herramienta de clonación de voz de ElevenLabs es un hito de esa desafortunada tendencia.
Pero antes de profundizar en ello, veamos algunos momentos decisivos en la difuminación de la realidad y la ilusión. El primero se produjo en la década de 1960, cuando el pionero de Internet Douglas Engelbart inventó el mouse del ordenador. Esta innovación nos permitió interactuar con los ordenadores del mismo modo que lo hacemos con el mundo físico. Inspirado en la forma de aprender de los niños, al ratón le siguió Windows, que popularizó y facilitó el uso del ordenador, y luego el iPhone de Apple, que hizo omnipresente la interacción táctil.
En apenas unas décadas nos hemos acostumbrado a pasar gran parte de nuestras vidas en un espacio virtual que apenas entendemos. Estamos entrando a gran velocidad en un mundo del que sabemos tan poco como cuando creíamos que la Tierra era plana.
Los avances en inteligencia artificial han acelerado aún más la difuminación de aquello que distingue la realidad física de la ilusión digital. La capacidad de la IA generativa para crear nuevos datos a partir de los existentes ha hecho posible simular el lenguaje y las expresiones visuales casi a la perfección. Un ordenador puede comportarse y parecer un ser humano real. El resultado es un mundo digital lleno de contenidos creados sintéticamente aún más difícil de discernir: ¿Lo que estoy viendo en mi pantalla es una copia digital de algo que existe en el mundo físico? ¿Es una mezcla de realidad física y simulación digital? ¿O es pura ilusión digital? ¿Lo ha creado un ser humano o un modelo generativo de inteligencia artificial?
El atolladero ético de la clonación de voz
En este contexto ligeramente distópico, la herramienta de clonación de voz de ElevenLabs es lo último que el mundo necesita. En cinco minutos y con sólo uno de grabación, se puede clonar la voz de cualquier persona y hacerle decir cualquier cosa. Por un dólar al mes.
Gracias a su facilidad de uso y accesibilidad, la tecnología difumina aún más las fronteras entre lo auténtico y lo inventado. Cualquiera puede usarla, independientemente de sus intenciones. Y no sólo clonando la voz. Elevenlabs ha anunciado una asociación con D-ID, empresa creadora de avatares digitales que ahora dispondrá de personajes con voces más auténticas. Tanto si alguien quiere crear declaraciones políticas falsas como si pretende extorsionar a familias con falsos vídeos de sus hijos secuestrados, el campo está libre.
La situación es grave. Las consecuencias de sembrar la duda sobre la verdad y la mentira a gran escala pueden ser peligrosas, aumentar la polarización, degradar la democracia, provocar guerras, desencadenar el terrorismo e innumerables desastres más. La erosión de una visión sólida y compartida de la realidad cobró impulso con las cámaras de eco de las redes sociales. Ahora estamos empezando a ver los peligros concretos de tecnologías más avanzadas como la clonación de la voz y diversas formas de IA generativa.
La impotencia de los políticos ante el desarrollo digital no es nueva. Es un problema inherente al hecho de que, mientras una buena legislación lleva su tiempo, la tecnología digital se desarrolla y difunde con rapidez. Sin embargo, no deja de ser irónico que en muchos países todavía se necesiten más aprobaciones para comercializar un nuevo refresco que para lanzar una tecnología con un potencial casi ilimitado para la inestabilidad política y el abuso criminal.
En una era en la que la tecnología amplía constantemente los límites de lo posible, es más importante que nunca recordar la alegoría de Platón. Necesitamos un terreno común, hechos compartidos y una base sólida para nuestro entendimiento. En cambio, nos dejamos seducir por las sombras que ElevenLabs y otras muchas tecnologías deslumbrantes proyectan en la pared de la caverna.