La música vuelve al centro del conflicto entre inteligencia artificial y derechos de autor
La tensión entre la industria musical y las compañías de inteligencia artificial vuelve a escalar. Una nueva investigación de The Atlantic, firmada por el escritor Alex Reisner, sostiene que más de 21 millones de canciones protegidas por copyright estarían circulando entre desarrolladores de IA como parte de grandes datasets utilizados para entrenar sistemas generativos.
El informe identifica cuatro grandes bases de datos musicales que contienen millones de grabaciones. En ellas aparecen tanto artistas independientes como nombres de enorme impacto comercial, entre ellos Billie Eilish, Taylor Swift, Nirvana y Bad Bunny. Dos de estos datasets superarían las 100.000 canciones cada uno, mientras que los otros dos alcanzarían dimensiones mucho mayores, con entre 9 y 12 millones de pistas por archivo.
Uno de los puntos más delicados del caso es la opacidad. Según la investigación, los cuatro datasets han sido descargados miles de veces, pero resulta difícil saber con precisión qué empresas han utilizado realmente esas grabaciones para entrenar sus modelos, ya que la composición de los datos de entrenamiento rara vez se hace pública. Aun así, el informe señala que Google y Stability AI habrían utilizado el dataset de Free Music Archive en procesos vinculados a inteligencia artificial.
Para acompañar la investigación, The Atlantic lanzó además una herramienta llamada AI Watchdog, pensada para que artistas y sellos puedan buscar si sus canciones aparecen dentro de esos datasets. La herramienta permite introducir el nombre de un artista y comprobar la presencia de su obra en las bases de datos analizadas.
Los primeros resultados han generado una fuerte reacción en la comunidad musical. Según las búsquedas realizadas con la herramienta, aparecen 54 canciones de Eric Prydz, 126 acreditadas a Honey Dijon, 411 de Björk, 213 de Moby, 175 de Fatboy Slim, 153 de The Chemical Brothers, 151 de Daft Punk y 89 de Charlotte de Witte, entre muchos otros nombres vinculados a la música electrónica y popular.
La publicación del informe provocó indignación entre varios músicos. SZA afirmó en Instagram que la herramienta había detectado 238 de sus canciones dentro de estos sistemas, sugiriendo incluso que algunas podrían ser material no publicado. También el productor Kenneth Blume, conocido como Kenny Beats, criticó duramente a las compañías de música generada por IA, acusándolas de construir sus modelos sobre el trabajo de artistas que muchas veces ya operan en condiciones económicas frágiles.
La reacción de DJ Sabrina the Teenage DJ también apunta a una cuestión cultural más amplia: la forma en que la IA no solo utiliza música existente, sino que puede alterar la percepción pública sobre el sonido de determinados artistas. Tras descubrir que 22 de sus canciones figuraban en los datasets, la productora ironizó sobre quienes habían definido su música como “AI slop”, señalando que quizá parte de esa asociación nacía precisamente del uso de obras reales para alimentar sistemas que luego producen contenidos derivados.
El caso llega en un momento especialmente sensible. Empresas como Suno y Udio, dos de los nombres más visibles en la generación musical mediante IA, ya enfrentan demandas impulsadas por artistas, discográficas y organizaciones del sector. Mientras tanto, el debate avanza más rápido que la regulación: ¿puede una empresa entrenar modelos con música protegida sin consentimiento? ¿Dónde termina el aprendizaje automático y dónde empieza la explotación comercial de una obra ajena?
La investigación de The Atlantic no cierra la discusión, pero sí refuerza una sospecha cada vez más extendida dentro de la industria: buena parte de la revolución musical basada en inteligencia artificial podría estar construida sobre catálogos que nunca autorizaron su uso. Y para muchos artistas, esa diferencia ya no es técnica ni abstracta. Es económica, creativa y profundamente política.


