Sono 16mila gli artisti che «addestrano» Midjourney

Continua il dibattito sull’IA generativa che attinge senza il consenso degli artisti a milioni di opere d’arte

«Aftermath of Obliteration of Eternity», di Yayoi Kusama
Karin Gavassa |  | Torino

Gli elenchi con i nomi di oltre 16mila artisti impiegati per «addestrare» (eufemismo per definire il «saccheggio» delle loro opere senza corresponsione di copyright, Ndr) Midjourney, il programma di Intelligenza Artificiale (IA) generativa per il trattamento delle immagini, sono diventati virali online, rinvigorendo i dibattiti su copyright e consenso nell’ambito dell’IA.

Gli artisti vanno da Claude Monet a Frida Kahlo, da Andy Warhol a Yayoi Kusama («Aftermath of Obliteration of Eternity») e Banksy, per citarne alcuni. Il documento è un foglio di calcolo di Google denominato Midjourney Style List, contenente nomi, genere ed epoca, presumibilmente recuperato dagli sviluppatori del programma, durante un processo di perfezionamento della capacità del programma di imitare opere d’arte. Benché l’accesso al documento, disponibile su Internet Archive, sia stato rapidamente limitato, molti dei dati compaiono anche in documenti giudiziari di una causa collettiva del 2023, all’interno di un elenco di 25 pagine di nomi citati in immagini di addestramento di Midjourney.

La pratica di impiegare opere di artisti senza il loro permesso per addestrare programmi di IA generativa rimane territorio incerto e le cause legali pongono interrogativi sugli effettivi processi di conversione di opere d’arte protette da copyright in materiale di riferimento per l’IA. In una serie di post su X (ex Twitter), l’artista Jon Lam, che lavora per lo sviluppatore di videogiochi Riot Games, ha condiviso schermate di una chat in cui gli sviluppatori di Midjourney avrebbero discusso di precaricare nel programma nomi di artisti e stili da Wikipedia e altre fonti.

Il lavoro degli artisti selezionati sarebbe stato disponibile per l’imitazione come materiale di riferimento per la creazione di immagini. Una schermata conterrebbe un messaggio dell’amministratore delegato di Midjourney, David Holz, che si compiace dell’aggiunta di 16mila artisti alla formazione del programma, oltre a una chat in cui un membro del team solleva con toni sarcastici la questione del copyright, dicendo agli altri sviluppatori che «tutto quello che dovete fare è usare quei set di dati “raschiati” (“scraped”, in gergo tecnico, per bypassare il copyright, Ndr) e dimenticare comodamente che cosa avete usato per addestrare il modello. Problemi legali risolti per sempre».

L’altro aspetto del dibattito sull’IA generativa riguarda del resto gli strumenti per combattere le violazioni del copyright, come il programma Glaze dell’Università di Chicago. Con l’obiettivo dichiarato di proteggere gli artisti da programmi come Midjourney e Stable Diffusion, Glaze altera i dati digitali di un’immagine in modo che «sembri invariata agli occhi umani, ma appaia ai modelli di IA come uno stile artistico completamente diverso».

© Riproduzione riservata
Altri articoli di Karin Gavassa