Intelligenza artificiale e copyright: che la battaglia (legale) abbia inizio
Aumentano le cause contro le aziende di Ai generativa per lo sfruttamento dei diritti d’autore. Senza l’addestramento sui dati, però, le Ai non possono migliorare. Sarà una delle questioni giuridiche più importanti del secolo.
di Flavio Natale
L’arrivo sul mercato dell’Intelligenza artificiale generativa (ora di ChatGpt-4) ha provocato un terremoto in diversi campi: dal digitale al multimediale, dal settore economico a quello politico, da quello sanitario ad automobilistico. Alcune tra le discussioni più accese e controverse degli ultimi mesi sono ruotate attorno la produzione di contenuti creativi – musicali, letterari, cinematografici, fotografici e altro. La capacità dell’Ai di replicare (o ideare), con un’approssimazione più o meno efficiente, brani, romanzi o altri contenuti dipende infatti da una serie di dati su cui i robot vengono addestrati, dati protetti da copyright e sottratti senza regole ai loro produttori, che si tratti aziende o singoli individui (fenomeno noto come web scraping).
In un articolo pubblicato sul settimanale The Economist ci si interroga sul rapporto tra copyright e Intelligenza artificiale, alla luce delle numerosissime critiche che i produttori di contenuti (cosiddetti creators) hanno mosso alle Ai in questi ultimi mesi, lamentandosi del fatto che il loro lavoro artistico fosse stato usato senza consenso, credito o compenso. L’Ia, si legge sempre sull’Economist, potrebbe comportarsi come ha fatto Napster a inizio duemila, prima della sua chiusura, condividendo canzoni piratate su una piattaforma digitale e ignorando del tutto il copyright.
Per vie legali
Le cause in tribunale non stanno tardando a fioccare, anche perché il campo della violazione dei diritti d’autore da parte delle Ai si estende ben oltre le industrie creative, e riguarda tutti i settori dove l’apprendimento automatico svolge un ruolo, come le auto a guida autonoma, la diagnostica medica, la gestione del rischio assicurativo. Mentre però l’Unione europea ha una direttiva che disciplina il rapporto tra data mining (estrazione di contenuti utili da grandi quantità di dati) e diritto d’autore, in America per ora ci sono solo “teorie contrastanti” sull’ammissibilità o meno del data mining senza licenza, teorie che si muovono principalmente sulla dottrina del fair use. Secondo questa regola “l'uso di opere protette da copyright è considerato equo quando serve a uno scopo sociale prezioso, il materiale di partenza viene trasformato rispetto all'originale e non influenza il principale mercato dei titolari di diritti d'autore”. I critici di questo principio sostengono che il fair use non può essere applicato all’Ai perché l’Intelligenza artificiale “non trasforma ma sfrutta” i dati che estrae. Mark Lemley e Bryan Casey, rispettivamente docente di diritto e avvocato, hanno pubblicato un articolo sulla rivista Texas law review affermando che “dietro la scusa dell'apprendimento automatico, le aziende abusano del fair use per rendere gratuito il lavoro delle persone”. Lemley e Casey, però, tengono a precisare che senza questo tipo di addestramento dell’Ai non ci sarebbe nessuna Ia. La descrivono come una delle questioni legali più importanti del secolo: “La legge sul copyright consentirà ai robot di imparare?”
L’agenzia fotografica Getty Images, ad esempio, ha accusato Stable Diffusion (app di creazione di contenuti per le immagini) di aver violato il copyright su milioni di foto del suo archivio con l’obiettivo di costruire un modello di Intelligenza artificiale capace di competere con Getty images. Il risultato di questa causa potrebbe costituire un precedente significativo per dirimere il dibattito giuridico futuro sul fair use.
Un verdetto altrettanto importante dovrebbe arrivare nei prossimi mesi dalla Corte suprema americana per un caso che vede sotto accusa, a distanza di 38 anni, Andy Wharol per aver sfruttato le immagini protette da copyright di Prince. Daniel Gervais, esperto di proprietà intellettuale presso la Vanderbilt Law School di Nashville, ritiene che tramite questi casi i giudici potranno “fornire la tanto attesa guida sul fair use”.
Oltre il copyright
Ma lo scraping di dati protetti da copyright non è l'unico problema legale che deve affrontare l'Ai generativa. Al di fuori dei tribunali, “le questioni più importanti saranno politiche”: tra queste, a quale livello l’Ai dovrà essere considerata responsabile dei contenuti che genera e fino a che punto potrà mettere a repentaglio la privacy dei dati dei singoli individui.
Michael Nash, chief digital officer di Universal music group, l'etichetta discografica più grande del mondo, ha commentato su The Economist che le industrie creative dovrebbero prendere rapidamente posizione per garantire che la produzione degli artisti sia utilizzata in modo etico dalle Intelligenza artificiali, piuttosto che opporsi a questo fenomeno. Anche perché “la battaglia sarà grande”.
fonte dell'immagine di copertina: unsplash