OpenAI, nella audizione di fronte al Communications and Digital Committee del Regno Unito, ha difeso l’uso di contenuti protetti da copyright per l’addestramento dell’IA in quanto “necessità fondamentale”. In risposta a un’indagine sui rischi e le opportunità dei modelli di intelligenza artificiale da parte del Comitato per le comunicazioni e il digitale della Camera dei Lord del Regno Unito, OpenAI ha presentato una risposta in cui avverte che i suoi modelli non funzionerebbero a dovere senza una formazione specifica sui contenuti protetti da diritto d’autore: “poiché oggi il copyright copre praticamente ogni tipo di espressione umana – inclusi post, fotografie, forum, frammenti di codice software e documenti governativi – sarebbe impossibile addestrare i principali modelli di intelligenza artificiale di oggi senza utilizzare materiali protetti dal diritto d’autore. Limitare i dati alle informazioni di pubblico dominio, create più di un secolo fa, potrebbe produrre un esperimento interessante, ma non fornirebbe sistemi di intelligenza artificiale in grado di soddisfare le esigenze degli utenti del terzo millennio”. Quest’argomentazione arriva in un momento in cui l’azienda è coinvolta in diverse cause legali sul tema, tra cui quella intentata dal New York Times e da George R.R. Martin, autore della serie de “Il Trono di Spade”, che accusano OpenAI di utilizzare i loro contenuti protetti per addestrare modelli di IA come ChatGPT e Copilot senza autorizzazione.

Sembra, infatti, che, con determinate chiavi di ricerca, sia possibile ottenere dai software di intelligenza artificiale intere porzioni di opere protette da copyright. Un recente rapporto di IEEE (Institute of Electrical and Electronics Engineers) ha concluso che servizi di IA generativa, come Midjourney e DALL-E 3 di OpenAI, possono ricreare scene protette da diritto d’autore basandosi sui loro dati di addestramento, documentando casi di “prodotti copiati”, così come, da ricerche recenti, sembra che ChatGPT di OpenAI possa essere indotto a riprodurre intere porzioni di testi di libri memorizzati in fase di addestramento. Secondo OpenAI il proprio addestramento effettuato sulla base di materiale protetto da copyright è legale, ma riconosce che c’è ancora del lavoro da fare per supportare e valorizzare i creator, e afferma che vorrebbe quindi arrivare a concordare partnership simili a quelle che ha stretto con Axel Springer e l’Associated Press, in particolare con il New York Times.

La questione legale attorno all’uso di materiale protetto da copyright nella formazione di modelli di intelligenza artificiale è controversa, soprattutto per gli utenti finali, per i quali l’uso di strumenti AI, basati su dati protetti da diritto d’autore, potrebbe creare delle situazioni di incertezza. Se un utente genera contenuti che violano il copyright utilizzando questi strumenti, infatti, potrebbe trovarsi ad essere citato in giudizio in prima persona.