GAN, Generative Adversarial Network: cosa sono, come si usano

Le GAN sono delle architetture basate su degli algoritmi che utilizzano due reti neurali generative contrapposte tra loro per generare dati sintetici potenzialmente simili a quelli reali.

Seguici su

Le GAN (Generative Adversarial Network) o reti generative avversarie sono delle architetture basate su degli algoritmi che utilizzano due reti neurali generative contrapposte tra loro per generare dati sintetici potenzialmente simili a quelli reali.

Non ne avete mai sentito parlare? È comprensibile, tuttavia è fondamentale conoscerle, poiché sono alla base di una delle tecnologie più conosciute e chiacchierate del 2023: l’intelligenza artificiale generativa.

Le reti avversarie generative possono essere usate in molti modi. In generale vengono sfruttate per creare qualcosa di nuovo (immagini, video, ecc.) partendo da dati già esistenti.

Generative Adversarial Network: come funzionano

Le due reti che vengono contrapposte non sono uguali, presentano infatti una denominazione tra loro diversa: una prende il nome di generatore e una di discriminatore.

Come fanno le GAN a creare un’immagine o un video nuovo partendo da uno già esistente? Il processo di base che permette la messa in atto di questo meccanismo prevede un allenamento continuo del generatore e del discriminatore.

In un primo momento il generatore viene «allenato» e cioè alimentato con dati pre-esistenti per fare in modo che assorba le informazioni necessarie per imparare a produrre un contenuto sintetico.

Prendiamo per ipotesi l’immagine di uno stadio: il generatore verrà allenato con migliaia di immagini di stadi, così che capisca come sono strutturati e quali sono le loro caratteristiche peculiari.

Con le stesse immagini verrà poi allenato anche il discriminatore, che al contrario del generatore non avrà il compito di creare un’immagine di uno stadio, bensì di riconoscere se quella prodotta dal generatore è vera oppure è un deepfake.

leggi anche

Sam Altman, CEO di OpenAI, investe 180 milioni di dollari nella ricerca sulla longevità

Una volta che il generatore fornisce il suo output e cioè crea un’immagine nuova, il discriminatore produce un verdetto sul risultato: se è positivo, significa che il generatore ha lavorato bene, altrimenti necessita di essere allenato ulteriormente per produrre immagini più verosimilmente veritiere.

In ogni caso, il generatore raccoglie sempre gli output del discriminatore come feedback del suo operato, per capire il grado di efficienza del suo lavoro.

Tra le due reti si instaura una sorta di competizione: il generatore lavora per fare in modo che il prodotto del suo lavoro non sia riconoscibile rispetto a qualcosa di reale e già esistente, mentre il discriminatore deve cercare di capire che il prodotto del generatore non è realmente fonte del lavoro umano, bensì della macchina.

Più le reti vengono allenate e più il generatore riuscirà a produrre contenuti assimilabili a quelli prodotti da un umano. Nell’allenarsi a vicenda le due reti costituiscono un sistema di deep learning.

Generative Adversarial Network: per cosa si usano

Le GAN possono essere usate per molti scopi. Grazie all’allenamento degli algoritmi su cui si basano le reti possono creare immagini, video, audio inediti, frasi, testi e molto altro.

Potenzialmente, gli utilizzi che possono essere fatti delle GAN sono moltissimi, ma uno dei più popolari è quello di utilizzarle per creare contenuti che siano di ispirazione. In questo modo è possibile avere a disposizione infinite fonti di ispirazione per crearne altri contenuti originali.

Provate a immaginare di essere un designer che deve creare una nuova t-shirt per il suo brand. Non avendo idee, decidete di affidarvi all’intelligenza artificiale generativa per trovare ispirazione. Inserendo un prompt preciso, l’intelligenza artificiale potrà fornirvi decine e decine di immagini dal quale trarre ispirazione per la vostra prossima creazione.

Generative Adversarial Network: vantaggi e svantaggi

Le GAN presentano allo stesso tempo sia vantaggi che svantaggi. Il principale vantaggio che offrono è quello di poter creare potenzialmente infiniti contenuti originali, basandosi su altri già esistenti.

C’è tuttavia un grosso limite all’accesso di questa comodissima tecnologia, e cioè il fatto che per poterne usufruire è necessario allenare il generatore e il discriminatore con moltissimi dati.

Reperire i dati su cui si basano gli algoritmi delle GAN non è semplice. Normalmente, le persone hanno difficoltà a reperirli e soprattutto a progettare le architetture delle reti.

Ciò non è tuttavia impossibile, OpenAI, ossia l’azienda che ha creato ChatGPT, è stata in grado di allenare la propria intelligenza artificiale con un’immensa massa di dati. Rimane comunque il fatto che non chiunque possa fare la stessa cosa.

Argomenti

# Tecnologia

# ChatGPT