Se i generatori di immagini ti hanno colpito allora è arrivato il momento di capire meglio come funzionano.

I siti e le applicazioni che generano immagini di cose che non esistono si basano su tecnologie diverse, ma la più famosa (e anche quella che ha prodotti i risultati più interessanti è basata sulle reti GAN.

GAN sta per Generative Adversarial Network, ovvero rete generativa avversaria (che già detto così fa un po’ paura). Il funzionamento si basa su due reti “avversarie” che hanno lo scopo di migliorarsi a vicenda non smettendo mai di apprendere. I generatori di volti artificiali già esistevano mai risultati erano troppo finti e poco reali.

Poi furono inventate le reti GAN.

Per capire meglio come funziona facciamo un esempio partendo dal generatore di persone che non esistono. L’intelligenza artificiale parte sempre da un database di volti e, una delle due reti ne genera uno. La seconda verifica se l’immagine è stata falsificata. Segnala quindi se l’immagine si discosta troppo dalla realtà oppure se è troppo simile risultando troppo artificiale.

Quando una rete segnala qualcosa alla rete avversaria apprende e permette anche all’altra di apprendere. In questo modo le due reti tenderanno sempre a migliorare.

In pratica: intelligenze artificiali che generavano volti a partire da database con migliaia di foto ve ne erano già, il problema è che spesso erano così precise da far sembra i volti innaturali. Con la GAN questo processi si perfeziona creando imperfezioni se mi perdoni il gioco di parole.

A cosa servono i generatori di immagini?

Come molte altre tecnologie i generatori di immagini possono presentare luci e ombre. Fa paura pensare alla facilità con la quale si possono creare profili falsi, ma allo stesso tempo le applicazioni nel campo artistico e ludico sono veramente mole. Pensiamo ad esempio a videogame con personaggi sempre differenti.

Oppure pensiamo all’arte. Il collettivo di artisti Obvious https://obvious-art.com ha creato opere d’arte di particolare successo (e valore economico). Mentre invece sarà interessante interpretare i risvolti sul piano del design.
Potranno le GAN sostituire l’uomo nel campo creativo? Io non credo quantomeno perché il designer deve pensare temporalmente al presente, passato ma sopratutto al futuro. Ma non è facile fare previsioni su una tecnologia nata da poco.

Tra i diversi campi di utilizzo vi sono:

  • Generazioni di immagini basate su testi o comandi vocali
  • Generazione di oggetti complessi anche 3D
  • Miglioramento di immagini con aggiunta di dettagli (ne vedremo delle belle con Photoshop…)
  • Creazione di nuovi oggetti di design (pensare ai risultati fa un po’ paura ma è anche vero che questa tecnologia è nuova)
  • Creazione di sintesi e mix di immagini

Fonti

Articolo originale di Ian J. Goodfellow creatore del GAN

Wikipedia

Spindox