La mia esperienza personale: durante gli ultimi 2/3 anni sono entrato sempre piรน in contatto con tool basati sull’intelligenza artificiale, inizialmente come osservatore, leggevo news e mi incuriosivo sognando un futuro fantascientifico, fino ad oggi che sono entrati attivamente a far parte del mio workflow.
Sono sempre stato aperto alle nuove tendenze tecnologiche e non sono uno di quelli che “Ahh l’intelligenza artificiale ci sostituirร e tra 10 anni noi creativi saremmo tutti sotto un ponte!”, ma piuttosto un professionista che utilizza degli strumenti senza gridare al complotto e che ne trae ciรฒ che c’รจ di buono restando con i piedi per terra.
Pertanto, prima di lasciarti proseguire nella lettura di questo articolo, voglio precisare che gli strumenti basati sull’intelligenza artificiale sono per l’appunto solo strumenti. Per quanto siano tecnologicamente all’avanguardia non fanno magie.
Studiateli, sperimentate come se foste dei bambini davanti a un nuovo giocattolo, ma prendeteli per quello che sono: non basate il vostro lavoro unicamente su questi tool, continuate ad aggiornarvi.
Forse tra 10 anni il nostro lavoro sarร diverso proprio per l’avvento dell’IA, forse non sarร piรน necessario passare ore alla ricerca di immagini per creare moodboard, fotomontaggi e quant’altro, forse non ci dovremmo piรน preoccupare di cercare delle PNG perchรจ i tool per lo scontorno o per il rotoscoping saranno perfetti.
Fatto sta che la scintilla creativa sulla quale si basano i progetti originali rimarrร Human Made.
Tipologie di IA
Quando si parla di intelligenza artificiale si intende tutto e non si intende nulla tanto รจ grande il mondo del quale fa parte.
Per esempio potrebbe benissimo essere basato su IA il frullatore che usi la mattina per prepararti uno Smoothie. Questo piccolo elettrodomestico potrebbe regolare i giri al minuto e la potenza del suo servo motore in base alla temperatura e alla consistenza del cibo che viene inserito al suo interno utilizzando un algoritmo a base di IA.
Magari un frullatore del genere non esiste nemmeno (per il momento), ma รจ comunque bene essere chiari e precisi quando si parla di intelligenza artificiale.
Esistono tante applicazioni di algoritmi di IA, per esempio:
- IA che analizzano grandi moli di dati
- IA che comprendono il linguaggio
- IA che riconoscono immagini
- IA che creano immagini
- IA che guidano veicoli
- IA che comandano robot
In questo articolo, nello specifico parleremo di IA in grado di comprendere il linguaggio naturale e di generare immagini e di IA in grado di riconoscere immagini e generarne di nuove, nello specifico si tratta di text to image e image to image.
Le IA per la generazione di immagini
La prima volta che ho descritto a parole un’immagine e qualche secondo dopo me la sono trovata davanti sottoforma di pixel รจ stato sorprendente, mi sono sentito catapultato nel futuro, solo che al posto della DeLorean di Doc stavo usando Dall-E di OpenAI.
Da quel momento le intelligenze artificiali per la generazione di immagini sono fioccate e si sono affinate sempre di piรน, fino ad arrivare al punto in cui oggi a volte facciamo davvero fatica a capire se una foto รจ vera o se รจ stata generata artificialmente.
I modelli di IA sono stati allenati cosรฌ bene che รจ facile imbattersi in foto come quella di Papa Francesco mentre balla in discoteca o come questa qua creata da me che ritrae il famoso attore ed ex wrestler The Rock intento ad aiutare a spalare il fango in una cittadina alluvionata.
Nella foto di sopra ci sono molti elementi che non tornano: una pala che non รจ una pala, un manico che scompare in prossimitร dello stivale, il viso non esattamente identico a quello della celebrity o i tatuaggi non correttamente rappresentati.
Il problema, oppure il bello, a seconda dei punti di vista, รจ che piano piano si puรฒ affinare la resa dell’immagine andando a eliminare questi artefatti. E lo si puรฒ fare con l’IA stessa o con il buon vecchio Photoshop.
Chiaramente tutto ciรฒ, seppur possa sembrare una “figata”, rappresenta un potenziale grosso pericolo per la comunicazione. Attraverso l’uso sconsiderato di questi tool diventa sempre piรน facile mettere in circolo fake news.
L’esperimento
All’interno di questo articolo, oltre a raccontarvi brevemente la mia esperienza e il mio parere personale su questi nuovi tool, li metterรฒ alla prova proponendo loro lo stesso prompt: generare una foto di una scimmia astronauta che mangia una fetta di pizza dentro una stazione spaziale. Prompt particolare e impegnativo, vediamo cosa uscirร fuori.
DALL-E – La creatura di OpenAI
Non ricordo se sia esattamente la prima intelligenza artificiale ad essere stata resa pubblica per tutti. Se vogliamo essere precisi no, esisteva giร da tempo “this person does not exist”, ma Dall-E รจ stata la prima in assoluto che ho provato.
Inizialmente generava solamente immagini quadrate relativamente piccole (1024px * 1024px), successivamente sono state fatte delle migliorie:
- รจ stata aggiunta una funzione in grado di ampliare e ingrandire un immagine andando a “inventare” ciรฒ che si nasconde oltre i margini della foto (esattamente come fa firefly adesso).
- รจ da poco uscita la versione 3, che controintuitivamente รจ la seconda versione del tool. Caratterizzata principalmente da un algoritmo aggiornato in grado di generare immagini piรน precise e con meno errori รจ stata integrata all’interno di Chat-GPT.
Dall-E 2, non รจ assolutamente perfetto e con la versione del 3 รจ probabile che non venga piรน aggiornato e che rimanga in uno stato embrionale, fatto sta che รจ stato il primo, solamente un anno e mezzo fa vedere un’immagine come quella sopra generata con IA era qualcosa di inimmaginabile.
Ma quando si parla di progresso tecnologico nel campo dell’intelligenza artificiale i tempi sono estremamente rapidi e probabilmente proprio adesso, mentre scrivo questo articolo, sta uscendo un nuovo tool ancora piรน innovativo.
Quindi ricorda di rileggere questo articolo tra qualche mese, perchรฉ molto probabilmente lo aggiornerรฒ.
Midjourney – La svolta del text to image
Midjourney subito dopo Dall-E รจ stato lo strumento basato su IA che tutti volevano provare: quando provavi a generare una persona non creava mostri, al massimo agli inizi aggiungeva qualche dito in piรน.
A mio parere รจ stato il primo strumento effettivamente utile nel lavoro in campo creativo: tramite Midjourney era possibile ed รจ possibile generare immagini utilizzabili in fase di moodboard e in grado di rappresentare sottoforma di pixel un’idea che ci frulla in testa durante la fase di brainstorming di un progetto.
A differenza degli altri tool, Midjourney รจ l’unico a funzionare all’interno di una chat solitamente usata dai gamer, Discord.
NVIDIA Canvas – Uno spettacolare quanto inutile tool
Si parlava di raytracing, di motori di rendering estremamente potenti soprattutto in ambito gaming quando sono uscite le schede video di casa Nvidia basate sulla nuova tecnologia RTX (Real Time eXtension).
Attraverso queste schede video, oltre a generare in tempo reale ombre perfette e giochi di luce mai visti prima all’interno di titoli videoludici, si raggiungono prestazioni mai viste prima anche quando si parla di IA.
A tal proposito, e per dimostrare quanto siano effettivamente potenti queste schede video, Nvidia ha lanciato un tool chiamato Nvidia Canvas in grado di creare paesaggi naturali semplicemente abbozzando qualche forma su una tela virtuale. A nostra disposizione ci sono i classici strumenti dei programmi di grafica: il pennello, il secchiello, la gomma e il contagocce. La differenza la fanno i colori, infatti al posto della classica tavolozza abbiamo a disposizione una serie di materiali naturali come ad esempio nuvole, ghiaia, cielo, foresta, neve ecc.
Via via che disegniamo e creiamo livelli, ci viene proposta in tempo reale l’immagine generata.
In questo caso, dato che tramite questo tool non รจ possibile generare esseri viventi o strutture artificiali ho cercato di ricreare un paesaggio che ricordasse quello della celebre scena del “monolite” di “2001 Odissea nello spazio”.
Firefly – Il riempimento generativo di Photoshop
L’avvento dell’IA ha smosso tante grandi aziende e ne ha portate alla ribalta altrettante. All’interno di questa grande equazione non poteva mancare la variabile piรน importante: Adobe.
Adobe, che per chi finora avesse vissuto sotto un sasso, รจ colei che sviluppa programmi come Photoshop, Illustrator, After Effects, Indesign, Premiere e tanti altri, detiene il quasi assoluto monopolio dei software di grafica, montaggio e animazione e ha saputo rimanere al passo con i tempi. E l’ha fatto, a parer mio, nel modo piรน furbo e intelligente possibile.
Come prima cosa Adobe ha sviluppato le prime versioni Beta di Firefly, un nuovo tool in grado, proprio come tutti gli altri di questa lista, di generare immagini a partire da un input testuale.
Ma non finisce qui. Adesso arriva il bello.
Firefly รจ stato integrato all’interno di Photoshop ed รจ stata introdotta la funzione “riempimento generativo”, ovvero la capacitร per il programma di riempire porzioni di immagine generandole con l’intelligenza artificiale, con un input testuale o senza.
Questa รจ stata la vera svolta, attraverso l’introduzione di questa nuova feature, l’IA รจ entrata attivamente a far parte del mio workflow. Da quel momento in poi sono stato in grado di modificare gli sfondi delle foto per i piani editoriali, di modificare semplicemente i rapporti di aspetto delle immagini, che da verticali possono diventare orizzontali in pochi click.
Ciliegina sulla torta: ora che questo aggiornamento รจ fuori dalla Beta รจ utilizzabile anche a scopi commerciali.
Se vuoi approfondire i modi con cui utilizzo Photoshop e la sua IA nel mio lavoro ti consiglio di andare a leggere questo articolo della Gazzetta del Regno.
Stable Diffusion – L’IA opensource per smanettoni
Avete presente quelli che dicono che con questi tool basati sull’IA tutto รจ piรน semplice?
Niente di piรน sbagliato, almeno per quanto riguarda Stable Diffusion. Per rendere l’idea รจ come passare dal guidare un triciclo in una tranquilla giornata soleggiata di maggio al governare un Boeing 747 durante una tempesta mentre vedi precipitare meteoriti infuocati dal finestrino e il tuo copilota รจ appena stramazzato sui comandi.
Forse l’esempio รจ un tantino estremo, ma credetemi se vi dico che Stable Diffusion รจ complicato: รจ complicato installarlo, รจ complicato capire cosa sono i checkpoint, i Lora, le estensioni, รจ complicato capire come installare queste aggiunte, รจ complicato capire come generare un’immagine decente con lo stile che abbiamo in testa, รจ difficile evitare di incorrere in contenuti espliciti (sรฌ perchรฉ Stable Diffusion non ha nessun tipo di blocco), รจ complicato usare le estensioni e quando ti viene in mente di mescolare immagini fra loro, come ti potrai ben immaginare รจ complicato.
Diciamo che se non hai un minimo di conoscenze informatiche e un’attitudine al problem solving difficilmente riuscirai a usarlo, ma se ci riuscirai ti darร un sacco di soddisfazioni.
Stable Diffusion รจ gratuito e open source, cioรจ il suo codice sorgente รจ pubblico e chiunque puรฒ modificarlo, aggiornarlo o apportare migliorie. Questo ha comportato il fatto che tramite questo tool oltre a generare immagini tramite un input testuale รจ possibile allenare l’IA con le nostre immagini, mixare immagini tra loro in mille modi diversi, usare foto come base di riferimento, applicare gli stili piรน disparati, far comparire personaggi famosi e addirittura arrivare a creare GIF animate e video.
Non nego che attualmente tra tutte le IA disponibili questa รจ la mia preferita: ogni giorno escono novitร , รจ presente un’enorme community di appassionati e riuscire ad usare un tool cosรฌ complicato per ottenere immagini mozzafiato รจ decisamente soddisfacente.
Krea.ai – Dove anche uno scarabocchio diventa un pezzo d’arte
Se vi dicessi che l’orribile disegno fatto a sinistra puรฒ trasformarsi nella strepitosa immagine a destra semplicemente descrivendo la scena con una frase, ci credereste?
A cose normali non credo, ma dato che state vedendo l’immagine qua sopra capirete bene che รจ tutto reale. ร opera di krea.ai, un’innovativo tool basato su IA che ha la particolaritร di generare immagini in tempo reale: ad ogni tratto in piรน l’immagine in output sarร diversa e sempre piรน precisa.
Per l’utente รจ possibile scegliere lo stile e quanto l’IA deve influenzare l’immagine finale oltre a migliorarla nei dettagli prima di esportarla.
Quindi se non siete mai stati bravi a disegnare, oppure se mancate di fantasia e volete capire cosa aveva in mente vostro figlio, il vostro fratellino o un qualunque bambino quando ha scarabocchiato quelle linee sul foglio, da oggi potete chiederlo a krea.ai e rimanere a bocca aperta.
Conclusioni
Lร fuori รจ in atto una rivoluzione, siamo all’alba di una nuova era tecnologica. Aziende enormi, piccole software house, sviluppatori indipendenti e community di esperti e appassionati stanno cambiando il mondo proprio in questo momento.
Credo che sarร possibile veder cadere colossi e sarร possibile assistere all’ascesa di nuove aziende innovatrici. Credo che per me e che per chi fa lavori simili al mio sia un momento pieno di nuovi stimoli e opportunitร , ma anche una fase in cui concentrarsi ed impegnarsi per rimanere al passo con i tempi.
Le professioni muteranno e sarร sempre piรน difficile spiegare a propria madre che cosa facciamo ogni giorno a lavoro. Speriamo che esca un’IA per risolvere anche questo problema.
Il commento di un esperto del settore
Prima di terminare l’articolo vi lascio al commento di un mio carissimo amico, noto esperto del settore IA.
“L’articolo sottolinea saggiamente l’importanza di considerare le intelligenze artificiali come strumenti, non sostituti della creativitร umana. La prospettiva aperta e pragmatica verso queste tecnologie รจ fondamentale per un utilizzo consapevole. La descrizione dei vari strumenti fornisce un quadro utile delle opzioni disponibili, e la riflessione sul cambiamento professionale imminente รจ rilevante. Globalmente, un approccio bilanciato all’innovazione tecnologica.“
-Chat GPT