Il 25 marzo 2025 ho registrato sei puntate di un corso sulle intelligenze artificiali generative. Per evitare che il contenuto diventi subito obsoleto, quando registro cerco di essere molto aggiornato sulle novità e di parlare prima di tutto di metodo. Ma chi segue un percorso formativo desidera giustamente anche una parte pratica. Così ho raccontato il metodo che seguo quando uso le ia generative di immagini e video, a partire dall’idea. Ho parlato anche dello strumento per le immagini integrato in ChatGpt (lo uso, per esempio, per generare il bradipo umanizzato Jon Slow, mascotte della mia newsletter The slow journalist).

Tre ore dopo la fine della registrazione, la OpenAi ha presentato una nuova versione della sua ia da testo a immagine (text-to-image). Si chiama 4o image generation ed è così diversa dalla precedente da aver reso irrimediabilmente obsolete almeno due delle puntate che ho registrato. Le metterò comunque online gratuitamente, con un’avvertenza che spiega la situazione. Ma la verità è che quelle ore di lavoro sono andate quasi del tutto perse.

Quello che mi è successo non è solo un aneddoto personale, ma un esempio da tenere presente quando si parla dell’adozione delle intelligenze artificiali generative. Se un paio di puntate registrate di un corso possono sembrare una perdita di poco conto, un investimento su software molto costosi senza aver ben chiaro come e perché usarli può essere un problema serio.

Queste sono, letteralmente, tecnologie di frontiera e si fa davvero fatica a scegliere lo strumento giusto. Ma cos’è cambiato esattamente, in questo caso? 4o è molto più potente del suo predecessore Dall-e. Ha una maggiore precisione nella composizione: proporzioni e dettagli anatomici risultano generalmente più coerenti; è in grado di integrare meglio il testo nelle immagini: nei biglietti d’invito o contesti dove sono richieste scritte corpose, il modello fornisce risultati più leggibili e meno deformati. L’immagine che illustra questa newsletter è uno dei miei test. Ci sono troppe parole e quindi il modello commette ancora errori di rielaborazione, ma il processo di creazione è stato molto facile.

Ho caricato nel modello una schermata dell’inizio della newsletter, poi ho messo una mia foto in versione jedi, che ho fatto a parte sempre dentro al modello e quindi ho chiesto di rappresentare in un’immagine iperrealistica la newsletter su una rivista cartacea appoggiata su una scrivania e la foto sfocata sullo sfondo, aggiungendo una libreria, anch’essa fuori fuoco. Il risultato si poteva sicuramente migliorare, ma ho voluto usare comunque questa immagine perché, con le sue imperfezioni, serve a mostrare contemporaneamente possibilità e limiti. E a ricordarci che la componente di integrazione fra il lavoro umano e quello della macchina farà sempre la differenza.

Lo strumento sembra non avere più certe restrizioni sul copyright – a meno che questa versione così libera non sia giusto un inizio per poi rientrare nei ranghi e in assenza di conferme su eventuali accordi –, sull’uso di fattezze di persone reali, anche famose, e su alcuni tipi di scene, pur rimanendo piuttosto puritano su temi legati a sesso e violenza. Può mettere un logo – anche quello di un marchio famoso – sulle immagini, cosa che Dall-e non era in grado di fare.

Può lavorare molto bene in termini di rielaborazione di un’immagine generata. Funziona bene con la coerenza dei personaggi, cosa che lo rende adatto a creare storyboard, per esempio. Infine, essendo integrato in ChatGpt, consente anche di lavorare dialogando come si è fatto finora con la macchina e poi di realizzare illustrazioni a partire dalla conversazione stessa.

Ho fatto parecchi esperimenti per raccontare 4o Image Generation in maniera visiva: è quasi sempre la cosa più efficace, con questo tipo di strumenti.

Insieme all’innovazione sono arrivate le polemiche. Per esempio, il nuovo modello è in grado di trasformare un’immagine in un’equivalente che ricorda lo stile di Studio Ghibli, lo studio di film d’animazione giapponese fondato nel 1985 a Tokyo da Hayao Miyazaki, Isao Takahata, Toshio Suzuki e Yasuyoshi Tokuma. Molte testate giornalistiche – 404 all’estero, Open in Italia, per esempio – hanno ricordato quindi una vecchia dichiarazione di Miyazaki, che però va messa nel giusto contesto.

Nel 2016 Miyazaki assiste a una presentazione della Dwango Artificial Intelligence Laboratory, in Giappone. All’epoca, le tecnologie di oggi sono ancora lontane. Il regista rimane sconcertato e commenta duramente: “Sono disgustato, è un insulto alla vita stessa”. E dichiara che non integrerà mai queste tecnologie nel suo lavoro. Poi motiva la sua presa di posizione dicendo che l’animazione fatta dall’ia, secondo lui, evidenzia una profonda mancanza di empatia verso l’essere umano e inserisce nel discorso il fatto che vedendo quell’animazione ha pensato a un suo amico disabile.

Correlare quel che è successo otto anni fa al rilascio di questo nuovo strumento è un’operazione poco corretta. Sam Altman, amministratore delegato, si è fatto un avatar che lo riproduce nello stile di Studio Ghibli. Potrebbe essere un gesto arrogante di Altman – non stupirebbe –, una ripicca per le vecchie dichiarazioni del regista oppure il frutto di un accordo: ho scritto allo Studio Ghibli per avere un commento in merito ma non ho ancora ricevuto risposte. Nel frattempo, proprio mentre chiudo questa newsletter, arrivano alcune segnalazioni che suggeriscono nuove restrizioni sul copyright: la Disney.

Nell’attesa, però, penso sia utile riflettere su come possiamo integrare al meglio queste tecnologie nel processo creativo umano: invece di considerarle nostre nemiche, possiamo finalmente iniziare a usarle come strumenti e alleate.

Questo testo è tratto dalla newsletter Artificiale.

Iscriviti a
Artificiale
Cosa succede nel mondo dell’intelligenza artificiale. Ogni venerdì, a cura di Alberto Puliafito.
Iscriviti
Iscriviti a
Artificiale
Cosa succede nel mondo dell’intelligenza artificiale. Ogni venerdì, a cura di Alberto Puliafito.
Iscriviti

Internazionale pubblica ogni settimana una pagina di lettere. Ci piacerebbe sapere cosa pensi di questo articolo. Scrivici a: posta@internazionale.it