Si chiama Sora, ed è il nuovo modello di intelligenza artificiale text-to-video di casa OpenAI, capace di generare video realistici da semplici prompt testuali. Affiancandosi alla generazione di immagini di DALL-E, Sora apre nuove frontiere per creatori di contenuti, designer e professionisti del settore, offrendo uno strumento potente per trasformare le idee in narrazioni visive coinvolgenti. Il nuovo modello si distingue per la sua abilità nel creare scene complesse e personaggi espressivi, interpretando con precisione le richieste degli utenti e simulando interazioni realistiche nel mondo fisico. Attualmente in fase di test, Sora è valutato da esperti di sicurezza e artisti visivi per affinare ulteriormente le sue capacità e indirizzare le sfide tecniche. Nonostante l’impressionante capacità di generazione video, Sora incontra alcune difficoltà, come la corretta rappresentazione della fisica di scene complesse e la gestione di dettagli spaziali e temporali.

OpenAI si impegna a superare questi ostacoli, lavorando per migliorare la precisione e la versatilità del modello. Interessante la scelta di aprire la demo a team di sicurezza, con cui OpenAI prevede l’implementazione di rigorose misure salvaguardia per prevenire la disinformazione e l’uso improprio dei video generati. Strumenti di rilevamento avanzati e l’integrazione di metadati C2PA garantiranno trasparenza e autenticità, affrontando i rischi associati alla produzione di contenuti sintetici.
Sora, basato su un’architettura transformer, beneficia di una scalabilità e flessibilità notevoli: l’approccio alla generazione video è quello della diffusione, che vede l’AI trasformare il “rumore statico” in immagini coerenti e rappresenta un salto qualitativo nel campo dell’intelligenza artificiale visiva.

La tecnologia di recaptioning, ereditata da DALL-E 3, consente al modello di seguire le istruzioni degli utenti con una elevata precisione, generando contenuti che rispecchiano fedelmente le loro visioni. Sora non solo facilita la creazione di video partendo da zero ma può anche animare immagini fisse o estendere video esistenti, offrendo una gamma di applicazioni che vanno dalla pubblicità al cinema, fino all’educazione e oltre.

Questo modello rappresenta secondo i suoi creatori un passo avanti verso il raggiungimento dell’Intelligenza Artificiale Generale (AGI), lo scopo finale – perlomeno dichiarato – di OpenAI. Con Sora, OpenAI non solo estende i confini della creatività digitale ma invita anche a una riflessione sul futuro dell’IA, evidenziando il potenziale di questa tecnologia nel migliorare la nostra capacità di raccontare storie visive e interagire con il mondo in modi sempre più sofisticati.

Avatar photo

Professore a contratto (in Corporate Reputation, in CyberSecurity e in Data Driven Strategies) è Imprenditore, ha fondato The Fool, la società italiana leader di Customer Insight, co-fondato The Magician un Atelier di Advocacy e Gestione della Crisi, ed è Partner e co-fondatore dello Studio Legale 42 Law Firm. È Presidente di PermessoNegato APS, l'Associazione no-profit che si occupa del supporto alle vittime di Pornografia Non-Consensuale (Revenge Porn) e co-fondatore del Centro Hermes per la Trasparenza e i Diritti Digitali. È stato Future Leader IVLP del Dipartimento di Stato USA sotto Amministrazione Obama nel programma “Combating Cybercrime”, conferenziere, da anni presenta "Ciao Internet!" una seguita video-rubrica in cui parla degli Algoritmi e delle Regole che governano Rete, Macchine e Umani. Padrone di un bassotto che si chiama Bit, continua a non saper suonare il pianoforte, a essere ostinatamente Nerd e irresponsabilmente idealista.