Sora, un programma di generazione video di intelligenza artificiale (AI) creato dalla startup OpenAI nel 2021, sta facendo scalpore poiché è ormai uscito dalla fase di ricerca ed è stato ufficialmente rilasciato al pubblico con il nuovo nome di Sora Turbo.
Il lancio ha scatenato una frenesia online tra gli utenti, costringendo l’azienda a sospendere temporaneamente la creazione di nuovi account dopo essersi trovata sopraffatta da una valanga di traffico.
Sora utilizza istruzioni di testo per creare contenuti, in modo simile ad altri programmi di creazione di contenuti come ChatGPT. A differenza dei tradizionali programmi di intelligenza artificiale che producono risposte scritte, Sora crea video di alta qualità basati sull’input di testo dell’utente.
Sora è disgustosamente bravo, GJ @sama
Aggiungendolo a @everartai al più presto in modo da poter dare vita alle tue immagini pic.twitter.com/wMehxOc8cm
— Jay A (@jay_azhang) 9 dicembre 2024
Secondo una dichiarazione di OpenAI che ha accompagnato il rilascio del 9 dicembre, Sora Turbo rappresenta un miglioramento rispetto al programma Sora originale in quanto consente una creazione video più rapida, video di qualità superiore e una serie di funzionalità di editing video che consentono agli utenti di ritagliare e creare video. sequenze e per modificare elementi in un video preservando altre parti del video.
Allora, cos’è esattamente Sora Turbo e come sta cambiando il settore della creazione di video?
Come funziona Sora Turbo?
La potenza di Sora, e di molti altri generatori video AI, è la sua capacità di replicare ciò che gli esseri umani possono fare con apparecchiature cinematografiche di alta qualità ma in un tempo estremamente breve.
Gli utenti possono fornire suggerimenti al programma non solo su cosa includere nel video, ma anche sul tipo di telecamera che desiderano utilizzare, sulla selezione dell’obiettivo, sull’impostazione dell’illuminazione, sull’estetica visiva, sulla composizione e sullo storyboard.
Un esempio di richiesta che utilizza alcuni di questi dettagli potrebbe essere il seguente:
“Utilizza un teleobiettivo medio (85 mm) per catturare un ritratto intimo di un venditore ambulante che lavora di notte. Illumina la scena con un mix di luci calde e luminose del venditore e luci ambientali più fredde della città sullo sfondo. Concentrati sui dettagli delle mani del venditore mentre preparano cibo o merci, bilanciando l’inquadratura con il loro volto espressivo. L’immagine dovrebbe evocare il duro lavoro e l’orgoglio del loro mestiere”.
Quanto è buono Sora Turbo?
Non è perfetto.
Gli utenti scrivono un messaggio di testo sul tipo di video che vorrebbero generare e Sora crea il video. Sono presenti limitazioni nella versione corrente. La qualità video arriva fino a 1080p a 30 fotogrammi al secondo e può durare solo 20 secondi.
Questo è un esempio di video Sora Turbo di Emi Kusana, artista multimediale e cantante dei Satellite Young, un gruppo musicale ispirato al J-pop e ai temi fantascientifici degli anni ’80, che utilizza temi di Takenoko-zoku, un gruppo di moda di gli anni ’80. Sebbene esista un limite di 20 secondi, la funzione Sora Storyboard consente agli utenti di mettere insieme più video generati dall’intelligenza artificiale e disporli in sequenza, come mostrato nel video qui sotto.
In alcuni video compaiono anche errori evidenti. Ad esempio, nel video qui sopra, al traguardo dei 36 secondi, uno dei ballerini esegue una rotazione del collo di 180 gradi, che ovviamente non è umanamente possibile, e continua la routine di danza. La società dovrà lavorare ulteriormente per risolvere bug come questo, ha affermato.
In un video di esempio di una donna che cucina, pubblicato a febbraio da Sam Altman, fondatore di OpenAI, gli spettatori noteranno che il cucchiaio nella mano destra della donna scompare quando smette di mescolare.
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— Sam Altman (@sama) 15 febbraio 2024
Come è stato accolto Sora Turbo nel settore?
Alcuni esperti del settore e direttori creativi sono preoccupati per il modo in cui Sora potrebbe sconvolgere l’industria cinematografica, in particolare Hollywood.
A marzo, un dirigente di Hollywood ha dichiarato ad Oltre La Linea, a condizione di restare anonimo: “Non lo vedo tanto come una minaccia alla produzione, quanto piuttosto come una minaccia al modo in cui la produzione viene svolta come la conosciamo attualmente”.
Ha fatto riferimento ai cambiamenti nel modo in cui veniva effettuata la post-produzione in passato, ad esempio quando le persone hanno iniziato a modificare i video su laptop personali invece di pagare le società di post-produzione per svolgere il lavoro.
“Molte persone sono state spazzate via in quella transizione mentre altre potevano improvvisamente permettersi un editore adeguato senza le spese generali richieste da un ufficio postale”, ha detto.
Sora è l’unico generatore di video AI?
No, non lo è. Il mercato dei generatori video AI cresce ogni giorno. Tuttavia, un chiaro elemento di differenziazione tra Sora e gli altri concorrenti è la qualità video e il realismo senza pari che Sora è in grado di produrre.
Inoltre, la nuova versione, Sora Turbo, include una serie di funzionalità avanzate di editing video che gli utenti potrebbero trovare su Adobe Premiere Pro o Final Cut Pro, due programmi software di editing video molto popolari utilizzati nella creazione di film, TV e contenuti online.
Inoltre, Sora è sostenuta finanziariamente dalla mega società di software Microsoft. Ad oggi, Microsoft ha investito quasi 14 miliardi di dollari con l’ultima iniezione di liquidità di 10 miliardi di dollari il 23 gennaio. Secondo la CNBC di ottobre, OpenAI dispone ora di una linea di credito rotativa di 4 miliardi di dollari, portando la sua liquidità totale a oltre 10 miliardi di dollari. Tale importo di investimento fornisce a Sora un livello di leva finanziaria che molti altri concorrenti non hanno.
Quali altri generatori video sono disponibili?
Esistono molti altri generatori di video AI di alto livello, tra cui:
Pista di terza generazione
Runway, fondata nel 2018, ha raccolto un totale di 237 milioni di dollari in finanziamenti e, secondo quanto riferito, è in trattative con la società di venture capital General Atlantic per raccogliere 450 milioni di dollari in nuovi finanziamenti, secondo The Information, una pubblicazione che copre l’industria tecnologica e l’industria del venture capital. La versione gratuita di Runway Gen 3 può generare video clip di 10 secondi con una risoluzione di 720p con 30 fotogrammi al secondo. Per gli abbonati a pagamento, i video clip possono essere impostati su 1440p o 2160p.
Simile a Sora, può creare un video basato su un messaggio di testo ma si appoggia fortemente ai creatori di social media e agli esperti di marketing che lo utilizzano per creare pubblicità grazie alla sua alta velocità ed efficienza nei progetti video di breve durata.
Una delle sfide dei video di lunga durata generati dall’intelligenza artificiale è la coerenza tra più video generati. I video più lunghi richiedono un rapido perfezionamento interattivo per far sì che tutti i video abbiano lo stesso aspetto.
Kling AI
Kling, sostenuta da Kuaishou, conosciuta a livello internazionale anche come Kwai, è un’importante azienda tecnologica cinese con sede a Pechino, Cina. Kling è stato presentato nel giugno 2024 e si sta posizionando come concorrente di piattaforme come Sora di OpenAI. Kling può generare video lunghi fino a due minuti con una risoluzione di 1080p a 30 fotogrammi al secondo.
MiniMax
MiniMax, una startup cinese di intelligenza artificiale, è sostenuta da Alibaba Group Holding, una società multinazionale specializzata in e-commerce, servizi Internet e servizi tecnologici con sede in Cina e il cui ultimo round di finanziamento è stato di 600 milioni di dollari a marzo. MiniMax è stata fondata nel 2021 da ex dipendenti di SenseTime, un’azienda leader nel settore dell’intelligenza artificiale con sede a Shatin, Hong Kong.
Minimax può generare video clip da sei secondi con una risoluzione di 720p e 25 fotogrammi al secondo.