Notebookcheck Logo
Il nostro autore in un ufficio immaginario di Notebookcheck (fonte immagine: generata da Vidu.com)

Video generati dall'AI con personaggi e scene coerenti? Test pratico di Vidu.com

Problemi di intelligenza artificiale.

Vidu.com sostiene che la sua AI può generare video con personaggi e ambienti coerenti. Questo significherebbe che si possono mettere insieme più sequenze con gli stessi "attori" e potenzialmente creare interi (brevi) film. Ma funziona davvero? Lo abbiamo messo alla prova.
Christian Hintze (traduzione a cura di DeepL / Ninh Duy) Pubblicato 🇺🇸 🇩🇪 ...
AI

Verdetto - Potenziale enorme, ma non è ancora arrivato

Il potenziale (e i rischi) sono impressionanti. L'AI rimodellerà senza dubbio non solo la creazione di contenuti, ma anche l'industria cinematografica e dei giochi. Avere personaggi, ambientazioni e ambienti coerenti è un passo importante per rendere i generatori di video AI pratici, al di là dell'uso come novità.

fonte dell'immagine: Screenshot su Vidu.com
fonte dell'immagine: Screenshot su Vidu.com

In questo momento, però, non è ancora arrivato. Che senso ha se la persona rimane la stessa (ammesso che lo faccia), ma poi cammina attraverso oggetti solidi, si duplica improvvisamente o le crescono sei dita su una mano?

Al momento, Vidu.com sembra più un giocattolo. È divertente, ma la tecnologia non è ancora abbastanza affidabile per un uso professionale nel cinema, nella pubblicità o in settori simili. Ci sono semplicemente troppi difetti.

Pro

+ divertente video sandbox
+ può produrre immagini impressionanti
+ utilizzo gratuito per i primi esperimenti

Contro

- meno coerenza del previsto
- le immagini di riferimento possono essere distorte
- troppi errori

Prezzi e disponibilità

Chiunque può provare Vidu.com gratuitamente dopo aver creato un account. Il sistema funziona a crediti. I nuovi utenti ricevono alcuni crediti iniziali, e si possono guadagnare altri crediti attraverso determinate azioni.

Esistono anche opzioni di abbonamento mensile e annuale.

Opzioni di abbonamento e prezzi (fonte immagine: Screenshot su Vidu.com)
Opzioni di abbonamento e prezzi (fonte immagine: Screenshot su Vidu.com)
5 crediti per il login giornaliero (fonte immagine: Screenshot su Vidu.com)
5 crediti per il login giornaliero (fonte immagine: Screenshot su Vidu.com)
Può guadagnare più crediti (fonte immagine: Screenshot su Vidu.com)
Può guadagnare più crediti (fonte immagine: Screenshot su Vidu.com)

Nonostante le valide critiche, troviamo affascinante l'AI in questo spazio. Ma la qualità dei risultati varia enormemente: da un lato, è possibile ottenere ambienti incredibilmente dettagliati direttamente dalla propria immaginazione. Dall'altro, le persone generate dall'AI spesso fissano il vuoto o si muovono in uno strano slow-motion.

Perciò, abbiamo dato al nuovo generatore di video AI Vidu.com un giro noi stessi. Gli sviluppatori hanno gentilmente aggiunto 500 crediti al nostro conto per il test. Il modello di punta della piattaforma, Vidu Q1, può elaborare fino a sette immagini di riferimento in una singola sequenza video. Gli elementi mancanti possono essere generati attraverso suggerimenti testuali.

Le immagini e i video di riferimento sembrano già piuttosto eccitanti (fonte immagine: Screenshot su Vidu.com)
Le immagini e i video di riferimento sembrano già piuttosto eccitanti (fonte immagine: Screenshot su Vidu.com)
Uno dei tanti video campione (fonte immagine: Screenshot su Vidu.com)
Uno dei tanti video campione (fonte immagine: Screenshot su Vidu.com)

Cosa può fare con Vidu?

Gli strumenti nella barra laterale sinistra (fonte immagine: Screenshot su Vidu.com)
Gli strumenti nella barra laterale sinistra (fonte immagine: Screenshot su Vidu.com)

Con Vidu, può generare video AI utilizzando questi strumenti:

  1. Da testo a video: Digiti un messaggio che descrive ciò che dovrebbe accadere nel video
  2. Da immagine a video: Generare un video da una singola immagine. Ancora più bello: imposti un fotogramma iniziale e uno finale, e Vidu riempie la transizione
  3. Riferimento al video: La funzione più interessante. Carichi immagini di personaggi, luoghi o oggetti e l'intelligenza artificiale cercherà di mantenerli coerenti in un video.

l'output è Full HD, 16:9, con formato smartphone opzionale. I video possono anche essere upscalati, ad esempio a 4K.

Esperienza diretta - curva di apprendimento, suggerimenti precisi

Il nostro piano ambizioso:

  • Scena 1: Un redattore di Notebookcheck si trova in un ufficio per testare un computer portatile.
  • Scena 2: Digita una valutazione mediocre.
  • Scena 3: Taglio su un altro ufficio, dove uomini in giacca e cravatta guardano il filmato di sorveglianza del redattore che inserisce la valutazione mediocre.
  • Scena 4: Uno degli uomini in giacca e cravatta preme un pulsante di allarme.
  • Scena 5: Viene inviata una squadra di tipo SWAT.

In totale, abbiamo tracciato 10 scene grezze.

1. Scena: Il redattore testa un computer portatile

Abbiamo utilizzato una vecchia foto, non del tutto aggiornata, di uno dei nostri redattori come riferimento del personaggio, oltre a una foto dell'ufficio per l'ambientazione. Abbiamo aggiunto il nostro logo Notebookcheck, un computer portatile e il logo di un marchio di PC fittizio ("Lavani"). Poi abbiamo dato il seguente suggerimento:

Le nostre immagini di riferimento (fonte dell'immagine: Screenshot su Vidu.com)
Le nostre immagini di riferimento (fonte dell'immagine: Screenshot su Vidu.com)
Il nostro 1. prompt (fonte immagine: Screenshot su Vidu.com)
Il nostro 1. prompt (fonte immagine: Screenshot su Vidu.com)
Scelta del modello e della risoluzione (fonte immagine: Screenshot su Vidu.com)
Scelta del modello e della risoluzione (fonte immagine: Screenshot su Vidu.com)

In breve: il nostro redattore (Immagine 1) dovrebbe essere in piedi nell'ufficio (Immagine 2), a testare un computer portatile. Sul muro di mattoni sullo sfondo, dovrebbe apparire il logo Notebookcheck (Immagine 3).

Il rendering di una clip di 5 secondi con il modello Vidu Q1 richiede solo 1-2 minuti e costa 15-20 crediti. Il risultato?

Non eravamo molto soddisfatti dei seguenti problemi:

  1. Perché l'acconciatura del nostro personaggio non corrisponde alla foto di riferimento? Rimarrà coerente nelle scene successive?
  2. Perché il nostro logo di riferimento è stato trasformato in "notobochech"?
  3. Perché non è stato incluso l'angolo di ripresa "sopra le spalle" richiesto?
  4. Perché il montatore continua a parlare in un microfono per tutto il tempo?

Per i registi, questo rende difficile ottenere gli angoli di ripresa e le configurazioni esatte che descrivono.

Logo sbagliato, acconciatura sbagliata (fonte immagine: Screenshot su Vidu.com)
Logo sbagliato, acconciatura sbagliata (fonte immagine: Screenshot su Vidu.com)

Abbiamo modificato il nostro prompt, ma più aggiungevamo dettagli, più spuntavano problemi. Ora l'acconciatura era corretta, ma improvvisamente c'erano due redattori gemelli sullo schermo. Poi il nostro redattore ha attraversato una scrivania.

L'IA ha avuto problemi anche con il posizionamento del primo piano. E nonostante le ripetute richieste, non ha mai prodotto l'inquadratura sopra le spalle richiesta. In breve, i nostri input di testo non sono stati seguiti con precisione.

Da immagine a video

Abbiamo accantonato la nostra ambiziosa idea di cortometraggio e abbiamo provato la tecnica Image-to-Video e le transizioni tra due immagini di riferimento.

l primo ha funzionato abbastanza bene. Ad esempio, la nostra immagine di Illidan (da *Warcraft 3*) è stata trasformata in una breve clip. La telecamera ha effettuato uno zoom sul volto del cacciatore di demoni, mentre era accigliato. Per motivi di copyright, non mostreremo l'immagine o il video qui.

Infine, abbiamo testato una transizione tra due fotogrammi:

  1. Illidan si trova su una roccia.
  2. Illidan atterra a terra.

L'idea: Illidan dovrebbe saltare dalla roccia (Immagine 1) e atterrare a terra (Immagine 2). Ma nel video generato, Illidan si è trasformato in un'ombra nera simile a un uccello nel mezzo. Completamente inutilizzabile.

Non assomiglia affatto a Illidan, a prescindere dal salto (fonte immagine: Screenshot su Vidu.com)
Non assomiglia affatto a Illidan, a prescindere dal salto (fonte immagine: Screenshot su Vidu.com)

Sommario

Generatore di video Vidu.com (fonte immagine: Screenshot su Vidu.com)
Generatore di video Vidu.com (fonte immagine: Screenshot su Vidu.com)

Generare video con Vidu.com è semplicissimo. Ma ottenere le scene, le angolazioni e le azioni esatte che desidera è tutt'altro che semplice. I suggerimenti non vengono seguiti con attenzione, le immagini di riferimento vengono distorte (logo, acconciatura), gli oggetti perdono consistenza fisica (camminare attraverso una scrivania) o si verificano altri inconvenienti (editor duplicato).

Tutto sommato, è un po' frustrante e attualmente rende quasi impossibile creare video veramente coerenti e adattati alla sua visione.

Please share our article, every link counts!
Mail Logo
> Recensioni e prove di notebook, tablets e smartphones > Recensioni e prove > Recensioni e prove > Video generati dall'AI con personaggi e scene coerenti? Test pratico di Vidu.com
Christian Hintze, 2025-09-28 (Update: 2025-09-28)