Notebookcheck Logo

I ricercatori di Google presentano Genie, un'intelligenza artificiale che sa creare mini-scene di gioco a partire da immagini esemplificative

L'AI di Google Genie è in grado di creare una mini-scena di gioco giocabile da un'unica immagine di input. (Fonte: Immagine generata dall'AI Dall-E 3)
L'AI di Google Genie è in grado di creare una mini-scena di gioco giocabile da un'unica immagine di input. (Fonte: Immagine generata dall'AI Dall-E 3)
I ricercatori di Google DeepMind hanno presentato Genie, la prima AI generativa di ambiente interattivo al mondo. Questa AI può guardare un'immagine di un esempio di platform 2D, quindi creare una mini-scena di gioco giocabile. L'AI non ha bisogno di input aggiuntivi per farlo.

I ricercatori di Google DeepMind hanno presentato Genie, la prima AI generativa di ambiente interattivo al mondo. L'AI può creare una scena giocabile dopo aver osservato un'immagine di un esempio di gioco. Questo apre la porta ai giocatori per creare giochi giocabili senza programmazione.

Genie è stata addestrata al gameplay di platform 2D guardando 30.000 ore di video (6,8 milioni di clip da 16 secondi). L'AI semplifica ciò che vede rappresentando le immagini video e le azioni che vede come serie di numeri, proprio come un umano che usa le parole per descrivere una scena di gioco.

Una volta addestrata, a Genie basta un singolo esempio di scena di gioco per creare una mini-scena giocabile. Dietro le quinte, l'AI può estendere l'immagine di partenza utilizzando metodi sofisticati per generare le parti mancanti di un'immagine, in modo che Genie possa disegnare nuove parti del mondo di gioco man mano che il giocatore avanza. Lo fa facendo riferimento ai milioni di filmati che ha visto, dando al personaggio azioni giocabili come correre o saltare.

È importante che Genie impari le azioni osservando il gameplay, non facendole indicare dagli umani. Quindi, quando c'è un ponte con un vuoto, l'IA sa, in base a ciò che ha visto, che un personaggio probabilmente dovrà saltare il vuoto e lo fa quando il giocatore umano preme il pulsante "su" su un controller.

Tutto questo richiede un'enorme potenza di calcolo per l'addestramento (migliaia di teraflops per settimane su computer con centinaia di chip) e per il gioco, che può essere eseguito solo a un frame super-lento al secondo.

Per chi ha una mentalità tecnica, i fotogrammi video e le azioni latenti dedotte vengono tokenizzati utilizzando van den Oord's VQ-VAE. Le azioni latenti specificate dall'utente, insieme ai fotogrammi video tokenizzati, vengono immessi nel modello dinamico utilizzando il trasformatore MaskGIT di Chang per generare token di fotogrammi iterativi che vengono utilizzati per generare video di uscita utilizzando MaskViT di Gupta. I trasformatori ST adottati da Xu sono utilizzati per includere l'attenzione temporale oltre a quella spaziale, per migliorare le previsioni e ridurre i requisiti di memoria.

Quindi, fino a quando non arriverà il giorno in cui i computer saranno abbastanza potenti da creare giochi platform 2D completamente da soli, si goda i platform classici con una console portatile(come questa su Amazon).

Google Genie può creare scene riproducibili a partire da immagini o disegni di esempio. Per ulteriori esempi, consulti il sito web di Genie. (Fonte: Google DeepMind)
Google Genie può creare scene riproducibili a partire da immagini o disegni di esempio. Per ulteriori esempi, consulti il sito web di Genie. (Fonte: Google DeepMind)
Please share our article, every link counts!
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2024 03 > I ricercatori di Google presentano Genie, un'intelligenza artificiale che sa creare mini-scene di gioco a partire da immagini esemplificative
David Chien, 2024-03- 6 (Update: 2024-03- 6)