Google presenta Gemini 2.5 Flash Image "nano-banana" con una maggiore coerenza di modifica

Il modello "nano-banana" di Google DeepMind offre modifiche precise delle immagini (Fonte: Gemini)

Il nuovo Gemini 2.5 Flash Image di Google DeepMind, soprannominato "nano-banana", promette un controllo più fine sull'editing di immagini AI. Mantiene i caratteri coerenti tra le scene, consente modifiche a più giri e fonde le immagini con istruzioni in linguaggio naturale, il tutto aggiungendo filigrane visibili e invisibili per la sicurezza.

Nathan Ali (traduzione a cura di Ninh Duy), Pubblicato 08/28/2025 🇺🇸 🇪🇸 ...

Google DeepMind lancia su https://blog.google/intl/en-mena/product-updates/explore-get-answers/nano-banana-image-editing-in-gemini-just-got-a-major-upgrade/ Gemini 2.5 Flash Image, chiamato anche "nano-banana", per l'app Gemini e per gli sviluppatori attraverso Gemini API, Google AI Studio e Vertex AI. Questo aggiornamento risolve una lamentela frequente con gli strumenti di immagine AI: piccole modifiche che finiscono per cambiare l'intera immagine. Google descrive questa versione come un miglioramento della qualità e del controllo rispetto alle versioni precedenti.

La caratteristica principale è la coerenza dei personaggi. È possibile mantenere lo stesso aspetto di una persona, di un animale domestico o di un prodotto in diverse scene, anche se si cambiano abiti, acconciature, periodi di tempo o ambientazioni. Il modello può anche combinare diverse immagini in una sola, apportare modifiche specifiche utilizzando istruzioni in linguaggio naturale e utilizzare la conoscenza del mondo di Gemini durante la creazione e la modifica delle immagini.

Può utilizzare questo strumento per inserire lo stesso personaggio in ambienti diversi, mostrare un prodotto da varie angolazioni o mantenere le immagini del marchio coerenti tra le varie campagne. L'editing multi-giro le consente di continuare ad apportare modifiche, come l'aggiunta di mobili e decorazioni in una stanza per provare delle idee. Può anche mescolare i disegni, aggiungere un motivo da un'immagine a un oggetto in un'altra, o fondere una persona e un animale domestico in una nuova scena.

I prezzi sono trasparenti per gli sviluppatori: Gemini 2.5 Flash Image costa 30 dollari per un milione di gettoni di output. Ogni immagine conta come 1.290 gettoni di uscita, il che si traduce in circa 0,039 dollari per immagine. Le altre modalità di input e output seguono i prezzi standard di Gemini 2.5 Flash.

Per la sicurezza, le immagini generate includono un marchio AI visibile e una filigrana digitale SynthID invisibile. Google afferma che SynthID può ancora essere rilevato dopo le modifiche più comuni, il che dovrebbe aiutare a verificare l'origine delle immagini, dato che i supporti sintetici diventano più difficili da riconoscere.

Google afferma che le prime anteprime lo considerano un modello di editing di immagini leader. L'editing integrato dell'app Gemini ora mantiene i dettagli sottili nelle sue foto. Può caricare una foto, richiedere modifiche, combinare le immagini con il suo animale domestico, scambiare gli sfondi per provare nuovi wallpaper o collocarsi in scene diverse. Può anche utilizzare l'immagine modificata in Gemini per creare un breve video.