Google DeepMind lancia su https://blog.google/intl/en-mena/product-updates/explore-get-answers/nano-banana-image-editing-in-gemini-just-got-a-major-upgrade/ Gemini 2.5 Flash Image, chiamato anche "nano-banana", per l'app Gemini e per gli sviluppatori attraverso Gemini API, Google AI Studio e Vertex AI. Questo aggiornamento risolve una lamentela frequente con gli strumenti di immagine AI: piccole modifiche che finiscono per cambiare l'intera immagine. Google descrive questa versione come un miglioramento della qualità e del controllo rispetto alle versioni precedenti.
La caratteristica principale è la coerenza dei personaggi. È possibile mantenere lo stesso aspetto di una persona, di un animale domestico o di un prodotto in diverse scene, anche se si cambiano abiti, acconciature, periodi di tempo o ambientazioni. Il modello può anche combinare diverse immagini in una sola, apportare modifiche specifiche utilizzando istruzioni in linguaggio naturale e utilizzare la conoscenza del mondo di Gemini durante la creazione e la modifica delle immagini.
Può utilizzare questo strumento per inserire lo stesso personaggio in ambienti diversi, mostrare un prodotto da varie angolazioni o mantenere le immagini del marchio coerenti tra le varie campagne. L'editing multi-giro le consente di continuare ad apportare modifiche, come l'aggiunta di mobili e decorazioni in una stanza per provare delle idee. Può anche mescolare i disegni, aggiungere un motivo da un'immagine a un oggetto in un'altra, o fondere una persona e un animale domestico in una nuova scena.
I prezzi sono trasparenti per gli sviluppatori: Gemini 2.5 Flash Image costa 30 dollari per un milione di gettoni di output. Ogni immagine conta come 1.290 gettoni di uscita, il che si traduce in circa 0,039 dollari per immagine. Le altre modalità di input e output seguono i prezzi standard di Gemini 2.5 Flash.
Per la sicurezza, le immagini generate includono un marchio AI visibile e una filigrana digitale SynthID invisibile. Google afferma che SynthID può ancora essere rilevato dopo le modifiche più comuni, il che dovrebbe aiutare a verificare l'origine delle immagini, dato che i supporti sintetici diventano più difficili da riconoscere.
Google afferma che le prime anteprime lo considerano un modello di editing di immagini leader. L'editing integrato dell'app Gemini ora mantiene i dettagli sottili nelle sue foto. Può caricare una foto, richiedere modifiche, combinare le immagini con il suo animale domestico, scambiare gli sfondi per provare nuovi wallpaper o collocarsi in scene diverse. Può anche utilizzare l'immagine modificata in Gemini per creare un breve video.
Fonte(i)
Google (in inglese)
I nostri Top 10
» Top 10 Portatili Multimedia
» Top 10 Portatili Gaming
» Top 10 Portatili Gaming Leggeri
» Top 10 Portatili da Ufficio e Business economici
» Top 10 Portatili Premium da Ufficio/Business
» Top 10 Portatili sotto i 300 Euro
» Top 10 Portatili sotto i 500 Euro
» Top 10 dei Portatili Workstation
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Convertibili
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Smartphones