
Guida: Ecco come generare immagini sul suo PC in modo gratuito
CheckMag
Vuole generare immagini sul suo PC senza affidarsi ai servizi cloud? Questa guida la guida alla configurazione di strumenti gratuiti e open-source per un controllo creativo completo senza abbonamenti.Rohith Bhaskar, ✓ Rohith Bhaskar (traduzione a cura di Ninh Duy) Pubblicato 🇺🇸 🇪🇸 ...
Gli strumenti di generazione di immagini sono diventati sempre più capaci di creare immagini fotorealistiche all'avanguardia. Sfortunatamente, la maggior parte di essi è bloccata online dietro un paywall, ma se le dicessi che esiste un modo per eseguirli localmente con una flessibilità molto maggiore di quella offerta dagli strumenti online?
Prerequisiti
1) Una scheda grafica Nvidia con un minimo di 8 GB di VRAM. (si consiglia RTX 3060 o superiore )
2) Un minimo di 16 GB di memoria di sistema DDR4. (Più ne ha, meglio è )
3) Windows 10/11 (è necessario un sistema operativo a 64 bit )
4) Almeno 100-150 GB di spazio libero sul disco rigido per configurare tutto e scaricare i modelli.
5) Una connessione a Internet per la configurazione iniziale. (Necessaria solo per scaricare e installare i frontend dell'interfaccia utente e i modelli di immagini )
Nota: le GPU AMD o Intel non sono ufficialmente supportate dalla maggior parte dei frontend UI e richiedono dei workaround per funzionare.
La prima cosa da fare è assicurarsi di eseguire i driver studio più recenti di Nvidia per la sua scheda grafica. Se non è sicuro della GPU Nvidia installata, faccia clic con il pulsante destro del mouse su un punto qualsiasi del desktop e clic su "Pannello di controllo NVIDIA" nel menu contestuale.
I nostri Top 10
» Top 10 Portatili Multimedia
» Top 10 Portatili Gaming
» Top 10 Portatili Gaming Leggeri
» Top 10 Portatili da Ufficio e Business economici
» Top 10 Portatili Premium da Ufficio/Business
» Top 10 Portatili sotto i 300 Euro
» Top 10 Portatili sotto i 500 Euro
» Top 10 dei Portatili Workstation
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Convertibili
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Smartphones
Ora, cerchi "Informazioni sul sistema" nella parte inferiore della pagina che si apre. Dovrebbe vedere il nome della sua scheda grafica sulla sinistra, insieme ad altre informazioni, se necessario.
Apra il repository ufficiale dei driver di Nvidia quicerchi Nvidia Studio Drivers e clicchi su Download. Si aprirà una pagina per scaricare il driver più recente. Ora, è opportuno verificare se il suo prodotto Nvidia è supportato dal driver. Può farlo cliccando su "Prodotti supportati" proprio sotto il pulsante di download. Installi i driver e riavvii il PC.
Nota: questa operazione sovrascriverà i driver Game Ready, se sono stati installati. Se il suo sistema è destinato principalmente al gioco, potrebbe notare una riduzione delle prestazioni nei giochi.
Ottimo! Il primo passo è stato completato. Ora possiamo passare alle cose più divertenti, come scaricare i frontend dell'interfaccia utente. Consiglio vivamente di scaricare e installare Stability Matrix. Si tratta di uno strumento di manutenzione all-in-one che supporta più frontend UI e li mantiene automaticamente aggiornati. Crea persino delle cartelle condivise per i modelli e gli output, che può visualizzare in un unico posto.
Nella pagina GitHub di https://github.com/LykosAI/StabilityMatrix?tab=readme-ov-file#%EF%B8%8F-one-click-install-and-update-for-stable-diffusion-web-ui-packagesscorra fino alla sezione readme e cerchi il suo sistema operativo. Stability Matrix offre anche download per Linux e Mac. Ai fini di questa guida, utilizzeremo la versione per Windows.
Clicchi sul pulsante del sistema operativo, e le verrà richiesto di scaricare un file .zip. Questo deve essere collocato sull'unità in cui desidera installare Stability Matrix. Si assicuri di avere almeno 100-150 GB di spazio libero sull'unità. Questo non solo per l'installazione di Stability Matrix, ma anche per il download dei modelli richiesti, dei codificatori di testo e di altri file di sistema. Questi si accumulano molto rapidamente.
Una volta scaricato il file, lo decomprima ed esegua StabilityMatrix.exe che si trova nella cartella estratta. Dovrebbe scaricare automaticamente tutti i file necessari e configurare l'interfaccia per lei.
Fantastico! Ora abbiamo un'interfaccia per scaricare e installare più frontend UI.
Ora è il momento di decidere il front-end che desidera utilizzare. Un front-end è un'interfaccia grafica utente (GUI) che le permette di interagire con i modelli di immagine, manipolare le impostazioni e, soprattutto, generare immagini.
Ecco un rapido elenco delle opzioni offerte da Stability Matrix.
1) Fucina WebUI di diffusione stabile
2) Fucina WebUI a diffusione stabile - Classica
4) Foooocus
5) Fooocus - Edizione 1-Up di mashb1t
7) SwarmUI
8) Cogstudio
9) Diffusione stabile WebUI UX
10) RuinedFooocus
11) SD.Next
12) SDFX
13) InvokeAI
Personalmente, consiglio vivamente di utilizzare ComfyUI. Si tratta di un'applicazione visiva, basata sui nodi, che potrebbe sembrare un po' intimidatoria all'inizio, ma è sorprendentemente facile da utilizzare. Si ricordi che Stability Matrix può gestire più frontend, quindi non deve limitarsi ad uno solo. Può sperimentare e trovare quello più adatto a lei.
Utilizzi l'elenco precedente e si colleghi alle pagine GitHub di ciascun pacchetto. Si prenda il tempo necessario per conoscere meglio ogni pacchetto prima di fare una scelta.
Ai fini di questa guida, la guiderò nel download e nell'installazione di ComfyUI, insieme ad alcune estensioni utili che dovrebbero servirla.
Installazione e configurazione di ComfyUI
Apra Stability Matrix e clicchi sul pulsante "Aggiungi pacchetto". Trovi ora "ComfyUI" nell'elenco dei pacchetti offerti e ci clicchi sopra. Nella pagina che si apre, si assicuri che "master" sia selezionato nella casella a discesa. La versione "master" è la versione più stabile e consigliata per la maggior parte degli utenti.
Una volta cliccato su Installa, Stability Matrix inizierà a scaricare il pacchetto per lei. Attenda che finisca. Il download potrebbe richiedere alcuni minuti, quindi si senta libero di continuare ad utilizzare il suo sistema in questo momento. Se il riquadro del download si chiude o se per errore preme "Nascondi", utilizzi il pulsante dei download in basso per visualizzare lo stato del suo download attuale.
Una volta installato, dovrebbe vedere una notifica pop-up nella barra delle applicazioni che la informa che ComfyUI è pronto per l'uso.
Torni a Pacchetti e vedrà il riquadro ComfyUI sulla pagina, ma non lo avvii ancora. Per impostazione predefinita, ComfyUI è impostato per avviarsi in modalità VRAM normale per le GPU con 12 GB di VRAM o superiore. Se ha una scheda con 8 GB di VRAM, è il momento giusto per forzare l'avvio di Comfy in modalità Low VRAM.
Successivamente, dobbiamo installare ComfyUI Manager. Si tratta di un componente fondamentale che le permette di installare e gestire vari nodi personalizzati all'interno dell'applicazione. Clicchi sull'icona Jigsaw a destra e digiti "ComfyUI-Manager" nella sezione "Estensioni disponibili". La selezioni e clicchi su Installa in basso. Una volta terminata l'installazione, dovrebbe vedere "(installato)" accanto ad essa. Ora siamo pronti a lanciare ComfyUI.
Avvii ComfyUI e consenta che venga eseguito il processo di avvio. Una volta terminato, si aprirà automaticamente in una nuova scheda del suo browser predefinito. Se non lo fa, torni alla scheda Pacchetti e clicchi su WebUI sul riquadro ComfyUI ora di colore verde.
Congratulazioni! Ora ha terminato tutti i prerequisiti. Ora passiamo alla parte migliore: scaricare e utilizzare i modelli di immagine.
Scaricare e utilizzare il suo primo modello di immagine
Prima di iniziare a scaricare i modelli di immagine, vediamo un glossario dei termini con cui dovrebbe avere familiarità.
1) UNET/Checkpoint/Modello di diffusione/Diffusori - Il grande capo. Il cervello dell'operazione, lo consideri come l'artista che dipinge usando le sue parole.
2) Tokenizer - Il cronometrista. Converte i suoi suggerimenti in token da incorporare prima che i Codificatori di testo prendano il sopravvento. A seconda del modello, sarà limitato a un numero prestabilito di token (parole) che potrà utilizzare.
3) Codificatori di testo/CLIP - Sono gli addetti ai lavori. Convertono le richieste di testo in input digitali che l'UNET può comprendere.
4) Campionatori - Il maestro d'orchestra. Guida in modo iterativo il processo di generazione dell'immagine, raffinando l'immagine dal rumore all'output finale.
5) VAE - La squadra di pulizia. Puliscono il rumore dopo la fase di generazione e aiutano a migliorare la qualità dell'immagine.
Ora, nel corso del suo viaggio incontrerà altri termini, ma queste sono le basi che definiranno tutto da questo momento in poi. Non si preoccupi di approfondirli troppo per il momento.
Si aprirà una finestra con esempi di flussi di lavoro già impostati per lei. Clicchi su "Fondamenti" e poi su "Generazione di immagini" Vedrà immediatamente un errore sullo schermo che la informa della mancanza di modelli. Questo perché non abbiamo ancora scaricato un modello di immagine. Andiamo avanti e facciamolo. Clicchi su Download.
Mentre il file si scarica, soffermiamoci su alcune differenze tra i vari modelli che vedrà. Quello che stiamo scaricando in questo momento è il modello base Stable Diffusion 1.5 modello base. Nell'area di disegno di ComfyUI, avrà notato tre collegamenti separati dal primo nodo "Load Checkpoint". Uno ciascuno per MODEL, CLIP e VAE.
Questo perché tutti e tre sono inclusi in questo checkpoint di base e non è necessario utilizzare CLIP e VAE separati per questo particolare modello.
I modelli di immagine più recenti, invece, come Flux o HiDreamrichiedono di essere scaricati separatamente, quindi lo tenga presente. Fortunatamente, hanno modelli di esempio proprio come questo, quindi non deve preoccuparsi di configurare tutto. Ne parliamo più avanti. Per ora, generiamo la nostra prima immagine.
Ora, se clicca sul pulsante Esegui in basso a destra, noterà che ComfyUI le dà ancora un errore. Questo perché il modello deve essere collocato nella cartella corretta affinché Comfy lo riconosca. Ora, vada nella cartella in cui ha scaricato il modello in Esplora file e lo copi.
Noterà che il nome del file ha un'estensione ".SAFETENSORS". Questo è il formato utilizzato dal file. Come regola generale, scarichi solo i file con estensione .safetensors. Non scarichi i tensori pickle o .pth. Si fidi di me!
Apra la cartella in cui ha installato Stability Matrix e cerchi una cartella chiamata "Models" Faccia doppio clic su di essa e cerchi una sottocartella chiamata "StableDiffusion", incollando il file .safetensors al suo interno.
Per riferimento futuro. I modelli con CLIPS e VAE inclusi devono essere inseriti nella cartella "StableDiffusion". I modelli con solo UNET (senza CLIP o VAE) saranno inseriti nella cartella "DiffusionModels". I codificatori di testo (T5, Llama, CLIP L, CLIP G) devono essere collocati nella cartella "TextEncoders". Infine, i file VAE sono collocati nella cartella "VAE".
Come può vedere, ci sono molte più cartelle di queste tre. Il mio consiglio è di scoprirle quando le raggiungerà. Per ora, preoccupiamoci della nostra immagine.
Aggiorni la pagina web di ComfyUI nel suo browser. Clicchi sulla finestra di dialogo nel nodo "Carica checkpoint" e selezioni il file scaricato.
Trattandosi di un modello, tutto è già impostato per lei. Tuttavia, vale la pena di conoscere le basi per i suoi futuri flussi di lavoro. Cominciamo da sinistra. Abbiamo già parlato del nodo Load Checkpoint e accanto ad esso ci sono due nodi "CLIP Text Encode (Prompt)".
Quello in alto rappresenta i prompt positivi o ciò che si desidera vedere nell'immagine. In basso c'è l'input per i suggerimenti negativi o ciò che non vuole vedere nell'output finale. La generazione di immagini è l'equilibrio di questi due nodi combinati. Crea un'immagine, controlla ciò che non le piace e lo inserisce nel prompt negativo. Per ora, questi sono già inseriti per noi, quindi facciamo clic su "Esegui"
ComfyUI è un'interfaccia visiva, il che significa che può vedere il processo che avviene nodo per nodo. Una volta che il testo è stato codificato, viene inviato al "KSampler", che inizia l'iterazione dell'immagine. Esaminiamo rapidamente tutte le impostazioni di questo nodo.
1) Seme: lo consideri come l'indirizzo dell'immagine. Stesso prompt positivo + prompt negativo + stesse impostazioni + stesso seme = stessa immagine. Utile per ricreare e iterare su un'immagine.
2) Controllo dopo la generazione: Determina se il seme sarà randomizzato dopo ogni generazione o se dovrà rimanere fisso.
3) Passi: Il numero di passi per cui KSampler dovrebbe iterare. La maggior parte dei modelli viene fornita con passi raccomandati.
4) CFG: la reattività del modello ai suoi suggerimenti. Valori più alti = stretta aderenza ai prompt ma meno creatività. Valori più bassi = risultati più creativi al costo dell'aderenza ai prompt.
5) Sampler_name: il nome del campionatore che sta utilizzando. Clicchi sul menu a tendina per ulteriori opzioni. Sperimenti diverse impostazioni e campionatori per ottenere risultati diversi.
6) Scheduler: Lo consideri come il secondo in comando che elabora le strategie che il direttore d'orchestra approva. Anche in questo caso, sperimenti diversi campionatori e schedulatori per trovare quello che funziona per lei.
7) Denoise: Determina la quantità di rumore aggiunto all'inizio del processo di generazione. Questo viene rimosso iterativamente dal campionatore. Il valore non può essere impostato al di sopra di 1,00 e i valori inferiori (0,45 o 0,65) sono utilizzati principalmente nei flussi di lavoro da immagine a immagine, refiner o inpainting.
L'ingresso latent_image a sinistra del nodo KSampler determina le dimensioni dell'immagine. Nel flusso di lavoro, è collegato a un nodo "Empty Latent Image" con una risoluzione di 512x512 e una dimensione del batch (il numero di immagini generate in una corsa) di 1.
Ora, guardi un po'! La nostra primissima immagine. Se è arrivato fin qui, congratulazioni! Ora conosce le basi per iniziare il suo viaggio nella generazione di immagini. Più sperimenta, più scoprirà, e questa tana del coniglio è profonda. Quindi si diverta.
Link utili
CivitAI: Il suo negozio unico per scaricare modelli, LoRA, embeddings e molto altro. (Attenzione: include contenuti NSFW. Utilizzi i filtri del sito integrati)
Monzon Media: Fantastica risorsa per tutorial ComfyUI per principianti e avanzati.
Wiki ComfyUI: Per tutte le sue esigenze di risoluzione dei problemi.
Elenco di risorse Bad ASS ComfyUI: Collegamenti per tutti i MODELLI BASE, CLIP e VAE di cui potrebbe aver bisogno in un unico posto.
Flussi di lavoro comfy: Una comunità dedicata per condividere e scaricare flussi di lavoro.