Hai mai pensato di usare StableDiffusion o Openjourney sull’iPad? Mentre alcune app funzionano senza problemi, soprattutto se utilizzi un potente iPad Pro con processore M1 o M2. NextPit spiega come creare immagini AI utilizzando l’iPad.
Che si tratti di App Store, Instagram o Reddit, difficilmente puoi lanciare un sasso su Internet in questo momento senza colpire un’immagine generata dall’intelligenza artificiale. Solo pochi mesi fa l’unico modo per farlo era tramite le interfacce del browser à la Dall-E Mini, e ora sono disponibili gratuitamente innumerevoli modelli di intelligenza artificiale per generare praticamente tutti i tipi di immagini.
Quando StableDiffusion e altri sono saliti alle stelle lo scorso autunno, la generazione di immagini era tutt’altro che facile da usare. Avevi bisogno di un’interfaccia utente à la Automatic1111 e della scheda grafica più potente possibile sul tuo computer desktop. Se non disponi della GPU giusta, puoi anche eseguire gli script basati su Python tramite Google Colab, un framework basato su cloud con una potenza di calcolo praticamente illimitata. Oppure potresti semplicemente pagarlo a Midjourney, ma poi rimanere bloccato con uno stile di immagine relativamente specifico.
Quindi, come si comporta StableDiffusion sull’iPad?
Nel corso del tempo, la potenza di calcolo necessaria per generare immagini AI è diminuita. Invece di funzionare solo su computer ad alte prestazioni o nel cloud, la generazione di immagini AI ora funziona in modo abbastanza impressionante sull’iPad. Abbiamo provato due diverse app su iPad Pro (2022), alimentate dal chip M2, presentandone sia i punti di forza che di debolezza: Guernika e Draw Things.
Entrambe le app sono semplicemente una GUI per la generazione di immagini utilizzando un modello. Entrambe le app forniscono intrinsecamente un elenco di modelli di immagini che è possibile scaricare. Qua e là, potrai trovare StableDiffusion in varie versioni così come Openjourney, che è l’alternativa open source a Midjourney. Draw Things, d’altra parte, offre un ampio elenco da Disney ad Anime a Super Mario.
Sia Draw Things che Guernika ti consentono anche di caricare i tuoi modelli, che sono sempre condivisi come file .CKPT. L’abbreviazione sta per Checkpoint e si riferisce a uno stato “pensante” di un modello di apprendimento automatico congelato come file. Ci sono innumerevoli fonti su Internet per ogni modello immaginabile.
Quali impostazioni sono importanti?
Oltre al modello, troverai una serie di impostazioni in entrambe le app che si sovrappongono in larga misura. Naturalmente, i prompt sono particolarmente importanti qui, così come i “Passi” e la “Scala guida”.
Per ottenere il risultato desiderato con Draw Things, ci sono molte opzioni di impostazione e un upscaler! / © NextPit
Il prompt è l’istruzione di testo da cui il modello AI genera l’immagine. All’inizio, sembra più semplice di quello che è, perché spesso sono necessari prompt complessi per ottenere buoni risultati nello stile desiderato. Puoi anche utilizzare suggerimenti negativi per escludere determinati stili di immagine, angoli o cose. Ma parleremo dei prompt separatamente di seguito.
I passaggi indicano quanti passaggi vengono utilizzati per generare l’immagine. Di più Passi fondamentalmente si traduce in una qualità superiore ma è richiesto anche più tempo di elaborazione. A seconda del modello utilizzato, diversi numeri di passaggi produrranno buoni risultati. Il Scala di orientamento determina fino a che punto il modello può deviare dalle richieste. Un valore basso consente all’IA più “libertà artificiale” in questo caso.
Sia in Draw Things che in Guernika, puoi anche includere altre immagini come input. A tale scopo esiste un Forza cursore in ogni caso, che determina quanto dovrebbe essere vicino il risultato all’immagine originale. Poiché ogni immagine generata è unica, Draw Things offre la possibilità di generare fino a 100 immagini in una volta sola. Guernika offre persino una modalità infinita!
Guernika ha la maggior parte delle stesse impostazioni di Draw Things. Tuttavia, non puoi (ancora) regolare la risoluzione. / © NextPit
L’ultima funzione è disponibile solo in Draw Things: è qui che puoi impostare la risoluzione di output. Guernika attualmente fornisce solo immagini con una dimensione di 512 × 512 pixel, sebbene lo sviluppatore abbia promesso presto un aggiornamento con maggiore flessibilità. Puoi anche aggiungere un upscaler AI a Draw Things, che aumenta ulteriormente la risoluzione. Quindi puoi creare immagini ad alta risoluzione di 12 megapixel e oltre.
Sembra che tu sia pronto per partire allora! Sul nostro iPad M2, la generazione delle immagini AI ha richiesto da 20 secondi a cinque minuti, a seconda delle impostazioni che abbiamo scelto. Si è rivelato utile testare l’idoneità dei prompt a risoluzione molto bassa e quindi generare immediatamente un batch più ampio di immagini ad alta risoluzione se i risultati sembrano promettenti.
Come si ottengono i prompt giusti?
Scrivere buoni suggerimenti è una scienza in sé e qualcosa che devi prima imparare e allenare. Non è un caso che su importanti portali compaiano già le prime offerte di lavoro come “prompt engineer”, ovvero colui che scrive istruzioni per le IA.
I tuoi suggerimenti producono spazzatura invece di capolavori? Allora lasciati ispirare dalle combinazioni di parole chiave che altri utenti hanno utilizzato per ottenere grandi risultati. Su siti Web come PromptHero, puoi fare clic su AI art e vedere quale modello o checkpoint e quale prompt è stato utilizzato per creare ciascuna immagine.
A proposito, puoi anche chiedere a ChatGPT di scrivere suggerimenti estesi per determinati motivi per te. Basta fare un tentativo.
Cosa ne pensi dell’arte generata dall’intelligenza artificiale in generale? Trovi che l’attuale sviluppo di Midjourney, StableDiffusion e altri sia affascinante, spaventoso o entrambi? Vuoi saperne di più su questo argomento su NextPit? Aspetto la tua opinione nei commenti!