The Sunday Prompt #7 â 16/4/2023
Dopo la pausa di Pasqua torniamo a parlare di prompt e Ai generativa.
Anche se nel frattempo abbiamo visto che il nostro Garante per la protezione dei dati personali ha emanato un ulteriore provvedimento, con cui vengono prese in considerazione alcuni rimedi che OpenAi dovrà adottare entro il 30 aprile per superare la limitazione dei trattamenti prevista dal 31 marzo, oggi non parleremo di questo, perchè credo sia meglio attendere come si risolverà la vicenda, anche in considerazione delle soluzioni che la società americana sarà chiamata ad adottare.
Passiamo quindi a parlare di Midjourney
Midjourney è una AI generativa, che consente di creare delle immagini molto sofisticate tramite prompt testuali.
https://www.midjourney.com/home
Si colloca quindi tra i modelli generativi di immagini, come DALL-E o Stable Diffusion, ma ha la particolaritĂ di creare immagini di alta qualitĂ e molto realistiche in maniera semplice e immediata, oltre ad avere funzioni interessanti che molti di voi avranno visto allâopera (se ricordate le immagini del finto arresto di Trump, o le immagini del nostro Papa in piumino bianco (o chiodo)).
Dato che, a differenza dei due modelli sopra citati, non è dotata di unâinterfaccia web per interagire, il suo utilizzo risulta piĂš ostico ed è quindi giusto soffermarci a spiegarlo.Per utilizzare Midjourney, infatti, è necessario avere Discord (https://discord.com/) unâapp di messagistica avanzata. Infatti, cliccando sulla home page di Midjourney il tasto âJoin the Betaâ si aprirĂ un collegamento al server Discord a cui potete anche accedere direttamente da questo link:https://discord.com/invite/midjourney
Quindi i passaggi sono:
- creare un account Discord;
- una volta cliccato e validato potete scaricare la app sul vostro computer o sullo smartphone, oppure anche usarla come web app direttamente da un browser;
- cliccare sul link di invito qui sopra oppure cliccare sul tasto âJoin the Betaâ nella home page di Midjourney.
Se avete fatto tutto correttamente vi ritroverete allâinterno del server di Midjourney. Non fatevi impressionare dalla quantitĂ di canali presenti nello stesso, ma andate direttamente in uno di quelli con la denominazione ânewbiesâ
Questi canali vi consentono di vedere le immagini che gli altri utenti stanno richiedendo al sistema (con i relativi prompt, alcuni anche interessanti) e di interagire direttamente con il modello dalla casella dei messaggi.
I prompt, infatti, sono inviati come messaggi tramite lâutilizzo di appositi comandi.
Il comando principale è â/imagineâ e una volta che lo avete digitato ed aggiunto uno spazio con la barra spaziatrice vedrete che cambierĂ lo sfondo della casella di testo. A questo punto potete digitare il vosatro prompt per ottenere lâimmagine che volete.
Quindi la formulazione è:Â
/imagine <testo del prompt>
Provate
Prima di procedere con le varie funzionalitĂ offerte da Midjourney per evitare la confusione di vedere le varie immagini e prompt che scorrono create dagli altri utenti, vi consiglio di creare un server separato in Discord ed aggiungere Midjourney.
Per farlo è necessario:
- cliccare sulla grande + in fondo alla barra a sinistra di discord (passandoci sopra appare la scritta âAggiungi un serverâ);
- scegliere lâopzione âCrea personalizzatoâ;
- scegliere âper me e i miei amiciâ
- decidere il nome del server (può essere qualunque)
- il server sarĂ creato e vi apparirĂ la seguente immagine
- selezionate lâultima opzione âAggiungi la tua prima appâ e nella pagina successiva scegliete âDai unâocchiataâ
- a questo punto nella prossima schermata in alto a sinistra appare una casella di ricerca in cui è necessario inserire il testo âmidjourneyâ e premere invio;
- il primo risultato è il âMidjourney Botâ. Selezionatelo e nella schermata successiva premete âAggiungi al serverâ
- vi chiederĂ le autorizzazioni per accedere al vostro server. Cliccando su âContinuaâ e poi âAutorizzaâ (leggendo prima lâinformativa) e superando il captcha successivo il bot viene autorizzato.
A questo punto nel canale #generale del vostro server è attivo il bot di Midjourney e quindi potrete interagire digitando i comandi e i prompt direttamente da qua.
La costruzione dei prompt e gli stili
Midjourney offre moltissime possibilitĂ per creare immagini in diversi stili e controlli.
Quando viene generata unâimmagine dopo un prompt (usando il comando /imagine) il sistema fornisce una preview di 4 immagini.
prompt: Pixar movie style, child reading a book in front of a computer, beach backround, detailed, happy atmosphere
I tasti posti al di sotto servono per ottenere lâimmagine singola selezionata (U1, U2, U3, U4) corrispondente al numero che potete vedere sopra, oppure a far creare al modello delle varianti di una delle 4 (V1, V2, V3, V4). Ovviamente il tasto con le frecce a cerchio rigenerano 4 nuove immagini con il medesimo prompt.
Come vedete il prompt utilizzato per la creazione di quelle immagini contiene alcune istruzioni aggiuntive (detailed, happy atmosphere) che servono proprio a calibrare meglio la creazione dellâimmagine stessa.
E proprio nella possibilitĂ di specificare in maniera dettagliata vari aspetti dellâimmagine è la caratteristica di Midjourney.Â
Infatti è possibile indicare uno stile di un artista (il modello è stato già addestrato su opere di circa 1.500 artisti
oppure indicare un determinato tema (come âhappy atmosphereâ vista sopra), ma anche controllare la risoluzione, il rendering, il formato dellâimmagine, il tipo di lenti fotografiche, e gli effetti che volete siano applicati.
Interessante il comando âcreative (da inserire nel prompt) che chiede al modello di generare immagini piĂš creative.
Eâ possibile decidere le impostazioni digitando il comando /settings che vi fornirĂ le opzioni circa il modello da utilizzare (lâultimo è il V5), la qualitĂ dellâimmagine, la tipologia di stile e la quantitĂ di âstileâ che volete applicare allâimmagine. Ad esempio un basso valore di questo settaggio produrrĂ immagini che sono piĂš collegate al prompt, ma meno artistiche.
In generale, per costruire un prompt dopo il comando /imagine è buona norma descrivere lâoggetto del prompt, ripetendo anche il concetto con parole diverse, lâeventuale background, e poi aggiungere, separandoli con delle virgole, i vari parametri che volete applicare.
Considerate che il modello âamaâ lâenfasi: per ottenere unâimmagine realistica scrivete âiper realisticâ, âsuper realisticâ e cosĂŹ via.
Alcuni prompt di esempio possono essere:
- adorable pet photography, cute, well-lit, sharp-focus, high-quality, artistic, unique, award-winning photograph, Canon EOS 5D Mark IV DSLR, f/8, ISO 100, 1/250 second, close-up, natural light, domestic animals, playful, fluffy, glibatree style
che vi darĂ il seguente risultato
Per avere unâimmagine in stile di un artista è necessario specificarlo allâinizio del prompt.
CosĂŹ se volete un ritratto di un avvocato in stile van Gogh dovrete digitare un prompt del genere:
prompt: artwork by Vincent Van Gogh, young lawyer portrait, court background, dramatic light
per ottenere la seguente immagine:
Uno dei comandi piĂš interessanti è /blend che consente di mixare fino a 4 immagini per ottenerne una nuova (quella sotto è un mix con lâimmagine di prima ed una mia foto).
Attenzione: non è gratis
Eâ bene sapere che il numero di prompt gratuiti è limitato ed al termine sarĂ necessario sottoscrivere un abbonamento secondo le politiche di prezzo stabilite da Midjourney (che trovate qua https://docs.midjourney.com/docs/plans).
Alcune considerazioni legali
Anche Midjourney è stato addestrato con unâenorme quantitĂ di dati tra cui immagini raccolte nel web e in database pubblici.
Il dettaglio e la capacitĂ creare immagini realistiche di qualsiasi oggetto, animale e personaggio con opzioni di renderizzazione avanzate lo rende uno strumento potentissimo, tanto che alcuni fotografi professionisti cominciano a porsi delle domande sul futuro della loro professione, mentre la vicenda delel foto di Trump ha portato da piĂš parti a sollevare il tema dellâuso di questo strumento per la creazione di fake news.
Dâaltra parte è evidente che oramai i modelli generativi stanno sempre piĂš prendendo piede ed alcune riflessioni andrebbero svolte su come risolvere le tematiche legali che essi pongono (principalmente, ad oggi, diritto dâautore e protezione dei dati personali).
Negli Stati Uniti alcune cause sono state giĂ presentate (presso il distretto della California) relativamente alle violazioni del copyright poste in essere da Github (per lâaddestramento di Copilot (https://dockets.justia.com/docket/california/candce/4:2022cv06823/403220) e contro StabilityAI, la societĂ che ha realizzato Midjourney (https://www.pacermonitor.com/public/case/47469042/Andersen_et_al_v_Stability_AI_Ltd_et_al).
Risorse utili:
La documentazione ufficiale: https://docs.midjourney.com/docs/quick-start
Articolo di approfondimento
Una web app che aiuta a generare prompt:
https://promptomania.com/midjourney-prompt-builder/
Il primo marketplace di prompt
đđť Happy Prompting!