Proprio nelle ore in cui Google ha messo in pausa la generazione di immagini di Gemini AI, per via di problemi legati alla realizzazione di foto storiche di persone, la startup Stability AI presenta Stable Diffusion 3.
Si tratta di uno degli strumenti di generazione foto da testo più famosi in rete, pioniere insieme al chatbot ChatGpt dell'intelligenza artificiale generativa per il consumatore.
Stando ad una comunicazione ufficiale dello sviluppatore, la principale differenza tra Diffusion 3 e i predecessori è la possibilità, per gli utenti, di far inserire all'interno delle immagini anche dei testi, in maniera chiara e precisa, particolare assente altrove. Non di rado infatti, quando si usa un qualsiasi strumento di IA generativa per le foto, nelle grafiche ottenute i testi sono confusi, con errori di ortografia e incomprensioni. Al momento, Stable Diffusion 3 non è stato rilasciato al pubblico. L'unico mezzo per poterlo provare è iscriversi alla lista di attesa e attendere il rilascio della versione sperimentale.
Altri miglioramenti, per Stability AI, includono una più alta qualità delle immagini finali e l'opportunità di descrivere con un testo più lungo ciò che si desidera, inserendo anche dettagli nella richiesta per far si che questi siano presenti nelle immagini artificiali. L'annuncio arriva pochi giorni dopo che il più grande rivale di Stability AI, OpenAI, ha presentato Sora, un modello di intelligenza artificiale in grado di generare video quasi realistici e ad alta definizione da semplici istruzioni di testo. Sora non è ancora disponibile al grande pubblico.