Se hai scelto di non accettare i cookie di profilazione e tracciamento, puoi aderire all’abbonamento "Consentless" a un costo molto accessibile, oppure scegliere un altro abbonamento per accedere ad ANSA.it.

Ti invitiamo a leggere le Condizioni Generali di Servizio, la Cookie Policy e l'Informativa Privacy.

Puoi leggere tutti i titoli di ANSA.it
e 10 contenuti ogni 30 giorni
a €16,99/anno

Servizio equivalente a quello accessibile prestando il consenso ai cookie di profilazione pubblicitaria e tracciamento
Durata annuale (senza rinnovo automatico)
Un pop-up ti avvertirà che hai raggiunto i contenuti consentiti in 30 giorni (potrai continuare a vedere tutti i titoli del sito, ma per aprire altri contenuti dovrai attendere il successivo periodo di 30 giorni)
Pubblicità presente ma non profilata o gestibile mediante il pannello delle preferenze
Iscrizione alle Newsletter tematiche curate dalle redazioni ANSA.

Per accedere senza limiti a tutti i contenuti di ANSA.it

Scegli il piano di abbonamento più adatto alle tue esigenze.

Se accetti tutti i cookie di profilazione pubblicitaria e di tracciamento, noi e 750 terze parti selezionate utilizzeremo cookie e tecnologie simili per raccogliere ed elaborare i tuoi dati personali e fornirti annunci e contenuti personalizzati, valutare l’interazione con annunci e contenuti, effettuare ricerche di mercato, migliorare i prodotti e i servizi.Per maggiori informazioni accedi alla Cookie Policy e all'Informativa Privacy.

Per maggiori informazioni sui servizi di ANSA.it, puoi consultare le nostre risposte alle domande più frequenti, oppure contattarci inviando una mail a register@ansa.it o telefonando al numero verde 800 938 881. Il servizio di assistenza clienti è attivo dal lunedì al venerdì dalle ore 09.00 alle ore 18:30, il sabato dalle ore 09:00 alle ore 14:00.

L'IA a rischio collasso con la rete invasa dai suoi stessi contenuti

In evidenza

Conti: 'A Sanremo previsti 24 brani ma saranno di più'

La Francia del Nord sotto la neve, anche a Parigi

La clinica del cane Palla sul grande schermo

Un murale per Monica Vitti su una scalinata romana

In Veneto 1,5 milioni per mappare il Granchio Blu

Temi caldi

Vai a

L'IA a rischio collasso con la rete invasa dai suoi stessi contenuti

Imparando da ciò che produce, forma frasi e immagini senza senso

25 luglio 2024, 11:48

di Leonardo De Cosmo

Le IA generative a rischio se continuerannoa imparare dai contenuti che esse stesse generano (fonte: PIckPik) - RIPRODUZIONE RISERVATA

Rischio collasso per le Intelligenze Artificiali generative, come ChatGpt: a soffocarle potrebbero essere gli stessi contenuti che generano, capaci di inquinare in modo grave la base di dati usata per addestrarle. A sollevare il problema di un pericoloso effetto a spirale, dove le IA vanno a imparare nuove informazioni usando i contenuti prodotte da loro stesse in un circolo vizioso, è lo studio guidato da Ilia Shumailov, dell'Università di Oxford e pubblicato sulla rivista Nature.

"E' uno studio che in realtà conferma, in modo molto puntuale, delle preoccupazioni 'antiche', ossia che si hanno sin dalla nascita dei modelli generativi, gli Llm", ha detto all'ANSA Viviana Patti, esperta di Computer science dell'Università di Torino.
Ormai le IA generative sono sempre più diffuse, a partire da ChatGpt sono rapidamente arrivati una decina di altri modelli molto diffusi capaci di produrre in pochi istanti contenuti di ogni tipo, dai testi alle foto e i video, e internet si sta rapidamente popolando di contenuti fatti proprio da algoritmi.

Fino a pochi anni fa internet poteva essere considerato un calderone di contenuti di ogni tipo, credibili e non, ma tutti caratterizzati da un elemento comune: erano prodotti da esseri umani. Ora non è più così, e potrebbe esserlo sempre meno, inducendo un cambiamento che potrebbe comportare un problema non da poco. Le IA imparano infatti sulla base di materiali, testi o foto, che gli si mette a disposizione e su cui vengono addestrati, e finora erano contenuti generalmente prodotti da umani, ad esempio le pagine di Wikipedia o set di fotografie di animali, ma ora che la rete si sta popolando di contenuti creati dalle IA potrebbe cambiare la qualità di quel che le IA stesse imparano.

Per analizzare il problema i ricercatori britannici hanno addestrato una IA con materiali prodotti dalla stessa IA e poi usato nuovamente i nuovi materiali prodotti per addestrare un modello di IA, in modo ciclico. Hanno facilmente verificato un peggioramento delle qualità delle IA ad ogni generazione, ad esempio con la produzione di testi con molte frasi ripetute, fino a raggiungere un vero e proprio collasso, ad esempio perdendo completamente la capacità di distinguere gli oggetti, come una chiesa da una lepre.

"Lo studio - sottolinea Patti - dovrebbe essere un richiamo alla comunità affinché si faccia uno sforzo coordinato per garantire una maggiore trasparenza sull'uso dei dati usati per l'addestramento. E in qualche modo capire che occorrerebbe passare dalla corsa alla quantità, fatta finora, a una ricerca di qualità dei dati usati per l'addestramento".

"Il problema sollevato dallo studio è anche più generale perché è valido anche al di fuori dei modelli linguistici", ha aggiunto Valentina Colla, della Scuola Superiore Sant'Anna e che si occupa di applicazioni di IA nei processi industriali. "In tutti i modelli di IA la scarsa affidabilità dei dati ti porta a un crollo delle performance. Non è un caso - ha aggiunto Colla - che spesso la gran parte del nostro lavoro è dedicato alla verifica della qualità dei dati in funzione dello scopo prefisso".

Ultima ora

20:41

L'IA a rischio collasso con la rete invasa dai suoi stessi contenuti

Ultima ora

Vermiglio ammesso alla corsa all'Oscar

Casa Bianca,è la Russia che ha provocato l'escalation in Ucraina

Crosetto, sentenza Cpi sbagliata, ma dovremmo applicarla

Nuovi scontri alla Sapienza tra collettivi-studenti destra

'Nel processo Eni usato solo ciò che giovava all'accusa'

Parlamento convocato 28/11 per elezione 4 giudici Consulta

Gaetz si ritira dalla corsa a ministro della Giustizia Usa

Putin, lanciato un missile ipersonico balistico

Video

Trecento studenti al Tecnopolo di Bologna per conoscere il Supercalcolo

Il Sole visto dalla sonda europea Solar Orbiter (fonte: ESA)

Stabilito il record di velocità per un veicolo di serie a guida autonoma (fonte: Politecnico di Milano)

Animazione dell'incontro di una nube di gas con due buchi neri (fonte: F. Goicovic et al. 2016)

Rappresentazione artistica della supernova SN 1181 (fonte: W.M. Keck Observatory/Adam Makarenko)

Nature e luce si incontrano nell'arte (fonte: Leonardo De Cosmo)

Alla Maker Faire i giochi da fare a occhi chiusi (fonte: Leonardo De Cosmo)

Alla Maker Faire i giochi da fare a occhi chiusi

Vermiglio ammesso alla corsa all'Oscar

Casa Bianca,è la Russia che ha provocato l'escalation in Ucraina

Crosetto, sentenza Cpi sbagliata, ma dovremmo applicarla

Nuovi scontri alla Sapienza tra collettivi-studenti destra

'Nel processo Eni usato solo ciò che giovava all'accusa'

Parlamento convocato 28/11 per elezione 4 giudici Consulta

Gaetz si ritira dalla corsa a ministro della Giustizia Usa

Putin, lanciato un missile ipersonico balistico