La startup di intelligenza
artificiale Anthropic, su cui ha investito anche Google, è stata
accusata da due siti di addestrare i suoi modelli di IA su
informazioni in essi contenuti senza licenza. Si tratta di
Freelancer e iFixit.
Come scrive il sito specializzatoi Engadget, entrambe le
piattaforme affermano di aver ricevuto milioni di visite dal
sistema automatizzato di Anthropic che raccoglie contenuti dai
rispettivi portali per addestrare le sue tecnologie di
intelligenza artificiale generativa. Tecnicamente, il bot che
legge le informazioni non tiene conto di ciò che vi è scritto
nel file robots.txt dei siti, nel quale sono contenute le
istruzioni sulle pagine a cui sistemi automatizzati possono
avere accesso. Ignorando il protocollo, Anthropic avrebbe
visitato 3,5 milioni di pagine in quattro ore, con finalità di
addestramento degli algoritmi.
"È di gran lunga il sistema più aggressivo" ha detto Matt
Barrie, amministratore delegato di Freelancer. Allo stesso modo,
Kyle Wiens, Ceo di iFixit, ha segnalato che il bot di Anthropic
ha effettuato un milione di accessi ai suoi server nell'arco di
24 ore. "Non solo state prendendo i nostri contenuti senza
pagare, ma state anche occupando le nostre risorse" ha
commentato con un post su X. Le imprese che sviluppano soluzioni
di intelligenza artificiale usano dei software i cosiddetti
"crawler", per raccogliere contenuti dai siti web e addestrare
le loro tecnologie. Una pratica che ha già causato diverse cause
legali, avviate dagli editori per violazione del copyright. Per
prevenire conseguenze del genere, OpenAI ha stipulato diversi
accordi con cui si assicura di poter raccogliere informazioni
online dai siti licenziati, senza problemi. A differenza dei
concorrenti, Anthropic si è sempre voluta distinguere nel
panorama dei chatbot AI affermando di sviluppare software
trasparenti e legittimi. Il più famoso è Claude, lanciato anche
come app per iOS e Android.
Riproduzione riservata © Copyright ANSA