Il Nobel per la Chimica 2024 è stato assegnato a Davide Baker, Damis Hassabis e John M. Jumper per le ricerche sulla struttura delle proteine.
Il britannico Demis Hassabis e l’americano John M. Jumper sono entrambi ricercatori dell’azienda Google DeepMind, che grazie al modello di IA chiamato AlphaFold2 ha messo a disposizione della comunità scientifica uno strumento in grado di analizzare strutture complesse come quelle delle proteine.
L’americano David Baker (62 anni) dell’Università di Washington a Seattle è stato premiato per avere compreso per primo come studiare la struttura delle proteine e, su questa base, come progettarne di nuove, utili per ottenere farmaci, vaccini, nanomateriali o sensori. Per questo suo ruolo pionieristico divide il Nobel a metà con il britannico Demis Hassabis (48 anni) e l’americano John M. Jumper (39 anni), che lavorano entrambi per l’azienda Google DeepMind a Londra.
Qui Hassabis e Jumper hanno messo a punto il modello di intelligenza artificiale chiamato AlphaFold2, che in ricerche pubblicate recentemente si è dimostrato in grado di vedere la struttura di oltre 200 milioni di proteine. Dopo questo successo, AlphaFold2 è stato utilizzato da oltre due milioni di ricercatori di 190 Paesi.
Grazie a questo strumento è diventato possibile accelerare ricerche di importanza fondamentale, come quelle sulla resistenza agli antibiotici o come la progettazione di enzimi capaci di decomporre la plastica.
Così funziona l'IA che svela le proteine
Sono oltre 200 milioni le proteine finora svelate da AlphaFold, il programma di Intelligenza Artificiale sviluppato da DeepMind, l'azienda britannica di Google, che è in grado di predire la struttura 3D di queste molecole in pochi minuti. Ciascuna proteina, infatti, possiede una complessa e unica struttura tridimensionale, che condiziona tutto ciò che è in grado di fare: per sbrogliare questa matassa possono volerci mesi, o anche anni, ma il problema è stato risolto da AlphaFold, che con la sua seconda versione, AlphaFold2, rilasciata nel 2020, ha raggiunto un elevatissimo livello di accuratezza. L'obiettivo era accelerare le scoperte scientifiche in ogni campo, dalla lotta alle malattie a quella contro l'inquinamento, e in pochi anni questo prezioso strumento ha infatti portato ad un'esplosione di dati per la ricerca.
I 200 milioni di proteine comprendono praticamente quasi tutte quelle note alla scienza, provenienti da oltre 1 milione di organismi tra esseri umani, animali, piante, batteri e altri. Questi dati sono stati resi liberamente accessibili nel database di AlphaFold, realizzato nel 2021 grazie alla collaborazione con l'Istituto Europeo di Bioinformatica del Laboratorio Europeo di Biologia Molecolare (Embl-Ebi), e che ora conta più di 2 milioni di utenti in 190 paesi. Dopo solo un anno dalla sua nascita , oltre 1.000 articoli scientifici avevano già citato il database, e molti altri si sono aggiunti da allora.
Il programma di IA alla base di AlphaFold è stato addestrato con i dati ottenuti da tutte le sequenze note di amminoacidi, i mattoncini base che costituiscono le proteine. Quando una sequenza con struttura sconosciuta viene inserita nel programma, l'IA passa in rassegna il suo archivio alla ricerca di tutte le molecole simili, e le mette a confronto. Nel passaggio successivo, cerca di capire come possono interagire tra loro i singoli amminoacidi nello spazio, producendo una mappa delle loro posizioni e costruendo progressivamente la struttura 3D. Infine, AlphaFold mette insieme il puzzle e, dopo diversi controlli, arriva a proporre una struttura definitiva.
A maggio di quest'anno Google DeepMind ha compiuto un ulteriore passo in avanti con la pubblicazione di AlphaFold 3 che, oltre alla struttura delle proteine, è in grado di predire anche quella di tutte le molecole biologiche, a partire dal Dna. Nel maggio 2024 questa terza versione aveva scatenato le proteste dei ricercatori, che non avevano ottenuto il codice promesso dall'azienda per poter accedere allo strumento.