Intelligenze artificiali per scoprire le mutazioni nei virus
Lo sviluppo di tecniche di elaborazione del linguaggio naturale è stato utilizzato per accelerare il processo di identificazione delle possibili mutazioni di organismi nocivi come il SARS-CoV-2, che rendono inefficaci la creazione di anticorpi o l'azione dei farmaci.
di Sebastiano Alemanno
L'utilizzo del linguaggio naturale (Nlp - Natural Language Processing) è stato individuato come uno dei megatrend significativi dall'ultimo rapporto dell'Italian Institute for the Future, uno sviluppo che potrà consentire una proficua collaborazione fra ricercatori e intelligenze artificiali.
L'articolo pubblicato su Science il 15 gennaio scorso, e segnalato da MIT Technology Review, "Learning the language of viral evolution and escape - Natural language predicts viral escape", è un esempio di tali possibilità, applicate alla ricerca biologica.
L'idea di base è che il riconoscimento di un virus da parte del sistema immunitario, è un processo analogo all'interpretazione di una frase in un linguaggio. Gli autori hanno verificato la possibilità di scoprire le possibili mutazioni del virus a partire dalla sola sequenza virale, interpretata come se fosse un linguaggio. L'approccio non è molto diverso dall'apprendimento di un linguaggio naturale basato su grandi quantità di testi, poiché le lingue evolute usano sequenze di parole per codificare significati complessi utilizzando regole complesse. Gli stessi princìpi utilizzati per addestrare un modello di linguaggio su una sequenza di parole, si possono usare per addestrare un modello su una sequenza di amminoacidi.
Gli elementi di base sono due concetti: la grammatica e la semantica, o significato. Un virus mutante che riesca a sopravvivere e riprodursi deve rispettare delle regole biologiche, una 'grammatica' corretta. Allo stesso tempo, per evitare di essere riconosciuto dal sistema immunitario, deve apparire 'diverso' da quello che è, e questo equivale ad un cambiamento del suo 'significato'.
La ricerca biologica tradizionale richiede molto tempo: l'attività di studio di una sequenza genomica e delle mutazioni richiedono settimane. Tramite questo approccio invece è possibile utilizzare modelli matematici per verificare su decine di migliaia di sequenze genetiche di virus, le mutazioni che possono sviluppare e che hanno le maggiori probabilità di successo nell'evadere il sistema immunitario.
Sapere in anticipo quali mutazioni possono svilupparsi, fornisce informazioni fondamentali per la gestione del sistema sanitario e l'indirizzamento della ricerca.
Il lavoro pubblicato rappresenta per ora solo un inizio, ma il suo sviluppo viene visto come una vera rivoluzione verso la comprensione di questi meccanismi evolutivi. Trattare le mutazioni genetiche come cambiamenti semantici è un approccio che può essere utilizzato anche per comprendere lo sviluppo di una resistenza alla chemioterapia da parte di proteine del cancro o agli antibiotici da parte di proteine batteriche.
di Sebastiano Alemanno