Un modello computerizzato potrebbe aiutare gli scienziati a prepararsi meglio a un’eventuale prossima pandemia di COVID-19. Grazie a un algoritmo di apprendimento automatico, formato per identificare correlazioni tra cambiamenti nella sequenza genetica del virus che causa il COVID-19 e dati su ricoveri e morti, il modello può evidenziare precocemente la gravità delle nuove varianti.
A idearlo è stato un gruppo di ricercatori americani guidato da Bahrad Sokhansanj, del Drexel’s College of Engineering di Philadelphia.
Il lavoro è stato pubblicato su Computers in Biology and Medicine e si basa sull’analisi genetica della sequenza della proteina spike del virus, la parte virale che consente al microrganismo di evadere il sistema immunitario e infettare le cellule sane, che è anche la parte che ha subito più frequentemente mutazioni nel corso della pandemia.
Per realizzare il modello i ricercatori hanno usato un algoritmo di apprendimento automatico chiamato GPBoost, comunemente applicato nell’analisi dei dati di vendita dalle grandi aziende.
L’algoritmo è stato usato per l’analisi genetica del virus e dei dati dei pazienti, come età e sesso, nonché per gli outcome medici relativi alla malattia, quindi casi lievi, ricoveri e morti.
“Quando abbiamo una sequenza, possiamo predire il rischio di malattia grave da una variante prima di condurre esperimenti con animali da laboratorio o in vitro”, ha spiegato Sokhansanj, leader del team di ricerca.
Per informare l’algoritmo sono stati impiegati i dati di GISAID, il più grande database genetico di persone infettate dal coronavirus.
Fonte: Computers in Biology and Medicine (2022)
https://pubmed.ncbi.nlm.nih.gov/36041271/