Esperienze digitali. Irccs Humanitas Research Hospital, l'intelligenza artificiale in medicina
Negli ultimi anni il settore sanitario sta vivendo una profonda trasformazione digitale, accelerata soprattutto dall’introduzione dell’intelligenza artificiale (IA), uno strumento in grado di migliorare notevolmente i processi clinici della medicina. Humanitas ha investito nella creazione di un centro di ricerca dedicato all’intelligenza artificiale, l’AI Center, in cui opera un team multidisciplinare di ingegneri, data scientist, bioinformatici e medici che lavorano insieme per migliorare la qualità clinica e aprire nuovi filoni di studio che possano anche diventare startup innovative
28 FEB - Dall’IA generativa ai gemelli digitali (digital twin), le tecniche di intelligenza artificiale e l’approccio data driven stanno già trovando applicazione, facilitando l’introduzione alla medicina personalizzata e supportando i medici nel processo decisionale. Humanitas ha investito nella creazione di un centro di ricerca dedicato all’intelligenza artificiale, l’AI Center, in cui opera un team multidisciplinare di ingegneri, data scientist, bioinformatici e medici che lavorano insieme per migliorare la qualità clinica e aprire nuovi filoni di studio che possano anche diventare startup innovative.
È in questo contesto che nasce Train, progetto di Humanitas dedicato alla ricerca e allo sviluppo di modelli avanzati per la generazione di dati sintetici e digital twin ad alta precisione, addestrati e validati per rispondere a esigenze cliniche precise.
Obiettivi Gli obiettivi di Humanitas e Train per l’introduzione dell’IA in medicina sono:
Sviluppare tecniche innovative di IA per anonimizzare le informazioni cliniche e biologiche dei pazienti e generare dati sintetici, nel rispetto delle norme sulla privacy, per superare la scarsità e la frammentazione delle informazioni disponibili, accelerando la ricerca clinica e lo sviluppo dei farmaci.
Utilizzare i dati sintetici per sviluppare gemelli digitali, integrando una mole sempre più ampia e complessa di dati multimodali e simulando l’andamento dei pazienti nel tempo, prevedendo l’evolversi della condizione clinica e la risposta alle terapie.
Integrare le tecnologie sviluppate in strumenti a supporto della decisione clinica ideati per essere sicuri, facilmente interpretabili e utilizzabili dal medico nella pratica clinica di tutti i giorni.
Tecnologie impiegate I pazienti sintetici sono dati generati artificialmente dall’IA che simulano i pazienti reali. Questi dati possono mimare qualsiasi tipo di dato medico: possono essere tabulari (come i valori numerici delle analisi del sangue), testuali (descrizioni di sintomi), di immagini (immagini istopatologiche), alfanumerici (sequenze DNA) ma devono seguire le stesse distribuzioni statistiche e mantenere le stesse correlazioni dei dati originali. Si tratta quindi di dati statisticamente identici ai reali, però con un livello di privacy elevato perché non esistono nella realtà.
I dati sintetici possono essere generati in modo controllato, selezionando le caratteristiche di interesse, oppure utilizzando informazioni esistenti, ad esempio il testo del referto clinico, per creare nuovi pazienti artificiali o generare sinteticamente i dati mancanti dei pazienti reali.
Il gemello digitale (digital twin) è una simulazione virtuale dell’andamento di un paziente nel tempo che permette di prevedere come potrebbe evolversi la sua condizione clinica e come potrebbe rispondere alle terapie in futuro.
Lo sviluppo di queste tecnologie necessita l’utilizzo di modelli avanzati per integrare le diverse informazioni multimodali dei pazienti (cliniche, genomiche, di immagini, testuali, etc.) e la loro evoluzione nel tempo.
Risultati Abbiamo validato la tecnologia dei dati sintetici in ambito ematologico, dimostrando che è possibile ricapitolare le proprietà statistiche e le complesse interazioni tra caratteristiche cliniche e genomiche, accelerando la ricerca transazionale in ematologia. (D’Amico et al, JCO CCI 2023; Asti et al, Blood 2023). Dalla prima pubblicazione sulla rilevanza clinica delle mutazioni geniche nelle sindromi mielodisplastiche, sono stati necessari diversi anni per raccogliere dati di pazienti reali sufficienti a definire una classificazione della malattia basata sulle caratteristiche molecolari (2021). Generando dati sintetici a partire dai pazienti disponibili nel 2014, abbiamo ottenuto gli stessi risultati di classificazione e valutazione della prognosi, come descritto nel 2021 nello studio originale, dimostrando l’efficacia dei dati sintetici come soluzione alla mancanza e alla frammentazione delle informazioni cliniche reali. Infine, i pazienti sintetici potrebbero essere utilizzati in futuro per migliorare la conduzione degli studi clinici. L’uso di bracci di controllo sintetici infatti può ridurre i costi e la durata degli studi, garantendo che tutti i partecipanti ricevano il trattamento attivo e eliminando i problemi etici nell’assegnazione casuale del trattamento.
I dati sintetici e i modelli digital twin sono stati utilizzati in un caso d’uso specifico, con l’obiettivo di sviluppare e validare un sistema di supporto alle decisioni per definire la tempistica ottimale del trapianto di midollo nei pazienti affetti da sindromi mielodisplastiche sulla base delle informazioni cliniche e genomiche fornite dallo score molecolare IPSS-M rispetto agli score convenzionali (Tentori et al, Blood 2023).
Next step La missione dell’AI Center e di Train è quella di validare l’utilizzo di queste tecnologie nei diversi ambiti della medicina, lavorando per stabilire contatti con istituti di ricerca e partner industriali, con l’obiettivo di sviluppare tecnologie robuste per la medicina personalizzata e l’ottimizzazione della ricerca farmaceutica.
Matteo Della Porta, responsabile leucemie e mielodisplasie di Humanitas, docente di Humanitas University e co-founder di Train; Victor Savevski, Managing Director AI Center di Humanitas e co-founder di Train; Saverio D’Amico, Lead Data Scientist di Humanitas e co-founder di Train