L’Intelligenza Artificiale (Artificial Intelligence, AI nella dizione anglosassone) sta entrando rapidamente nel mondo medico, in particolare, nella diagnostica per immagini, con la prospettiva, più o meno a breve termine, di modificare significativamente i percorsi diagnostici e terapeutici, le modalità decisionali del medico e, in ultimo, anche il rapporto medico-paziente.
Si aprono quindi nuove prospettive. Ma potenziali rischi di uno sviluppo incontrollato e non governato dell’AI sono in agguato: dall’uso di sistemi di AI privi di una rigorosa validazione scientifica alla mancanza di controllo sui dati processati dai sistemi, dalle possibili violazioni della privacy fino a discriminazioni introdotte dalla programmazione degli algoritmi. Senza dimenticare le aspettative illusorie e fuorvianti per sanitari e pazienti che potrebbero derivare da un utilizzo improprio dei sistemi di AI.
A questo si aggiunge il fatto che nonostante siano molti gli studi che sembrano fornire prove di affidabilità a favore dei sistemi di AI usati in un contesto diagnostico e in numerosi campi di applicazione - radiologia, radioterapia, oftalmologia, dermatologia, ma anche gastroenterologia, ginecologia oncologica e senologia, ematologia infettivologia e fra cui, non da ultimo, anche il Covid - esistono di contro alcune revisioni sistematiche e meta-analisi che ne mettono in discussione la validità scientifica e la metodologia impiegata per raggiungere quei risultati.
Insomma una matassa complessa da dipanare.
Ecco quindi che il Consiglio Superiore di Sanità - Sezione V del ministero della Salute ha stilato un documento “I sistemi di intelligenza artificiale come strumento di supporto alla diagnostica” che, oltre a fotografare lo stato dell’arte dei sistemi nel mondo della diagnostica, ha elencato una serie di proposte operative mirate sia all’introduzione in modo sicuro dei software di AI nella pratica clinica, sia alla implementazione di infrastrutture e di modalità di governance. Obiettivo, rendere il nostro Paese competitivo a livello internazionale nella programmazione e nello sviluppo dei sistemi di AI.
Lo stato dell’arte. Per comprendere il mondo dell’intelligenza artificiale bisogna partire da un concetto: AI e diagnostica sono strettamente connessi in virtù del concetto chiave di “predizione”. “Se da una parte una buona predizione consente di raggiungere una diagnosi accurata – spiegano gli esperti – dall’altra l’AI è in grado di implementare dei veri e propri ‘modelli predittivi’ matematici capaci di identificare precocemente gli esordi di una malattia anticipandone l’insorgenza”.
Come abbiamo visto gli studi che confutano l’affidabilità dei sistemi di AI nella diagnostica abbracciano molto aree. Tanti gli esempi. In uno studio in ambito radiologico, l’accuratezza di un algoritmo sviluppato per rilevare la polmonite partendo da oltre 112mila immagini radiografiche del torace è stata confrontata con quella di quattro radiologi, risultando superiore. Evidenze esistono, anche, nel campo della identificazione di tumori polmonari, dove algoritmi di machine learning (che si occupa di creare sistemi che apprendono o migliorano le performance in base ai dati utilizzati) istruiti attraverso la scansione di oltre 34mila radiografie toraciche, hanno raggiunto un livello di accuratezza superiore a 17 su 18 radiologi usati come confronto. Risultati simili si sono ottenuti per identificare tumori della mammella: un sistema di AI ha portato a una riduzione assoluta del 5,7% e 1,2% (rispettivamente negli Stati Uniti e nel Regno Unito) nei falsi positivi e del 9,4% e 2,7% nei falsi negativi e, nel confronto con l’operato di 6 radiologi, a un aumento dell‘11,5% della sensibilità.
Altro esempio paradigmatico, in campo radiologico: grazie all’Ai la capacità di diagnosticare con maggiore precisione le fratture del polso è passata dall’81% registrata nella diagnosi da parte del personale di pronto soccorso al 92%, consentendo anche di ridurre le interpretazioni errate del 47%.
Successi sono stati registrati anche in area dermatologica per l’identificazione di neoplasie. Uno studio, basato su quasi 130mila immagini, ha dimostrato l’affidabilità di un sistema di machine learning nell’identificazione di carcinoma e di melanoma con una sensibilità̀ rispettivamente del 96% e del 94%, assolutamente sovrapponibili a quelle di 21 dermatologi americani certificati. Tuttavia, è l’area oftalmologica quella nella quale più numerose sono le prove di affidabilità dei sistemi di AI: uno studio prospettico condotto su 900 pazienti diabetici è stato in grado di identificare retinopatie con una sensibilità̀ dell’87% e una specificità del 91%.
Un sistema sviluppato in ambito pediatrico, addestrato con 100 milioni di dati riferiti a circa 1,4 milioni di visite condotte da oltre 500mila pazienti, ha permesso di ottenere elevate percentuali di successo nel diagnosticare le malattie pediatriche più comuni (95% per sinusiti e altre infezioni respiratorie, 94% per l’influenza, 97% per l’infezione mani-piedi- bocca) e quelle più pericolose o complicate (97% per gli attacchi di asma, 93% per la meningite batterica e per la varicella, 93% per la rosolia, 90% per la mononucleosi), con percentuali di sensibilità e specificità simili a quelle osservate tra i medici più esperti.
Il sistema sembra quindi funzionare, ma sottolineano gli esperti, esistono alcune revisioni sistematiche e meta-analisi che ne mettono in discussione validità scientifica e metodologia impiegata: “Pochi, infatti, sono gli studi clinici che confrontano la diagnosi raggiunta da un sistema di AI o di machine learning rispetto a quella raggiunta da un operatore sanitario o un esperto della materia, e la maggior parte di questi ha un elevato rischio di bias perché́ non correttamente condotti dal punto di vista metodologico”. A questo bisogna aggiungere che molti studi clinici sono retrospettivi e basati su set di dati precedentemente assemblati, mentre sono pochi quelli prospettici condotti in ambienti clinici reali, in un contesto di “real world” e basati sul modello delle sperimentazioni cliniche controllate randomizzate.
Infine, esiste il problema della scarsa collaborazione tra clinici e sviluppatori di sistemi di AI. Per esempio, una revisione sistematica degli studi di imaging polmonare assistito dall’AI per Covid-19 ha rivelato una discrepanza tra ciò quello su cui si concentrano gli sviluppatori e quello di cui i medici hanno bisogno.
Le proposte in campo. Secondo gli esperti per poter introdurre in modo sicuro nella pratica clinica i sistemi di AI e per competere in ambito internazionale nella realizzazione e nello sviluppo degli stessi, è auspicabile che, nel nostro Paese, siano attuati i seguenti interventi:
- creazione di una struttura di governance dei sistemi di AI da parte delle agenzie regolatorie italiane, in particolare il Ministero della Salute per ciò che riguarda i dispositivi medici e Aifa per gli eventuali aspetti terapeutici, con lo scopo di stabilire delle regole rigorose per l’approvazione e la registrazione di tali sistemi;
- predisposizione di Linee Guida nazionali sulle modalità di integrazione e di corretto utilizzo dei sistemi di AI nella diagnostica, in accordo con le società scientifiche di riferimento;
- creazione di un osservatorio nazionale permanente presso il Ministero della Salute, per il monitoraggio delle performance dei sistemi di AI immessi sul mercato (analisi post-market);
- e infine la formazione con moduli universitari e post-universitari per migliorare le conoscenze e competenze del personale medico e delle professioni sanitarie, senza trascurare la scuola secondaria superiore e la contenuti informativi, anche tramite canali informatici, per i cittadini.
E.M.