Ad oggi, la Covid-19 ha infettato oltre 40milioni di persone nel mondo, provocando più di un milione di decessi. Un’emergenza senza precedenti che in questi mesi ha portato scienziati ed esperti a concentrarsi sulla necessità di identificare precocemente i soggetti contagiati e potenzialmente infettivi; un aspetto cruciale, questo, se si considera che il coronavirus può essere presente in un organismo anche senza causare alcun sintomo.
Un gruppo di ricerca multidisciplinare dell’Università di Milano-Bicocca, dell’IRCCS San Raffaele e IRCCS Istituto Ortopedico Galeazzi di Milano, guidato da Federico Cabitza, ingegnere informatico, e da Anna Carobene, biochimica clinica, ha messo a punto un modello che, sfruttando tecniche di intelligenza artificiale, è in grado di identificare la Covid-19 a partire dai risultati dell’emocromo, un semplice esame del sangue.
Lo studio è stato recentemente pubblicato sulla prestigiosa rivista Clinical chemistry and laboratory medicine (https://doi.org/10.1515/cclm-2020-1294), dopo che un primo studio di fattibilità era già stato pubblicato sul Journal of Medical Systems lo scorso maggio.
Professor Cabitza, come funziona il modello?
Il modello è stato sviluppato applicando tecniche di Machine learning ai risultati di esami del sangue, tra cui appunto l’esame emocromocitometrico, che è generalmente disponibile in pochi minuti dal prelievo e a un costo fino a dieci volte inferiore a quello del test molecolare, l’attuale “gold standard” per la rilevazione del virus sars-cov-2, test che peraltro di norma non è disponibile prima di 4 o 5 ore dal momento del prelievo.
Il vostro strumento è già disponibile?
Il modello è reso disponibile attraverso uno strumento web accessibile online (https://covid19-bloodtests-ml.herokuapp.com/) che permette a chiunque, medici e pazienti, di inserire i dati del proprio emocromo e ottenere in pochi secondi una risposta sia in termini categorici – positivo o negativo - sia in termini probabilistici. È importante sottolineare che il nostro modello non si pone come alternativa al test molecolare, ma come strumento a complemento di questo, per supportare gli operatori sanitari nel triage dei pazienti con sospetta COVID e per essere combinato con altri test per raggiungere una accuratezza maggiore: ovviamente non può essere usato da solo, né è stato sviluppato con finalità diagnostiche.
Come lo avete testato?
Il modello si basa su due dataset molto diversi tra loro: quello dei pazienti ricoverati tra marzo e maggio al San Raffaele e quello di persone che nello stesso periodo si sono presentate al pronto soccorso dell’Istituto ortopedico Galeazzi di Milano. Il primo è uno dei centri di riferimento per la sintomatologia Covid, il Galeazzi no: in questo modo abbiamo potuto addestrare il modello predittivo con pazienti molto diversi tra loro. Questo ci ha permesso di ottenere risultati molto buoni in fase di validazione esterna, quando abbiamo applicato il modello anche a dati provenienti dagli ospedali di Desio e di Bergamo. Gli ottimi risultati ottenuti in questa validazione suggerisce che il modello possa funzionare bene anche in contesti diversi da quello in cui è stato sviluppato, il che è una caratteristica molto importante per la reale utilità di qualsiasi sistema di intelligenza artificiale in medicina.
Qual è la sua affidabilità?
Il modello risulta avere un’accuratezza di poco inferiore a quella del tampone naso-faringeo. Per la precisione, abbiamo ottenuto un’accuratezza massima dell’86 per cento e una sensibilità dell’84 per cento. L’accuratezza è la percentuale di volte che il test ha identificato correttamente il risultato: ha identificato la covid se c’era e l'ha esclusa se non c’era. Ma è importante tenere conto anche della sensibilità, ossia della capacità di evitare falsi negativi e quindi di identificare correttamente i positivi. Nella validazione esterna, come accennavo poc’anzi, abbiamo ottenuto risultati anche migliori, arrivando al 92 per cento di accuratezza e ad un’area sotto la curva (una specie di media tra sensitività e specificità) del 98 per cento. Si tratta di un valore molto alto soprattutto alla luce del fatto che non esistono test perfetti, (come è noto, neppure il test molecolare lo è).
Ha affermato che lo strumento è utile in fase di triage, in che modo?
Quando una persona si presenta al pronto soccorso, per qualsiasi motivo, con o senza sintomi da Covid, è sottoposta ad un emocromo di routine. Il nostro sistema, applicato ai risultati di questo esame, fornisce molto velocemente un’indicazione probabilistica della sua positività da Covid-19 e i medici possono usare questa informazione per gestire il paziente in termini di isolamento o spostamento in zone COVID in attesa di ricevere anche il risultato del tampone. Inoltre, note le specificità e sensibilità di questo esame, l’informazione probabilistica fornita dal nostro sistema può essere combinata a queste per migliorarne l’interpretazione e avere una stima più precisa della probabilità che un paziente abbia (o meno) la COVID-19 se il suo test risulta appunto positivo (o negativo, rispettivamente): questo è utile anche in contesti di medicina del territorio per supportare il medico di medicina generale nella decisione di prescrivere il tampone ad una persona asintomatica in isolamento fiduciario o nel valutarne l’esito anche alla luce di altri esami ematochimici.
Ci sono altri contesti in cui può essere un valido aiuto?
Il nostro strumento potrebbe aiutare le strutture ospedaliere in grande difficoltà, ad esempio perché fronteggiano un aumento esponenziale dei casi, quelle che devono fare i conti con la mancanza di reagenti per i test molecolari o quelle strutture dei Paesi in via di sviluppo che non riescono a fare molti tamponi, ma riescono comunque ad eseguire esami del sangue come l’emocromo perché si tratta di una tipologia di esami tra le più comuni (ed economiche). In estrema sintesi, l’intelligenza artificiale che abbiamo sviluppato può servire come complemento e supplemento del test molecolare, oppure quando si attendono i risultati di questo test, oppure anche come un suo surrogato, in quelle situazioni estreme e di grave difficoltà dove anche una informazione probabilistica a partire dai dati ematochimici può fornire qualche indicazione utile agli operatori sanitari. Si tratta di un sistema che, sfruttando le capacità computazionali del machine learning, vuole fornire un ulteriore supporto informativo a chi è tenuto a prendere tempestivamente decisioni mediche anche molto importanti in contesti di valutazione clinica e urgenza sanitaria.
Ti è piaciuto l'articolo? Iscriviti gratuitamente alla newsletter Bnews per rimanere aggiornato su tutte le ultime news dal Campus.