L’Intelligenza artificiale aiuterà a uscire dalla prossima pandemia, non da questa

Alcuni servizi di IA sono stati i primi a segnalare che a Wuhan c’era qualcosa che non andava. Ma anche se i progressi sono impressionanti, per segnalare l’arrivo di un’epidemia, per scoprire chi sia più vulnerabile e per testare i farmaci più efficaci i risultati sono ancora lontani, scrive in una lunga inchiesta il MIT Technology Review. E se si vuole che sia utile la prossima volta, occorrono molti cambiamenti, alcuni non graditi

di Azzurra Carollo

È stata un’intelligenza artificiale (IA) a vedere per prima che stava arrivando, o almeno così dice la storia. Il 30 dicembre scorso, una società di IA chiamata BlueDot, che utilizza l’apprendimento automatico per monitorare le epidemie di malattie infettive in tutto il mondo, ha avvertito i clienti, tra cui vari governi, ospedali e aziende, di un insolito aumento dei casi di polmonite a Wuhan, in Cina. Ci sarebbero voluti altri nove giorni prima che l’Organizzazione Mondiale della Sanità segnalasse ufficialmente quello ormai noto come Covid-19.

Secondo un’analisi di Will Douglas Heaven pubblicata su MIT Technology Review, BlueDot non era solo. Anche un servizio chiamato HealthMap all’ospedale pediatrico di Boston aveva colto i primi segnali. Così come un modello gestito da Metabiota, con sede a San Francisco. Che l’IA possa individuare un’epidemia dall’altra parte del mondo è piuttosto sorprendente, e gli allarmi precoci salvano vite umane.

Ma quanto l’IA ha realmente aiutato ad affrontare l’attuale epidemia? È una domanda a cui è difficile rispondere, sostiene Heaven. Le aziende come BlueDot sono restie a fornire informazioni sui destinatari dei loro servizi e come li utilizzano. E alcuni team umani dicono di aver individuato l’epidemia lo stesso giorno dell’IA. Altri progetti in cui l’IA è stata esplorata come strumento diagnostico o utilizzata per aiutare a trovare un vaccino sono ancora in fase iniziale. Anche se avranno successo, ci vorranno probabilmente mesi per mettere queste innovazioni nelle mani degli operatori sanitari che ne hanno bisogno.

La pubblicità supera la realtà. Infatti, la narrazione apparsa in molti servizi giornalistici e comunicati stampa secondo cui l’IA è una nuova potente arma contro le malattie è solo in parte vera e rischia di diventare controproducente. Per esempio, troppa fiducia nelle capacità dell’IA potrebbe portare a decisioni mal informate che incanalano denaro pubblico verso società di IA non testate, a scapito di interventi collaudati come i programmi farmaceutici. È anche un male per il settore stesso: , più di una volta in passato, aspettative gonfiate ma deluse hanno portato a un crollo dell’interesse per l’IA e alla conseguente perdita di fondi.

Ecco quindi la cruda realtà, sostiene Heaven: l’IA non ci salverà dal coronavirus, sicuramente non questa volta. Ma ci sono tutte le possibilità che giochi un ruolo maggiore nelle future epidemie, se si deciderà di fare dei grandi cambiamenti, la maggior parte non facili e non piacevoli.

Aziende come BlueDot e Metabiota utilizzano una serie di algoritmi di elaborazione della lingua naturale (NLP) per monitorare le notizie e i rapporti ufficiali della sanità in diverse lingue in tutto il mondo, segnalando se menzionano malattie ad alta priorità, come il coronavirus, o più endemiche, come l’HIV o la tubercolosi. I loro strumenti di previsione possono anche attingere ai dati dei viaggi aerei per valutare il rischio che gli hub di transito possano vedere le persone infette in arrivo o in partenza.

I risultati sono ragionevolmente accurati. Per esempio, l’ultimo rapporto pubblico di Metabiota, del 25 febbraio, prevedeva che il 3 marzo ci sarebbero stati 127.000 casi cumulativi in tutto il mondo. Si è superato di circa 30.000 casi, ma Mark Gallivan, il direttore del dipartimento di scienza dei dati dell’azienda, ha detto a MIT Technology Review che questa stima è ancora molto dentro al margine di errore. Ha anche elencato i Paesi che più probabilmente avrebbero segnalato nuovi casi, tra cui Cina, Italia, Iran e Stati Uniti.

Altri tengono d’occhio anche i social media. Stratifyd, un’azienda di analisi dei dati con sede a Charlotte, North Carolina, sta sviluppando un’IA che analizza i post su siti come Facebook e Twitter e li incrocia con descrizioni di malattie tratte da fonti come il National Institutes of Health, l’Organizzazione Mondiale per la Salute Animale e il database globale di identificazione microbica, che memorizza informazioni sul sequenziamento del genoma.

Il lavoro di queste aziende è sicuramente impressionante. E questo dimostra quanto sia avanzato il machine learning negli ultimi anni. Qualche anno fa Google aveva cercato di prevedere le epidemie con il suo sfortunato Flu Tracker, ma venne accantonato nel 2013 quando non riuscì a prevedere il picco di influenza di quell’anno. Cosa è cambiato? Si tratta soprattutto della capacità del software più recente di ascoltare su una gamma molto più ampia di fonti.

Anche l’apprendimento automatico non supervisionato è fondamentale. Lasciare che un’IA identifichi i propri modelli nel rumore di fondo, piuttosto che addestrarla su esempi preselezionati, mette in evidenza cose che forse non avreste pensato di cercare. “Quando si fa una previsione, si cerca un nuovo comportamento”, dice l’amministratore delegato di Stratifyd, Derek Wang.

Ma cosa fare con queste previsioni? BlueDot ha correttamente individuato una manciata di città nel percorso del virus. Questo avrebbe potuto permettere alle autorità di preparare, allertare gli ospedali e mettere in atto misure di contenimento. Ma man mano che la portata dell’epidemia cresce, le previsioni diventano meno specifiche. L’avvertimento di Metabiota che alcuni paesi sarebbero stati colpiti nella settimana successiva potrebbe essere stato corretto, ma è difficile sapere cosa fare con queste informazioni.

Inoltre, tutti questi approcci divengono meno accurati con il progredire dell’epidemia, soprattutto perché è difficile ottenere dati affidabili del tipo di cui l’IA ha bisogno per nutrirsi di Covid-19. Le fonti di notizie e i rapporti ufficiali offrono resoconti incoerenti. C’è confusione sui sintomi e su come il virus passa tra le persone. I media possono far girare le cose in un modo, le autorità in un altro. E prevedere dove una malattia può diffondersi da centinaia di siti in decine di paesi è un compito molto più scoraggiante che fare un appello su dove un singolo focolaio potrebbe diffondersi nei primi giorni. “Il rumore è sempre nemico degli algoritmi di apprendimento automatico”, dice Wang. In effetti, Gallivan riconosce che le previsioni quotidiane di Metabiota erano più facili da fare nelle prime due settimane.

Non sappiamo nemmeno quali siano i comportamenti che la gente adotta: chi lavora da casa, chi si auto-quarantena, chi si lava o non si lava le mani , o che effetto ciò possa avere. Se si vuole prevedere cosa succederà dopo, è necessario avere un quadro preciso di ciò che sta accadendo in questo momento. La poca disponibilità di test diagnostici rende le cose ancora più difficili.

Non è chiaro nemmeno cosa stia succedendo all’interno degli ospedali. Ahmer Inam, di Pactera Edge, una società di consulenza su dati e IA, dice a MIT Technology Review che gli strumenti di previsione sarebbero molto più accurati se i dati sulla salute pubblica non fossero bloccati all’interno delle agenzie governative come avviene in molti paesi, compresi gli Stati Uniti. Ciò significa che un’IA deve appoggiarsi maggiormente su altri dati disponibili come le notizie online. “Quando i media si accorgono di una potenziale nuova condizione medica, è già troppo tardi”, dice.

Ma se l’IA ha bisogno di molti più dati da fonti affidabili per essere utile in questo settore, le strategie per ottenerli possono essere controverse. Occorre condividere più dati personali con aziende e governi.  Darren Schulte, medico e CEO di Apixio, che ha costruito una IA per estrarre informazioni dalle cartelle cliniche dei pazienti, pensa che le cartelle cliniche di tutti gli Stati Uniti dovrebbero essere aperte all’analisi dei dati. Ciò potrebbe consentire a una IA di identificare automaticamente gli individui che sono più a rischio di Covid-19 a causa di una condizione di fondo. Le risorse potrebbero poi essere concentrate sulle persone che ne hanno più bisogno. La tecnologia per leggere le cartelle cliniche dei pazienti ed estrarre informazioni salvavita esiste, dice Schulte. Il problema è che queste cartelle sono suddivise in più database  gestiti da diversi servizi sanitari, il che le rende più difficili da analizzare. “I nostri dati si trovano in piccoli laghi, non in un grande oceano”.

Anche i dati sanitari dovrebbero essere condivisi tra i Paesi, dice Inam: “I virus non operano entro i confini dei confini geopolitici”. Ritiene che i paesi dovrebbero essere obbligati da un accordo internazionale a rilasciare dati in tempo reale sulle diagnosi e sui ricoveri ospedalieri, che potrebbero poi essere inseriti in modelli di apprendimento automatico su scala globale di una pandemia.

Un pio desiderio? Diverse parti del mondo hanno normative diverse sulla privacy per i dati medici. E molti individui si rifiutano di rendere accessibili a terzi i propri dati. Nuove tecniche di elaborazione dei dati, come la privacy differenziale e la formazione su dati sintetici piuttosto che su dati reali, potrebbero offrire una via d’uscita ma è ancora in fase di perfezionamento. Trovare un accordo sugli standard internazionali richiederà ancora più tempo. .

Oltre a prevedere il decorso di un’epidemia, molti sperano che l’IA aiuti a identificare le persone che sono state infettate. L’IA ha una comprovata esperienza in questo campo. I modelli di machine learning per l’esame delle immagini mediche possono cogliere i primi segni di malattia che i medici umani non vedono, dalle malattie degli occhi ai disturbi cardiaci fino al cancro. Ma questi modelli di solito richiedono molti dati da cui imparare.

Nelle ultime settimane sono stati pubblicate online diversi paper che suggeriscono che il machine learning può diagnosticare Covid-19 da scansioni TAC di tessuto polmonare se addestrato a individuare segni rivelatori della malattia nelle immagini. Alexander Selvikvåg Lundervold, della Western Norway University of Applied Sciences di Bergen, Norvegia, esperto di machine learning e imaging medico, ha dichiarato a MIT Technology Review che alla fine l’IA sarà in grado di rilevare segni di Covid-19 nei pazienti. Ma non è chiaro se l’imaging sia la strada da seguire. Da un lato, i segni fisici della malattia potrebbero non manifestarsi nelle scansioni se non dopo un po’ di tempo dopo l’infezione, il che rende poco utile la cosa come diagnosi precoce.

Inoltre, poiché  sono disponibili pochi dati da cui apprendere, è difficile valutare l’accuratezza degli approcci pubblicati online. La maggior parte dei sistemi di riconoscimento delle immagini , compresi quelli formati sulle immagini mediche, sono adattati da modelli formatisi per la prima volta su ImageNet, un set di dati ampiamente utilizzato che comprende milioni di immagini quotidiane. “Per classificare qualcosa di semplice che si avvicina ai dati ImageNet, come le immagini di cani e gatti, si può fare con pochissimi dati”, dice Lundervold. “I risultati sottili nelle immagini mediche, non è altrettanto facile”.

Questo non vuol dire che non succederà, e gli strumenti di IA potrebbero potenzialmente essere costruiti per individuare gli stadi iniziali della malattia in future epidemie. Ma occorre essere scettici oggi su molte delle affermazioni dei medici riguardanti l’IA in grado di diagnosticare la Covid-19. Anche in questo caso, la condivisione di un maggior numero di dati dei pazienti sarà d’aiuto, così come le tecniche di apprendimento automatico che consentono di formare i modelli anche quando i dati sono pochi. Per esempio, l’apprendimento con pochi scatti, in cui un’IA può imparare i modelli da una manciata di risultati, e il trasferimento dell’apprendimento, in cui un’IA già addestrata a fare una cosa può essere rapidamente adattata a fare qualcosa di simile, sono progressi promettenti, ma ancora in corso.

I dati sono essenziali anche pe fare in modo che l’IA sviluppi cure per la malattia. Una tecnica per identificare possibili farmaci è l’utilizzo di algoritmi di progettazione generativa, che producono un vasto numero di risultati potenziali e poi li setacciano per evidenziare quelli che meritano di essere esaminati più da vicino. Questa tecnica può essere utilizzata, per esempio, per cercare rapidamente attraverso milioni di strutture biologiche o molecolari. La SRI International sta collaborando a questo strumento di IA, che utilizza il cosiddetto deep learning per generare molti nuovi candidati farmaci che gli scienziati possono poi valutare. Ciò cambia le carte in tavola per la scoperta di un farmaco, ma ci possono volere ancora molti mesi prima che un candidato promettente diventi un trattamento praticabile.

In teoria, l’IA potrebbe essere usata anche per prevedere l’evoluzione del coronavirus. Inam immagina di eseguire algoritmi di apprendimento non supervisionati per simulare tutti i possibili percorsi evolutivi. Si potrebbero poi aggiungere potenziali vaccini al mix e vedere se i virus mutano per sviluppare resistenza. “Ciò permetterà ai virologi di essere qualche passo avanti rispetto ai virus e di creare vaccini nel caso si verifichi una di queste mutazioni apocalittiche”, dice. Anche questa è una possibilità eccitante, ma lontana. Non ci sono ancora abbastanza informazioni su come il virus muta per poterlo simulare.

Nel frattempo, un forte ostacolo può provenire dai governi. “Mi piacerebbe che cambiasse il rapporto tra i governanti e l’IA”, dice Wang. L’IA non sarà in grado di prevedere l’insorgenza di una malattia da sola, indipendentemente dalla quantità di dati che riceve. Far sì che i leader del governo, delle aziende e dell’assistenza sanitaria abbiano fiducia in questi strumenti cambierà radicalmente la rapidità con cui possiamo reagire alle epidemie, dice Wang a MIT Technology Review. Ma questa fiducia deve provenire da una visione realistica di ciò che l’IA può e non può fare ora, e di ciò che potrebbe migliorare la prossima volta. Per sfruttarla al meglio ci vorranno molti dati, tempo e un coordinamento intelligente tra molte persone diverse. Tutte cose che, secondo Heaven, al momento scarseggiano.

Da Milano Finanza

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.