Prof. Francesca Ieva

“In recent years, hospitals have no longer been able to obtain the analyses and answers they need from simple biostatistics: Data are becoming more heterogeneous and complex and now include textual data, signal data, genomic data, big data, and real world data, as well as images, all of which come from different information sources. Researchers and clinicians know that there is information in that data. However, we need something completely innovative to get it out: New models instead of those that have been taught for the past 20 years. Such methods are being developed through the sharing of transdisciplinary competences, and a place like Politecnico offers a chance to be on the cutting edge of exposure to all possible stimuli in this context.” Francesca Ieva is a professor of Statistics, Applied Statistics and Biostatistics in the Department of Mathematics of Politecnico di Milano. She has been doing analysis and statistical modeling of biomedical data for over ten years and has developed various methods of estimating, forecasting, and sizing problems derived from healthcare system requirements. “Over the years, we have worked primarily on data related to cardiovascular diseases. However, these methods have been designed to be adaptable to other diseases, and, in particular, we are working on two projects to apply them to the COVID situation. Firstly, in Lombardy, and, once the model is ready, it can be scaled up to areas of any size.”

The Coronavirus pandemic had a massive impact on our healthcare system’s ability to provide services, diagnoses, treatments, care, etc. The REVEAL project allows for an interpretative analysis of how access to all healthcare services has changed for the Italian population and forecasts how many people have been “left behind” due to healthcare system saturation and lockdown measures. “We must accurately estimate our ‘waiting list’ in order to use resources efficiently. Moreover, in some cases, patients will never catch up, as their health worsened due to lack of intervention and, therefore, they will impact even more on the system than they would have in normal conditions.” Starting from these data, the model builds an index for each patient, via artificial intelligence algorithms, that indicates how much this person is at risk of developing serious adverse events. These indices will be helpful both to institutions, for a correct estimate of resources to invest in the healthcare system, and to doctors, for creating personalized therapeutic treatments.

“REVEAL takes into consideration the patient’s current situation and clinical history. For each patient, the method allows us to automatically summarize their history with their present condition in a single output that places them in a specific risk category. The purpose of this indicator is not to replace doctors but to provide them with a support tool that assists in doing assessments, setting up monitoring processes or creating personalized therapies.”

Therefore, the objective of REVEAL is to build a decision-making tool for doctors and healthcare institutions that highlights possible scenarios of personalized intervention with a more rational and efficient use of resources. “If I estimate that a certain number of patients will now be classified as “at high risk”, this means I am associating a series of procedures with specific economic and human resource costs with this risk. Forecasting is fundamental in moments of extreme uncertainty, such as now, as it allows a healthcare system to allocate the correct amount of resources for its needs and not find itself overwhelmed in an emergency.” You can find an article that shows the REVEAL model applied to cardiovascular diseases at this link. Data related to COVID studies have not been published yet.

COVIDEMIA, the second project that Ieva’s group is working on, is also moving towards personalized medicine, while generating a healthcare system report to help staff forecast possible onsets of high-risk situations. While the REVEAL project is taking a close look at how well the healthcare system functions in extreme conditions, COVIDEMIA is studying the behavioral and psychological consequences affecting patients’ lives, i.e. their level of compliance with prescribed therapies. Here too, the method developed by Ieva for cardiocirculatory diseases is ready to be adapted to the COVID scenario.

“When patients with multiple or chronic conditions are released from hospital, they are prescribed a pharmacological therapy or routine. However, they are not always able to maintain compliance due to forgetfulness, indolence, contraindications, or for organizational or economic reasons. COVIDEMIA describes development scenarios based on a series of questions. Was the patient prescribed everything needed for their specific condition? Is the patient following their therapy correctly? If not, why? Etcetera. Each of these options has an impact on the healthcare system, as a patient with good compliance will be re-hospitalized less often and require less unscheduled appointments, while a non-compliant patient will likely develop further problems. We are measuring the impact of this behavior by integrating statistical models with artificial intelligence, machine learning, and text mining tools. We elaborate data using techniques that allow for appropriate pre-processing, which is then followed by modeling and clinical-epidemiological analysis, through parametric and non-parametric provisional models e.g. mixed-effect hierarchical models, linear and non-linear regression models, and multistate and survival models, to which longitudinal information is integrated via Functional Data Analysis techniques.”

Using regional administrative databases, researchers analyze biomedical and healthcare data with the objective of understanding how different behaviors translate into different results and in what measure. “We can extract and integrate very heterogeneous administrative or clinical data. This allows us to do scenario analyses that describe possible evolutions in the state of health of many patients. We use machine learning techniques to analyze non-structured and non-digital data, such as texts, images, or genomic information. All this information is then elaborated and appropriately summarized so it can be input into a provisional model and provide an accurate and easy-to-read output. The last step is to create information dashboards that provide easily interpretable results, even by clinicians and administrative staff.”

Tools such as REVEAL and COVIDEMIA are of great use both to doctors, who obtain objective criteria on which to base therapeutic decisions for individual patients, and to the system as a whole, as they allow for understanding what healthcare needs could be required in various scenarios within a specific time period. “When we talk about personalized medicine, one of the most important aspects is privacy protection. All these data are provided and handled anonymously. Each person is a statistical unit being studied for its behavior and their identity cannot be traced directly because data owners encrypt identities in accordance with laws regarding privacy and sensitive data handling. Analysis results are then projected in terms of patient risk. Nobody has or will ever have access to the personal data of individual citizens.” The timeline for both projects is 18 to 24 months.


Prof. Francesca Ieva

“Sempre più spesso, negli ultimi anni, gli ospedali non riescono più a ottenere da semplici dati biostatistici le analisi e le risposte di cui hanno bisogno: i dati stanno diventando sempre più eterogenei e molto complessi, abbiamo a che fare con immagini, dati testuali, dati segnale, dati genomici, big data, real world data, tutti provenienti da fonti informative diverse. Sappiamo, come lo sanno i clinici, che l’informazione in quei dati c’è, ma per tirarla fuori c’è bisogno di qualcosa di completamente innovativo: modelli nuovi, che non sono quelli che sono stati insegnati, a noi per primi, negli ultimi 20 anni. Sono metodi che si stanno sviluppando a fronte di condivisione di competenze transdisciplinari, e un posto come il Politecnico offre la possibilità di trovarsi sulla cresta dell’onda nell’esposizione a tutti i possibili stimoli che in questo senso possono arrivare”. Francesca Ieva è docente di Statistica, Statistica applicata e Biostatistica al dipartimento di Matematica del Politecnico di Milano. Da oltre 10 anni si occupa di analisi e modellizzazione statistica di dati di tipo biomedico e ha sviluppato diversi metodi di stima, previsione e dimensionamento per problematiche derivanti dalle esigenze del sistema sanitario. “Negli anni abbiamo lavorato soprattutto a dati relativi a patologie cardiovascolari, ma questi metodi sono pensati apposta per essere adattabili a altri tipi di patologie e, in particolare, stiamo lavorando a due progetti per applicarli alla situazione COVID, in prima battuta in Lombardia, con la capacità di scalare il modello, una volta pronto, su qualsiasi dimensione”.

La pandemia di Coronavirus ha avuto impatto importante sulla capacità del sistema sanitario di erogare di servizi per la salute, processi di cura, diagnosi, trattamenti, ecc. Il progetto REVEAL consente di fare un’analisi interpretativa di come sia cambiato l’accesso a prestazioni sanitarie di qualsiasi tipo da parte della popolazione in Italia e dare una proiezione di quanta gente sia “rimasta indietro” a causa della saturazione del sistema sanitario e delle misure di lockdown. “È necessario stimare correttamente la “coda” per un efficiente utilizzo delle risorse; inoltre, in alcuni casi, i pazienti non potranno recuperare perché la loro salute è peggiorata a causa del mancato intervento, e quindi impatteranno sul sistema in maniera maggiore di quanto sarebbe successo in condizioni normali”. A partire da questi dati, il modello costruisce per ciascun paziente, mediante algoritmi di intelligenza artificiale, un indice che indichi quanto questa persona sia a rischio di sviluppare avventi avversi importanti; da un lato, serve alle istituzioni per stimare correttamente quali risorse investire nel sistema sanitario, dall’altro, è utile ai medici per a identificare percorsi terapeutici personalizzati.

“REVEAL prende in considerazione la storia clinica del paziente, non solo la situazione attuale. Il metodo ci consente di sintetizzare questa storia insieme al presente, in modo automatico, in un unico output in grado di categorizzare ogni paziente in fasce di rischio. Questo indicatore non intende sostituire i medici, ma fornire loro uno strumento di supporto che possa aiutarli a fare delle valutazioni, a attivare un iter di monitoraggio o una terapia ad hoc”.

L’obiettivo di REVEAL è quindi quello di costruire uno strumento decisionale per medici e istituzioni sanitarie, che evidenzi possibili scenari di intervento personalizzati con un uso più razionale e efficiente delle risorse: “se effettuo una stima per cui un certo numero di pazienti verranno classificati come “ad alto rischio”, significa che sto associando a questo altro rischio una serie di procedure che hanno costi in termini economici e di risorse umane. Fare una previsione è fondamentale in momenti come questo, caratterizzati da grande incertezza, per fare un corretto dimensionamento delle risorse che un sistema sanitario deve mettere a disposizione per far fronte alle necessità e per non ritrovarsi saturato nel momento dell’emergenza”. A questo link un articolo che spiega il modello REVEAL applicato a malattie cardiovascolari. I dati relativi agli studi su COVID non sono ancora stati pubblicati.

Anche COVIDEMIA, il secondo progetto a cui il gruppo di Ieva sta lavorando, va nella direzione della medicina personalizzata e allo stesso tempo cerca di dare una lettura di sistema che serva al personale sanitario per prevedere il possibile insorgere di situazioni a alto rischio. Se, nel caso di REVEAL, a essere sotto la lente di ingrandimento è quanto il sistema sanitario sia in grado di funzionare in condizioni estreme, COVIDEMIA studia le conseguenze di un aspetto più psicologico e comportamentale della vita dei pazienti, cioè la loro capacità di seguire più o meno alla lettera le indicazioni terapeutiche. Anche in questo caso, il metodo sviluppato da Ieva per malattie del sistema cardiocircolatorio è pronto per essere traslato in ambito COVID.

“Quando un paziente con patologie croniche o multiple viene dimesso da un ospedale, gli viene prescritta una terapia farmacologica o in generale una prassi, ma non sempre il paziente è in grado di seguirla, a volte per dimenticanza o indolenza, a volte per esempio per motivi economici, organizzativi o perché insorgono delle controindicazioni. COVIDEMIA descrive degli scenari di sviluppo a partire da una serie di domande: è stato prescritto tutto quello che doveva essere prescritto per la tipologia di paziente? Il paziente segue la terapia correttamente? Se no, perché? Eccetera. Ognuna di queste opzioni ha un impatto sul sistema perché un paziente con una buona terapia viene riospedalizzato meno e avrà bisogno di meno visite non programmate, mentre un paziente che non è aderente alla terapia è probabile che sviluppi ulteriori problemi. Noi proviamo a misurare l’impatto di questo comportamento integrando modelli statistici e strumenti di intelligenza artificiale, machine learning e text mining. Lavoriamo sui dati con tecniche che ne consentano un adeguato pre-processing, a cui segue la fase modellistica e l’analisi clinico-epidemiologica, tramite modelli previsionali parametrici e non parametrici, quali ad esempio, modelli gerarchici a effetti misti, modelli di regressione lineare e non lineare, modelli di sopravvivenza e multistato, in cui viene integrata l’informazione longitudinale attraverso tecniche di Functional Data Analysis”.

A partire dalle banche dati amministrative delle Regioni, i ricercatori analizzano i dati sanitari e biomedici con l’obiettivo di capire come comportamenti diversi si traducano in esiti diversi e in che misura: “siamo in grado di estrarre ed integrare dati molto eterogenei, di tipo clinico o amministrativo. Questo ci consente di fare analisi di scenario che descrivono le possibili evoluzioni dello stato di salute di un alto numero di pazienti. Usiamo tecniche di machine learning per analisi di dati di tipo non strutturato o di natura diversa da quella numerica, come testi, immagini o informazioni genomiche. Tutte queste informazioni vengono infine elaborate e opportunamente sintetizzate al fine di poter essere inserite in un modello previsionale e fornire un output accurato ma al tempo stesso facilmente leggibile. L’ultimo step del lavoro è il setting di cruscotti informativi che possa fornire esiti interpretabili agevolmente anche da un clinico o dalla persona di riferimento in sede amministrativa”.

Strumenti come REVEAL e COVIDEMIA sono di grande utilità sia ai medici, che ottengono criteri oggettivi su cui basarsi per prendere delle decisioni terapeutiche per i singoli pazienti, ma anche al sistema nel suo complesso, perché consentono di capire quale potrebbe essere, a fronte di scenari diversi, la richiesta di prestazioni sanitare in un orizzonte temporale di interesse. “Una cosa importante, quando parliamo di medicina personalizzata, è la protezione della privacy. Tutti questi dati sono sempre forniti e trattati in maniera totalmente anonima. Ogni persona è un’unità statistica di cui si studia il comportamento, ma alla cui identificazione non si può risalire direttamente in quanto i possessori dei dati provvedono ad opportune criptazioni di identità, in conformità alle normative sulla tutela della privacy e di trattamento dei dati sensibili. I risultati delle analisi vengono poi proiettati in termini di rischio sul paziente. Nessuno ha o avrà mai accesso ai dati personali dei singoli cittadini”. Entrambi i progetti hanno un orizzonte di 18-24 mesi.

Questo sito utilizza i cookies per le statistiche e per agevolare la navigazione nelle pagine del sito e delle applicazioni web. Maggiori informazioni sono disponibili alla pagina dell'informativa sulla privacy