Report del progetto VRS
Progetto per lo studio del Virus Respiratorio Sinciziale (RSV)
Contatto per informazioni: Dr. Javier Villanueva, email jvillanueva AT cesfelipesegundo DOT com
Problemi legati al RSV
Il Virus Respiratorio Sinciziale (RSV) è l’agente che provoca più frequentemente infezioni all’apparato respiratorio dei bambini di età inferiore a 2 anni e la principale causa di ricoveri in ospedale, soprattutto per bronchioliti e polmoniti. L’RSV è causa di epidemie stagionali con poche variazioni da un anno all’altro e queste spesso coincidono con altre diffuse infezioni virali come l’influenza o il rotavirus; tutte queste infezioni producono un elevato numero di ospedalizzazioni che saturano il Sistema Sanitario Nazionale. Inoltre il virus si trasmette molto facilmente ed è frequente contrarre l’infezione nel nosocomio stesso.
In Spagna si verificano ogni anno 15.000 – 20.000 ricorsi a visite ambulatoriali a causa del RSV. Nella sola regione di Valenzia ben 1500 bambini di età inferiore a 5 anni vengono ricoverati ogni anno in ospedale e ci rimangono mediamente 6 giorni. Il costo della ospedalizzazione pediatrica per il Sistema Sanitario Valenziano è di circa 3,5 milioni di euro all’anno. Per stimare correttamente il costo complessivo della malattia sarebbe comunque necessario aggiungere i costi del sistema sanitario di base e quelli sociali (indiretti).
Perciò è importante avere degli strumenti che permettano di adeguarsi alle necessità sanitarie, di stabilire quindi degli indicatori che aiutino le organizzazioni sanitarie ad impostare strategie di controllo del RSV affinché il Sistema Sanitario sia preparato a reagire efficacemente. I ricercatori stanno inoltre studiando dei vaccini che possano proteggere i bambini nei primi anni di età, quando il sistema immunitario non è completamente sviluppato e, cosa più importante, il modo di modulare la risposta immunitaria dei più piccoli in funzione della gravità della malattia.
Modellazione del Virus
I fatti sopra riportati ci hanno spinto a proporre lo sviluppo di un modello dinamico di trasmissione del RSV e dell’infezione, utilizzando come base i dati reali ricavati dall’ospedalizzazione dei bambini di età inferiore a 1 anno nella regione spagnola di Valenzia. Una volta sviluppato il modello, il nostro scopo è quello di progettare molteplici strategie di prevenzione, inclusa la vaccinazione, e di studiarne l’efficacia; verranno inoltre effettuate analisi farmaco-economiche per ottenere strategie più efficienti, il tutto per ridurre l’incidenza del RSV. Infine, come logica conseguenza, il progetto è quello di proporre delle linee guida di Salute Pubblica e di estendere il modello all’intera Spagna.
Il team che lavora su questa malattia ha sviluppato un modello di rete in grado di simulare i contatti interpersonali e la trasmissione del RSV meglio di qualsiasi altro modello esistente. Il punto di partenza è stata la suddivisione della popolazione in base alla condizione in cui un singolo individuo si trova in relazione alla malattia: vulnerabile o sano, malato, guarito, compresi tutti gli stati di transizione intermedi, come mostra la figura seguente:

Poi è stata costruita una rete, o grafico, in cui ogni nodo rappresenta un singolo individuo con le sue specifiche caratteristiche indipendenti dagli altri nodi (età, stato di salute, sesso, ecc…). Le linee che congiungono i nodi rappresentano le relazioni tra gli individui, relazioni che la malattia sfrutta per trasmettersi. Se queste relazioni vengono scelte a caso per la costruzione della rete, allora si ha una cosiddetta “rete casuale”. Per di più, in funzione della distribuzione probabilistica casuale scelta per impostare le relazioni tra i nodi, si possono distinguere differenti reti casuali (Poisson, esponenziale, potenziale). Una volta costruita la rete e definite le regole della sua evoluzione, si può simulare il modello studiando, per ogni individuo, le relazioni che intercorrono con gli altri e il modo in cui è influenzato da queste. Con questo approccio è facile studiare situazioni quali il comportamento della malattia nel caso in cui venga vaccinato un ristretto gruppo della popolazione (es. solo i bambini o solo gli anziani), o nel caso in cui uno specifico trattamento medico venga applicato solo ad un ridotto numero di malati. Questa metodologia è rappresentata dalla figura seguente:

L’inconveniente di questo modello è che la stima dei parametri (che chiamiamo “model fitting” o “calibratura” sui dati reali) è un processo che richiede un grosso carico di CPU. A parte poche specifiche eccezioni, il processo di calibratura implica una ricerca di tipo brute-force. Questo significa che si è obbligati a testare ogni singola combinazione dei parametri (velocità dell’infezione, numero di relazioni, tempo di guarigione), essendo ognuna di esse un vero e proprio modello. Il test o l’”evoluzione” del modello consiste nell’analizzare su base giornaliera, per un periodo di diversi anni, cosa accade a ogni singolo individuo; se si ammala, si ricovera, guarisce o muore, ecc… Fatto questo i risultati delle simulazioni devono essere controllati per verificare quanto bene coincidono con i dati reali già noti.
Nella pratica questo porta a dover utilizzare modelli di rete con delle grosse restrizioni, ad esempio di dimensioni molto ridotte (per numero di nodi, per numero di relazioni o addirittura entrambi) o con una variabilità limitata dei parametri su cui si può eseguire i test. Si pensi ad esempio a un modello dell’intera popolazione spagnola (circa 45 milioni di nodi); la rete sarebbe troppo estesa. Allora si operano dei tagli, utilizzando magari solo 10.000 o 100.000 nodi, e poi si estrapolano i risultati. Questo procedimento a volte risulta valido ma in molti casi è perlomeno discutibile.
Al termine delle varie fasi, una volta che il modello sarà stato convalidato e migliorato, si punterà principalmente a testare diverse strategie di vaccinazione e ad analizzarne costi e benefici.
Fasi del Progetto
Questo progetto ha utilizzato il calcolo distribuito per procedere con l’implementazione del modello, in un periodo di tempo ragionevole, suddividendo il procedimento in tre fasi.
Fase I: Prima Calibratura
In questa fase è stata eseguito un aggiustamento grossolano del modello rispetto ai parametri velocità dell’infezione e numero di relazioni, questo per avvicinarsi il più possibile ai dati reali. E’ stato usato un sistema di calcolo distribuito proprietario chiamato "SISIFO", utilizzabile per moli ridotte di calcolo su reti locali. E’ stato utilizzato un numero variabile di computer (mediamente più di 20 con picchi di 100 nei fine settimana) e sono stati elaborati più di 60.000 modelli da un milione di nodi ciascuno, per un totale di 3 anni di tempo CPU. Si sono ottenuti dei risultati interessanti e si è visto che il modello riesce ad imitare ragionevolmente l’evoluzione del virus.
Fase II: Seconda Calibratura
In questa fase è stato eseguita una taratura fine del modello rispetto ai parametri velocità dell’infezione, numero di relazioni e periodo di immunizzazione. Questo è stato fatto per determinare il modo in cui l’infezione è influenzata dal periodo di tempo in cui i singoli individui ridiventano vulnerabili dopo essere guariti. Questa fase ha implicato l’elaborazione di circa 140 milioni di modelli da un milione di nodi ciascuno. Questi valori sono superiori a quelli che il nostro sistema SISIFO può sostenere e così ci si è rivolti a BOINC, attivando il nostro server BOINC. La figura seguente mostra questa evoluzione:

Dal 18/05 al 26/06 abbiamo eseguito i calcoli utilizzando i computer del CES Felipe II e del IMM ma la potenza computazionale non era sufficiente; ci sarebbero voluti 8 mesi per completare il lavoro. Il 27/06 abbiamo reso pubblico il progetto alla community BOINC e il passa-parola ha fatto il resto. Nelle successive 3 settimane abbiamo raggiunto gli 850 host attivi e siamo stati in grado di elaborare tutti i modelli rimanenti, totalizzando 21 anni di tempo CPU complessivi e più di 500 Gigabyte di dati risultanti.
Fase III: Terza Calibratura
In questa fase verrà utilizzato il modello migliore uscito dalla Fase II per testare differenti strategie di vaccinazione. La speranza è di eseguire questi calcoli a partire da settembre 2010. E’ ancora da definire se verrà utilizzato un sistema di calcolo distribuito.
Grazie
Desideriamo ringraziare la community italiana BOINC per il suo supporto e particolarmente CALCOLODISTRIBUITO.IT. La lista è certamente più lunga (e la si può trovare nelle pagine sui dati statistici del progetto) ma qui sono elencati solamente i team con più di 10.000 crediti:
1 Team Starfire World BOINC
2 SETI.USA
3 CANAL@Boinc
4 Crunchers@Freiburg
5 BOINC@Poland
6 SeriousCrunchers
7 TitanesDC
8 SETI.Germany
9 BOINC@MIXI
10 AMD Users
11 Team 2ch
12 SaveTheWorld
13 L’Alliance Francophone
14 BOINC@Heidelberg
15 Free-DC
16 The Knights Who Say Ni!
17 Team Norway
18 Team England (Boinc)