Stima dell’andamento giornaliero della dimensione della popolazione infetta da COVID-19 a Wuhan
La diffusione di COVID-19 fuori dalla provincia di Hubei è relativamente controllata date le adeguate risorse mediche. Usiamo il numero riportato fuori dall’Hubei perché è una rappresentazione abbastanza accurata della situazione epidemica reale. In questo studio di modellazione, stimiamo prima la dimensione dell’epidemia a Wuhan dal 10 gennaio al 5 aprile 2020, basandoci sui casi confermati fuori dalla provincia di Hubei che hanno lasciato Wuhan entro il 23 gennaio 2020. Poiché alcuni casi confermati non hanno informazioni sul fatto che abbiano visitato Wuhan prima, aggiustiamo il numero di casi importati dopo aver tenuto conto di questi valori mancanti. Calcoliamo poi il tasso di segnalazione a Wuhan dal 20 gennaio al 5 aprile 2020. Infine, stimiamo la data in cui il primo paziente è stato infettato.
Dati
I dati recuperati dai registri pubblicamente disponibili dalle commissioni sanitarie provinciali e municipali in Cina e dai ministeri della salute in altri paesi includono informazioni dettagliate per 10 940 casi confermati al di fuori della provincia di Hubei. Una tabella aggiuntiva nei Materiali Supplementari mostra questi siti web in modo più dettagliato . Le informazioni sui casi confermati includono regione, sesso, età, data di insorgenza dei sintomi, data di conferma, storia di viaggio o residenza a Wuhan, e data di partenza da Wuhan. Mostriamo le caratteristiche demografiche di questi pazienti nella tabella 1. Tra i 7500 pazienti con dati di genere, 3509 (46,8%) sono donne. L’età media dei pazienti è 44,48 e l’età mediana è 44. Il più giovane paziente confermato fuori dalla provincia di Hubei aveva solo 5 giorni, mentre il più vecchio ha 97 anni (vedi Tabella 1).
Nella Tabella 2 mostriamo i dati epidemiologici classificati per data di conferma. Un caso importato significa un paziente che era stato a Wuhan ed è stato rilevato al di fuori della provincia di Hubei. Un caso locale indica un caso confermato che non era stato a Wuhan. Su un totale di 10.940 casi, 6903 (63,1%) hanno queste informazioni epidemiologiche. Il numero di casi importati ha raggiunto il suo picco il 29 gennaio 2020, e la quarta colonna della tabella 2 mostra che la percentuale di casi importati diminuisce nel tempo. Questo potrebbe riflettere l’effetto delle misure di contenimento adottate nella provincia di Hubei per controllare il focolaio COVID-19 . Nel frattempo, i conteggi giornalieri dei casi locali sono più di 300 dal 2 febbraio al 7 febbraio 2020, il che indica che le infezioni tra i residenti locali dovrebbero essere una grande preoccupazione per le autorità al di fuori della provincia di Hubei.
L’ultima colonna della tabella 2 elenca il tempo medio dalla comparsa dei sintomi alla conferma per i pazienti confermati in ogni giorno. La durata mediana di tutti i casi è di 5 giorni, e la media è di 5,54 giorni. In generale, il periodo di rilevamento è diminuito nella prima settimana dopo il 20 gennaio 2020, ma è aumentato da allora. I miglioramenti nella velocità e nella capacità di rilevamento potrebbero causare il declino iniziale, e l’aumento potrebbe essere dovuto a uno screening più accurato, che porta al rilevamento di pazienti con sintomi lievi che altrimenti non andrebbero negli ospedali.
Previsioni
Il metodo proposto si basa sulle seguenti ipotesi:
- 1)
Tra il 10 gennaio e il 23 gennaio 2020, la percentuale media giornaliera di partenza da Wuhan è p.
- 2)
C’è una finestra d = d1 + d2 giorni tra l’infezione e il rilevamento, compreso un periodo di incubazione d1 giorno e un ritardo d2 giorni dalla comparsa dei sintomi al rilevamento.
- 3)
I pazienti non possono viaggiare d giorni dopo l’infezione.
- 4)
La proporzione di casi importati nei pazienti senza informazioni è la stessa della proporzione osservata in ogni giorno.
- 5)
La durata dei viaggi è abbastanza lunga che un paziente in viaggio infettato a Wuhan svilupperà i sintomi e sarà rilevato in altri luoghi piuttosto che dopo il ritorno a Wuhan.
- 6)
Tutti i viaggiatori che lasciano Wuhan, compresi i passeggeri in transito, hanno lo stesso rischio di infezione dei residenti locali.
- 7)
Il viaggio è indipendente dal rischio di esposizione a COVID-19 o dallo stato di infezione.
- 8)
I recuperi non sono considerati in questo metodo.
Le ipotesi 1-4 sono usate esplicitamente nella sezione Metodi. Sono ipotesi fondamentali per il nostro modello statistico. Altre ipotesi potrebbero anche influenzare il risultato del nostro modello, e facciamo alcune osservazioni sulle nostre ipotesi.
- a)
10 gennaio 2020 è l’inizio del nuovo anno cinese, e il 23 gennaio 2020, è la data di Wuhan lockdown. Nel totale di 10 940 casi, solo 131 (1,2%) la data di partenza da Wuhan non è in questo periodo. Essi sono esclusi dalla nostra analisi.
- b)
Se la vera proporzione media giornaliera di partenza da Wuhan è più grande del p ipotizzato, questa violazione dell’ipotesi 1 potrebbe portare alla sovrastima del numero di casi a Wuhan.
- c)
Se il tempo medio dall’infezione al rilevamento è più lungo dei giorni d ipotizzati, questa violazione dell’Assunzione 2 porterebbe a una sovrastima.
- d)
Se i viaggiatori hanno un rischio di infezione inferiore rispetto ai residenti a Wuhan, questa violazione dell’Assunzione 6 causerebbe una sottostima.
- e)
Se gli individui infetti sono meno propensi a viaggiare a causa delle condizioni di salute, questa violazione dell’ipotesi 7 causerebbe una sottostima.
Nell’Appendice supplementare A, eseguiamo l’analisi di sensibilità sull’effetto di alcune violazioni sui nostri risultati.
Notazioni
Lasciamo che il giorno t0 indichi la data di infezione del primo caso. Sia Nt il numero cumulativo di casi che dovrebbero essere confermati a Wuhan entro il giorno t. Altre notazioni del nostro modello sono definite nella Tabella 3.
I numeri Tt, It e Lt sono i dati osservati utilizzati nel nostro modello, tc, r e K sono i parametri che determinano come Nt cambia nel tempo.
Modello
Il trend di crescita della dimensione Nt della popolazione infetta è determinato dalla seguente equazione differenziale ordinaria:
dove K è la dimensione della popolazione suscettibile di COVID-19 a Wuhan, e r è una costante che controlla il tasso di crescita di Nt. Questa è la versione modificata del famoso modello SIR in epidemiologia. Nell’equazione (1), il tasso di crescita di Nt è proporzionale al prodotto di Nt e il numero K – Nt di persone che sono suscettibili ma non ancora infette. È un modello ragionevole per la trasmissione epidemica. All’inizio di questa epidemia, quando Nt è piccolo, la gente ha poca conoscenza di COVID-19, Nt cresce ad un tasso esponenziale r. Come Nt diventa più grande, vengono prese misure di contenimento per controllarlo, il tasso di crescita di Nt rallenta, risultando in una curva sigmoidale di Nt. Spiegazioni dettagliate del modello (1) sono date nell’Appendice supplementare B. Il modello (1) ha una soluzione analitica,
dove \( {f}_t=frac{1}{1+{e}^{-r\left(t-{t}_c\right)}} \), e la derivata \frac{d{N}_t}{dt} è massimizzata a t = tc, \frac{r}{2}=frac{d\log {N}_{t_c}}{dt}) è il tasso di crescita di logNt al tempo tc, K è un parametro da stimare.
Stima
Utilizziamo i dati sui casi confermati che hanno lasciato Wuhan tra il 10 gennaio e il 23 gennaio 2020, per stimare K. Sotto l’ipotesi 2, i casi infettati il giorno t saranno rilevati il giorno t + d, quindi il numero di casi infettati a Wuhan è Nt + d il giorno t. Se t0 ≤ t ≤ t0 + d, non ci dovrebbero essere casi confermati. Se t0 + d < t ≤ t0 + 2d, i casi importati il giorno t sono infettati a Wuhan il giorno t – d. Ci sono Nt casi infetti a Wuhan il giorno t – d, quindi il numero di casi importati xt il giorno t segue una distribuzione binomiale (Nt, p), dove p è la presunta probabilità media giornaliera di lasciare Wuhan tra il 10 gennaio e il 23 gennaio 2020. Se t > t0 + 2d, sotto l’ipotesi 3, Nt – d pazienti non sono in grado di viaggiare, xt ha una distribuzione binomiale (Nt – Nt – d, p). Sia Xt il numero cumulativo di casi importati nel giorno t, allora
Dalle equazioni (2) e (3), \( {X}_t\sim \mathrm{Binomial}left(K\sum \limits_{k=t-d+1}^t{f}_k,p\right) \). La stima del parametro \( \hat{K} \) è derivata massimizzando la funzione di verosimiglianza
Il limite inferiore e superiore dell’intervallo di confidenza del 95% \( \left \) sono valori tali che la funzione di distribuzione cumulativa \( F(K)={{sum}_{x=0}^{X_t}l(K) \) sia uguale a 0,975 e 0,025, rispettivamente. Il tasso di segnalazione è il numero cumulativo riportato di casi a Wuhan il giorno t diviso per il nostro numero stimato \( \hat{N_t} \). La stima della data t0 della prima infezione si ottiene risolvendo l’equazione \( {N}_{t_0}=1. \)
La determinazione del numero di casi importati xt gioca un ruolo fondamentale nella procedura di modellazione. Si noti che non tutti i casi hanno registrazioni chiare sulla storia del viaggio o della residenza a Wuhan, abbiamo bisogno di imputare i valori mancanti. Sotto l’ipotesi 4, la proporzione di casi importati nei pazienti Ut senza informazioni è uguale alla proporzione osservata \( \frac{I_k}{I_k+{L}_k} \). Pertanto,
La proporzione media giornaliera di lasciare Wuhan tra il 10 gennaio e il 23 gennaio 2020 è stimata come il rapporto tra il volume giornaliero di viaggiatori e la popolazione di Wuhan (14 milioni). Più di 5 milioni di persone sono state stimate per lasciare Wuhan a causa del Festival di Primavera e dell’epidemia. Questo numero è menzionato dal sindaco di Wuhan in una conferenza stampa. Supponiamo che questi passeggeri abbiano lasciato Wuhan tra l’inizio della corsa al Capodanno cinese il 10 gennaio 2020, e la chiusura della città di Wuhan il 23 gennaio 2020. Durante la corsa, il 34% dei passeggeri ha viaggiato per 300 km. Le grandi città al di fuori della provincia di Hubei sono generalmente più di 300 km da Wuhan. Ciò implicherebbe che, in media, la probabilità giornaliera p di viaggiare da Wuhan a luoghi al di fuori della provincia di Hubei sarebbe 5 × 0,34/14/14 = 0,009. Li et al. hanno stimato che il periodo medio di incubazione di 425 pazienti con COVID-19 era di 5,2 giorni (95% CI: 4,1-7,0). Il tempo medio dalla comparsa dei sintomi al rilevamento calcolato dai nostri dati è di 5,54 giorni, quindi abbiamo scelto d = d1 + d2 = 11 giorni. Il 29 gennaio 2020, c’è stato il conteggio massimo di casi importati. Poiché xt ha una distribuzione binomiale (Nt – Nt – d, p) con p costante, anche Nt – Nt – d raggiunge il suo massimo a t= 29 gennaio 2020. Dalla funzione logistica (2), tc è il punto medio di t e t – d, cioè \( t-\frac{d}{2}= \) 24 gennaio 2020, che è poco dopo la chiusura della città di Wuhan. Wu et al. hanno stimato il tempo di raddoppio dell’epidemia come 6,4 giorni (95% CI: 5,8-7,1) al 25 gennaio 2020 . Da questo risultato, stimiamo che \( \frac{r}{2}=\frac{d\log {N}_{t_c}}{dt}=\frac{ln 2}{6.4}=0.1 \). Usando questi valori per i parametri p, d, tc, e r, possiamo ricavare la stima di massima verosimiglianza \( \hat{K}=51\ 273, \) con 95% CI: 49 844-52 734.