Estimarea tendinței zilnice a mărimii populației infectate cu COVID-19 în Wuhan
Dispariția COVID-19 în afara provinciei Hubei este relativ controlată, având în vedere resursele medicale adecvate. Utilizăm numărul raportat în afara Hubei, deoarece este o reprezentare destul de exactă a situației epidemice reale. În acest studiu de modelare, estimăm mai întâi dimensiunea epidemiei în Wuhan în perioada 10 ianuarie – 5 aprilie 2020, pe baza cazurilor confirmate în afara provinciei Hubei care au părăsit Wuhan până la 23 ianuarie 2020. Deoarece unele cazuri confirmate nu au informații cu privire la faptul dacă au vizitat Wuhan înainte, ajustăm numărul de cazuri importate după ce luăm în considerare aceste valori lipsă. Apoi, calculăm rata de raportare în Wuhan de la 20 ianuarie la 5 aprilie 2020. În cele din urmă, estimăm data la care a fost infectat primul pacient.
Date
Datele recuperate din înregistrările disponibile public de la comisiile de sănătate provinciale și municipale din China și de la ministerele de sănătate din alte țări includ informații detaliate pentru 10 940 de cazuri confirmate în afara provinciei Hubei. Un tabel suplimentar din materialele suplimentare prezintă aceste site-uri web mai detaliat . Informații despre cazurile confirmate, inclusiv regiunea, sexul, vârsta, data apariției simptomelor, data confirmării, istoricul călătoriilor sau al reședinței în Wuhan și data plecării din Wuhan. Afișăm caracteristicile demografice ale acestor pacienți în Tabelul 1. Dintre cei 7500 de pacienți cu date privind sexul, 3509 (46,8%) sunt de sex feminin. Vârsta medie a pacienților este de 44,48 ani, iar vârsta mediană este de 44 de ani. Cel mai tânăr pacient confirmat în afara provinciei Hubei avea doar 5 zile, în timp ce cel mai în vârstă are 97 de ani (a se vedea tabelul 1).
În tabelul 2 afișăm datele epidemiologice clasificate în funcție de data confirmării. Un caz importat înseamnă un pacient care a fost în Wuhan și a fost detectat în afara provinciei Hubei. Un caz local înseamnă un caz confirmat care nu fusese în Wuhan. Din totalul de 10 940 de cazuri, 6903 (63,1%) au astfel de informații epidemiologice. Numărul de cazuri importate a atins vârful la 29 ianuarie 2020, iar cea de-a patra coloană din tabelul 2 arată că proporția cazurilor importate scade în timp. Acest lucru ar putea reflecta efectul măsurilor de izolare luate în provincia Hubei pentru a controla focarul COVID-19 . Între timp, numărul zilnic de cazuri locale este de peste 300 între 2 februarie și 7 februarie 2020, ceea ce indică faptul că infecțiile în rândul rezidenților locali ar trebui să fie o preocupare majoră pentru autoritățile din afara provinciei Hubei.
Ultima coloană a tabelului 2 enumeră timpul mediu de la debutul simptomelor până la confirmare pentru pacienții confirmați în fiecare zi. Durata mediană a tuturor cazurilor este de 5 zile, iar media este de 5,54 zile. În general, perioada de detectare a scăzut în prima săptămână după 20 ianuarie 2020, dar a crescut de atunci. Îmbunătățirile în ceea ce privește viteza și capacitatea de detectare ar putea cauza declinul inițial, iar creșterea se poate datora unei depistări mai amănunțite, ceea ce duce la detectarea pacienților cu simptome ușoare care altfel nu s-ar fi dus la spitale .
Ipoteze
Metoda propusă se bazează pe următoarele ipoteze:
- 1)
Între 10 ianuarie și 23 ianuarie 2020, proporția medie zilnică de plecări din Wuhan este p.
- 2)
Există o fereastră d = d1 + d2 zile între infectare și detectare, inclusiv o perioadă de incubație de d1 zile și o întârziere de d2 zile de la apariția simptomelor până la detectare.
- 3)
Pacienții nu pot călători la d zile după infectare.
- 4)
Proporția de cazuri importate în rândul pacienților fără informații este aceeași cu proporția observată în fiecare zi.
- 5)
Duratele călătoriilor sunt suficient de lungi pentru ca un pacient care călătorește, infectat în Wuhan, să dezvolte simptome și să fie detectat în alte locuri, mai degrabă decât după ce se întoarce în Wuhan.
- 6)
Toți călătorii care părăsesc Wuhan, inclusiv pasagerii de transfer, au același risc de infectare ca și rezidenții locali.
- 7)
Călătoriile sunt independente de riscul de expunere la COVID-19 sau de starea de infectare.
- 8)
Recuperările nu sunt luate în considerare în această metodă.
Ipotezele 1-4 sunt utilizate în mod explicit în secțiunea Metode. Acestea sunt ipoteze fundamentale pentru modelul nostru statistic. Alte ipoteze ar putea afecta, de asemenea, rezultatul modelului nostru și facem câteva observații cu privire la ipotezele noastre.
- a)
10 ianuarie 2020 este începutul grabei de călătorie de Anul Nou chinezesc, iar 23 ianuarie 2020, este data închiderii Wuhan . Din totalul de 10 940 de cazuri, doar 131 (1,2%) de cazuri data plecării din Wuhan nu se află în această perioadă. Acestea sunt excluse din analiza noastră.
- b)
În cazul în care proporția zilnică medie reală de plecare din Wuhan este mai mare decât p presupus, această încălcare a ipotezei 1 ar putea duce la supraestimarea numărului de cazuri din Wuhan.
- c)
Dacă timpul mediu de la infectare până la depistare este mai mare decât cele d zile presupuse, această încălcare a ipotezei 2 ar putea duce la o supraestimare.
- d)
Dacă călătorii au un risc de infectare mai mic decât rezidenții din Wuhan, această încălcare a ipotezei 6 ar duce la o subestimare.
- e)
Dacă este mai puțin probabil ca persoanele infectate să călătorească din cauza condițiilor de sănătate, această încălcare a ipotezei 7 ar cauza o subestimare.
În Anexa suplimentară A, efectuăm analiza de sensibilitate cu privire la efectul unora dintre încălcări asupra rezultatelor noastre.
Notații
Să desemnăm ziua t0 ca fiind data infectării pentru chiar primul caz. Fie Nt numărul cumulat de cazuri care ar trebui să fie confirmate în Wuhan până în Ziua t. Alte notații ale modelului nostru sunt definite în Tabelul 3.
Numerele Tt, It și Lt sunt datele observate utilizate în modelul nostru, tc, r și K sunt parametrii care determină modul în care Nt se modifică în timp.
Model
Tendința de creștere a mărimii Nt a populației infectate este determinată de următoarea ecuație diferențială ordinară:
unde K este mărimea populației care este susceptibilă la COVID-19 în Wuhan, iar r este o constantă care controlează rata de creștere a Nt. Aceasta este versiunea modificată a celebrului model SIR din epidemiologie. În ecuația (1), rata de creștere a Nt este proporțională cu produsul dintre Nt și numărul K – Nt de persoane susceptibile, dar care nu sunt încă infectate. Acesta este un model rezonabil pentru transmiterea epidemică. La începutul acestei epidemii, când Nt este mic, oamenii au puține cunoștințe despre COVID-19, Nt crește cu o rată exponențială r. Pe măsură ce Nt devine mai mare, se iau măsuri de izolare pentru a o controla, rata de creștere a lui Nt încetinește, rezultând o curbă sigmoidă a lui Nt. Explicații detaliate ale modelului (1) sunt prezentate în apendicele suplimentar B. Modelul (1) are o soluție analitică,
unde \( {f}_t=\frac{1}{1+{e}^{-r\left(t-{t}_c\right)}} \), iar derivata \( \frac{d{N}_t}{dt} \) este maximizată la t = tc, \( \frac{r}{2}=\frac{d\log {N}_{t_c}}}{dt} \) este rata de creștere a logNt la momentul tc, K este un parametru care trebuie estimat.
Stimare
Pentru estimarea lui K folosim date privind cazurile confirmate care au părăsit Wuhan între 10 ianuarie și 23 ianuarie 2020. Conform ipotezei 2, cazurile infectate în ziua t vor fi detectate în ziua t + d, astfel încât numărul de cazuri infectate în Wuhan este Nt + d în ziua t. Dacă t0 ≤ t ≤ t0 + d, nu ar trebui să existe niciun caz confirmat. Dacă t0 + d < t ≤ t0 + 2d, cazurile importate în Ziua t sunt infectate în Wuhan în Ziua t – d. Există Nt cazuri infectate în Wuhan în Ziua t – d, prin urmare, numărul de cazuri importate xt în Ziua t urmează o distribuție binomială (Nt, p), unde p este probabilitatea medie zilnică presupusă de a părăsi Wuhan între 10 ianuarie și 23 ianuarie 2020. În cazul în care t > t0 + 2d, conform ipotezei 3, Nt – d pacienți nu sunt capabili să călătorească, xt are o distribuție binomială (Nt – Nt – d, p). Fie Xt numărul cumulat de cazuri importate până în ziua t, atunci
Din ecuațiile (2) și (3), \( {X}_t\sim \mathrm{Binomial}\left(K\sum \sum \limits_{k=t-d+1}^t{f}_k,p\right) \). Estimarea parametrului \( \hat{K} \) se obține prin maximizarea funcției de verosimilitate
Limita inferioară și superioară a intervalului de încredere de 95% \( \left \) sunt valori astfel încât funcția de distribuție cumulativă \( F(K)={\sum}_{x=0}^{X_t}l(K) \) să fie egală cu 0,975 și, respectiv, 0,025. Rata de raportare este numărul cumulativ de cazuri raportate în Wuhan în ziua t împărțit la numărul estimat de noi \( \hat{N_t} \). Estimarea datei t0 a primei infecții se obține prin rezolvarea ecuației \( {N}_{t_0}=1. \)
Determinarea numărului de cazuri importate xt joacă un rol crucial în procedura de modelare. Rețineți că nu toate cazurile au înregistrări clare privind istoricul călătoriilor sau al reședinței în Wuhan, trebuie să imputăm valorile lipsă. Conform ipotezei 4, proporția de cazuri importate în rândul pacienților Ut fără informații este aceeași cu proporția observată \( \frac{I_k}{I_k+{L}_k} \). Prin urmare,
Procentul mediu zilnic de plecare din Wuhan între 10 ianuarie și 23 ianuarie 2020 este estimat ca fiind raportul dintre volumul zilnic de călători și populația orașului Wuhan (14 milioane). S-a estimat că mai mult de 5 milioane de persoane vor părăsi Wuhan din cauza Festivalului Primăverii și a epidemiei . Această cifră este menționată de primarul din Wuhan într-o conferință de presă. Presupunem că acești pasageri au părăsit Wuhan între începutul aglomerației de călătorie de Anul Nou chinezesc, la 10 ianuarie 2020, și închiderea orașului Wuhan la 23 ianuarie 2020. În timpul afluxului de călătorii, 34% dintre pasageri au călătorit peste 300 km . Marile orașe din afara provinciei Hubei se află, în general, la peste 300 km de Wuhan. Acest lucru ar însemna că, în medie, probabilitatea zilnică p de a călători din Wuhan în locuri din afara provinciei Hubei ar fi de 5 × 0,34/14/14 = 0,009. Li et al. au estimat că perioada medie de incubație a 425 de pacienți cu COVID-19 a fost de 5,2 zile (IC 95%: 4,1-7,0) . Timpul mediu de la debutul simptomelor până la depistare, calculat pe baza datelor noastre, este de 5,54 zile, astfel încât am ales d = d1 + d2 = 11 zile. La 29 ianuarie 2020, a existat numărul maxim de cazuri importate. Deoarece xt are o distribuție binomială (Nt – Nt – d, p) cu p constant, Nt – Nt – d atinge, de asemenea, maximul la t= 29 ianuarie 2020. Din funcția logistică (2), tc este punctul median dintre t și t – d, adică \( t-\frac{d}{2}= \) 24 ianuarie 2020, care este la scurt timp după închiderea orașului Wuhan . Wu et al. au estimat timpul de dublare a epidemiei la 6,4 zile (IC 95%: 5,8-7,1) începând cu 25 ianuarie 2020 . Pornind de la acest rezultat, estimăm că \( \frac{r}{2}=\frac{d\log {N}_{t_c}}{dt}=\frac{\ln 2}{6,4}=0,1 \). Folosind aceste valori pentru parametrii p, d, tc și r, putem obține estimarea de maximă verosimilitate \( \hat{K}=51\ 273, \) cu IC 95%: 49 844-52 734.
.