Odhad denního trendu velikosti populace nakažené COVID-19 ve Wuhanu
Šíření COVID-19 mimo provincii Hubei je vzhledem k dostatečným zdravotnickým zdrojům relativně kontrolované. Používáme hlášený počet mimo Hubei, protože poměrně přesně odráží skutečnou epidemickou situaci. V této modelové studii nejprve odhadujeme velikost epidemie ve Wuhanu od 10. ledna do 5. dubna 2020 na základě potvrzených případů mimo provincii Hubei, které opustily Wuhan do 23. ledna 2020. Vzhledem k tomu, že u některých potvrzených případů nemáme informace o tom, zda Wuhan navštívily již dříve, upravujeme počet importovaných případů po zohlednění těchto chybějících hodnot. Poté vypočítáme míru hlášení ve Wuhanu od 20. ledna do 5. dubna 2020. Nakonec odhadujeme datum, kdy se nakazil první pacient.
Data
Data získaná z veřejně dostupných záznamů z provinčních a městských zdravotních komisí v Číně a ministerstev zdravotnictví v jiných zemích zahrnují podrobné informace o 10 940 potvrzených případech mimo provincii Hubei. V doplňkové tabulce v doplňkových materiálech jsou tyto webové stránky uvedeny podrobněji . Informace o potvrzených případech včetně regionu, pohlaví, věku, data nástupu příznaků, data potvrzení, historie cestování nebo pobytu ve Wuhanu a data odjezdu z Wuhanu. Demografické charakteristiky těchto pacientů zobrazujeme v tabulce 1. Mezi 7500 pacienty s údaji o pohlaví je 3509 (46,8 %) žen. Průměrný věk pacientů je 44,48 let a medián věku je 44 let. Nejmladšímu potvrzenému pacientovi mimo provincii Hubei bylo pouhých 5 dní, zatímco nejstaršímu je 97 let (viz Tabulka 1).
Epidemiologické údaje rozdělené podle data potvrzení zobrazujeme v Tabulce 2. Importovaným případem se rozumí pacient, který byl ve Wuhanu a byl zjištěn mimo provincii Hubei. Místní případ znamená potvrzený případ, který nebyl ve Wuhanu. Z celkového počtu 10 940 případů má 6903 (63,1 %) tyto epidemiologické údaje. Počet importovaných případů dosáhl maxima 29. ledna 2020 a čtvrtý sloupec tabulky 2 ukazuje, že podíl importovaných případů v čase klesá. To může odrážet účinek omezovacích opatření přijatých v provincii Hubei ke kontrole ohniska COVID-19 . Mezitím jsou denní počty místních případů od 2. února do 7. února 2020 vyšší než 300, což naznačuje, že infekce mezi místními obyvateli by měly být pro úřady mimo provincii Hubei hlavním důvodem k obavám.
V posledním sloupci tabulky 2 je uvedena průměrná doba od vzniku příznaků do potvrzení u pacientů potvrzených v jednotlivých dnech. Medián doby trvání všech případů je 5 dní a průměr je 5,54 dne. Obecně se doba zjištění snížila v prvním týdnu po 20. lednu 2020, ale od té doby se prodloužila. Zlepšení rychlosti a kapacity detekce může být příčinou počátečního poklesu a nárůst může být způsoben důkladnějším screeningem, který vede k odhalení pacientů s mírnými příznaky, kteří by jinak do nemocnic nešli .
Předpoklady
Navržená metoda vychází z následujících předpokladů:
- 1)
Mezi 10. lednem a 23. lednem 2020 je průměrný denní podíl odjíždějících z Wuhanu str.
- 2)
Mezi nakažením a zjištěním infekce existuje d = d1 + d2denní okno, které zahrnuje d1denní inkubační dobu a d2denní prodlevu od nástupu příznaků do jejich zjištění.
- 3)
Pacienti nejsou schopni cestovat d dní po nakažení.
- 4)
Podíl importovaných případů u pacientů bez informací je stejný jako pozorovaný podíl v jednotlivých dnech.
- 5)
Délka cestování je dostatečně dlouhá na to, aby se u cestujícího pacienta nakaženého ve Wuhanu objevily příznaky a byl zjištěn spíše na jiných místech než po návratu do Wuhanu.
- 6)
Všichni cestující opouštějící Wuhan, včetně přestupujících cestujících, mají stejné riziko nákazy jako místní obyvatelé.
- 7)
Cestování je nezávislé na riziku expozice COVID-19 nebo na stavu nákazy.
- 8)
Vyšetření se v této metodě neuvažuje.
Předpoklady 1-4 jsou explicitně použity v části Metody. Jsou to základní předpoklady pro náš statistický model. Výsledek našeho modelu mohou ovlivnit i další předpoklady, proto uvádíme několik poznámek k našim předpokladům.
- a)
10. leden 2020 je začátkem cestovní horečky čínského nového roku a 23. leden 2020, je datem výluky Wuhanu . Z celkového počtu 10 940 případů pouze 131 (1,2 %) případů datum odjezdu z Wuhanu nespadá do tohoto období. Ty jsme z naší analýzy vyloučili.
- b)
Pokud je skutečný průměrný denní podíl odjezdů z Wuhanu větší než předpokládané p, mohlo by toto porušení předpokladu 1 vést k nadhodnocení počtu případů ve Wuhanu.
- c)
Pokud je průměrná doba od nákazy do jejího zjištění delší než předpokládané d dní, vedlo by toto porušení předpokladu 2 k nadhodnocení
- d)
Pokud je u cestovatelů riziko nákazy nižší než u obyvatel Wuhanu, vedlo by toto porušení předpokladu 6 k podhodnocení.
- e)
Pokud by nakažení jedinci kvůli zdravotnímu stavu méně cestovali, způsobilo by toto porušení předpokladu 7 podhodnocení.
V Doplňkové příloze A provádíme analýzu citlivosti vlivu některých porušení na naše výsledky.
Poznámky
Nechť den t0 označuje datum nákazy pro úplně první případ. Nechť Nt je kumulativní počet případů, které by měly být potvrzeny ve Wuhanu do dne t. Další notace našeho modelu jsou definovány v tabulce 3.
Čísla Tt, It a Lt jsou pozorované údaje použité v našem modelu, tc, r a K jsou parametry, které určují, jak se Nt mění v čase.
Model
Tendence růstu velikosti Nt infikované populace je určena následující obyčejnou diferenciální rovnicí:
kde K je velikost populace vnímavé k COVID-19 ve Wuhanu a r je konstanta, která řídí rychlost růstu Nt. Jedná se o upravenou verzi známého modelu SIR v epidemiologii. V rovnici (1) je rychlost růstu Nt úměrná součinu Nt a počtu K – Nt osob, které jsou vnímavé, ale ještě nejsou nakažené. Jedná se o rozumný model pro přenos epidemie. Na začátku této epidemie, kdy je Nt malé, lidé mají málo znalostí o COVID-19, roste Nt exponenciální rychlostí r. Jak se Nt zvětšuje, jsou přijímána omezující opatření k jeho kontrole, rychlost růstu Nt se zpomaluje, což vede k sigmoidní křivce Nt. Podrobné vysvětlení modelu (1) je uvedeno v doplňkové příloze B. Model (1) má analytické řešení,
kde \( {f}_t=\frac{1}{1+{e}^{-r\left(t-{t}_c\right)}} \) a derivace \( \frac{d{N}_t}{dt} \) je maximalizována při t = tc, \( \frac{r}{2}=\frac{d\log {N}_{t_c}}{dt} \) je míra růstu logNt v čase tc, K je parametr, který je třeba odhadnout.
Odhad
K odhadu K použijeme údaje o potvrzených případech, které opustily Wuhan v období od 10. ledna do 23. ledna 2020. Podle předpokladu 2 budou případy nakažené v den t zjištěny v den t + d, takže počet nakažených případů ve Wuhanu je Nt + d v den t. Pokud t0 ≤ t ≤ t0 + d, neměly by se vyskytnout žádné potvrzené případy. Pokud t0 + d < t ≤ t0 + 2d, jsou importované případy v den t infikovány ve Wuhanu v den t – d. Ve Wuhanu je v den t – d Nt infikovaných případů, proto se počet importovaných případů xt v den t řídí binomickým rozdělením (Nt, p), kde p je předpokládaná průměrná denní pravděpodobnost opuštění Wuhanu v období od 10. ledna do 23. ledna 2020. Pokud t > t0 + 2d, podle předpokladu 3 Nt – d pacientů nemůže vycestovat, xt má binomické rozdělení (Nt – Nt – d, p). Nechť Xt je kumulativní počet importovaných případů ke dni t, pak
Z rovnic (2) a (3), \( {X}_t\sim \mathrm{Binomial}\left(K\sum \limits_{k=t-d+1}^t{f}_k,p\right) \). Odhad parametru \( \hat{K} \) se získá maximalizací pravděpodobnostní funkce
Dolní a horní hranice 95% intervalu spolehlivosti \( \left \) jsou takové hodnoty, že kumulativní distribuční funkce \( F(K)={\sum}_{x=0}^{X_t}l(K) \) se rovná 0,975 a 0,025. Míra hlášení je hlášený kumulativní počet případů ve Wuhanu v den t dělený námi odhadovaným počtem \( \hat{N_t} \). Odhad data t0 první infekce se získá řešením rovnice \( {N}_{t_0}=1. \)
Určení počtu importovaných případů xt hraje v modelovém postupu klíčovou roli. Všimněte si, že ne všechny případy mají jasné záznamy o historii cestování nebo pobytu ve Wuhanu, chybějící hodnoty musíme imputovat. Podle předpokladu 4 je podíl importovaných případů v Ut pacientů bez informací stejný jako pozorovaný podíl \( \frac{I_k}{I_k+{L}_k} \). Proto,
Průměrný denní podíl vyjíždějících z Wuhanu v období od 10. ledna do 23. ledna 2020 se odhaduje jako poměr denního objemu cestujících k počtu obyvatel Wuhanu (14 milionů). Odhaduje se, že více než 5 milionů lidí opustí Wuhan kvůli jarnímu festivalu a epidemii . Toto číslo uvedl starosta Wuhanu na tiskové konferenci. Předpokládáme, že tito cestující opustili Wuhan mezi začátkem cestovní horečky na čínský nový rok 10. ledna 2020 a uzavřením města Wuhan 23. ledna 2020. Během cestovní špičky cestovalo 34 % cestujících přes 300 km . Velká města mimo provincii Hubei jsou od Wuhanu zpravidla vzdálena více než 300 km. To by znamenalo, že průměrná denní pravděpodobnost p cestování z Wuhanu do míst mimo provincii Hubei by byla 5 × 0,34/14/14 = 0,009. Li et al. odhadli, že průměrná inkubační doba 425 pacientů s COVID-19 byla 5,2 dne (95% CI: 4,1-7,0) . Průměrná doba od vzniku příznaků do jejich zjištění vypočtená z našich údajů je 5,54 dne, proto jsme zvolili d = d1 + d2 = 11 dní. Dne 29. ledna 2020 byl zaznamenán maximální počet importovaných případů. Protože xt má binomické rozdělení (Nt – Nt – d, p) s konstantním p, Nt – Nt – d dosáhne svého maxima také v t = 29. ledna 2020. Z logistické funkce (2) vyplývá, že tc je střed t a t – d, tedy \( t-\frac{d}{2}= \) 24. ledna 2020, což je krátce po uzavření města Wuhan. Wu et al. odhadli dobu zdvojnásobení epidemie na 6,4 dne (95% CI: 5,8-7,1) k 25. lednu 2020 . Z tohoto výsledku odhadujeme, že \( \frac{r}{2}=\frac{d\log {N}_{t_c}}{dt}=\frac{\ln 2}{6,4}=0,1 \). Pomocí těchto hodnot parametrů p, d, tc a r můžeme odvodit odhad maximální pravděpodobnosti \( \hat{K}=51\ 273, \) s 95% CI: 49 844-52 734.
.