Uppskattning av den dagliga utvecklingen av storleken på den COVID-19-infekterade befolkningen i Wuhan
Spridningen av COVID-19 utanför Hubei-provinsen är relativt kontrollerad med tanke på de tillräckliga medicinska resurserna. Vi använder det rapporterade antalet utanför Hubei eftersom det är en ganska exakt representation av den faktiska epidemiska situationen. I denna modellstudie uppskattar vi först epidemins storlek i Wuhan från den 10 januari till den 5 april 2020, baserat på de bekräftade fall utanför Hubei-provinsen som lämnade Wuhan senast den 23 januari 2020. Eftersom vissa bekräftade fall inte har någon information om huruvida de besökt Wuhan tidigare, justerar vi antalet importerade fall efter att ha tagit hänsyn till dessa saknade värden. Vi beräknar sedan rapporteringsgraden i Wuhan från den 20 januari till den 5 april 2020. Slutligen uppskattar vi datumet då den första patienten smittades.
Data
Data hämtade från offentligt tillgängliga register från provinsiella och kommunala hälsokommissioner i Kina och hälsovårdsministerier i andra länder innehåller detaljerad information om 10 940 bekräftade fall utanför Hubei-provinsen. En ytterligare tabell i det kompletterande materialet visar dessa webbplatser mer detaljerat . Information om bekräftade fall, inklusive region, kön, ålder, datum för symtomdebut, datum för bekräftelse, resehistoria eller vistelse i Wuhan och datum för avresa från Wuhan. Vi visar demografiska egenskaper hos dessa patienter i tabell 1. Av de 7500 patienterna med uppgifter om kön är 3509 (46,8 %) kvinnor. Patienternas medelålder är 44,48 år och medianåldern är 44 år. Den yngsta bekräftade patienten utanför Hubei-provinsen var endast 5 dagar gammal medan den äldsta är 97 år gammal (se tabell 1).
Vi visar de epidemiologiska uppgifterna kategoriserade efter datum för bekräftelse i tabell 2. Med ett importerat fall avses en patient som hade varit i Wuhan och som upptäcktes utanför Hubei-provinsen. Med ett lokalt fall avses ett bekräftat fall som inte hade varit i Wuhan. Av de totalt 10 940 fallen har 6903 (63,1 %) sådan epidemiologisk information. Antalet importerade fall nådde sin topp den 29 januari 2020, och den fjärde kolumnen i tabell 2 visar att andelen importerade fall minskar med tiden. Detta kan återspegla effekten av de begränsningsåtgärder som vidtagits i Hubei-provinsen för att kontrollera utbrottet av COVID-19 . Samtidigt är det dagliga antalet lokala fall över 300 från den 2 februari till den 7 februari 2020, vilket tyder på att infektioner bland lokalbefolkningen bör vara ett stort bekymmer för myndigheterna utanför Hubei-provinsen.
Den sista kolumnen i tabell 2 listar den genomsnittliga tiden från symtomdebut till bekräftelse för de patienter som bekräftats på varje dag. Mediantiden för alla fall är 5 dagar och medelvärdet är 5,54 dagar. Generellt sett minskade upptäcktstiden under den första veckan efter den 20 januari 2020, men ökade sedan dess. Förbättringarna av detektionshastigheten och -kapaciteten kan orsaka den inledande minskningen, och ökningen kan bero på noggrannare screening, vilket leder till att patienter med lindriga symtom som annars inte skulle ha åkt till sjukhusen upptäcks .
Antaganden
Den föreslagna metoden bygger på följande antaganden:
- 1)
Mellan den 10 januari och den 23 januari 2020 är den genomsnittliga dagliga andelen som avgår från Wuhan p.
- 2)
Det finns ett d = d1 + d2-dagars fönster mellan infektion och upptäckt, inklusive en d1-dagars inkubationsperiod och en d2-dagars fördröjning från symtomdebut till upptäckt.
- 3)
Patienterna kan inte resa d-dagar efter infektionen.
- 4)
Andelen importerade fall hos patienterna utan information är densamma som den observerade andelen varje dag.
- 5)
Resor är tillräckligt långa för att en resande patient som smittats i Wuhan ska utveckla symtom och upptäckas på andra ställen snarare än efter att ha återvänt till Wuhan.
- 6)
Alla resenärer som lämnar Wuhan, inklusive transferpassagerare, har samma infektionsrisk som lokalbefolkningen.
- 7)
Resor är oberoende av exponeringsrisken för COVID-19 eller av infektionsstatus.
- 8)
Återhämtning beaktas inte i denna metod.
Antaganden 1-4 används uttryckligen i metodavsnittet. De är grundläggande antaganden för vår statistiska modell. Andra antaganden kan också påverka resultatet av vår modell, och vi gör några anmärkningar om våra antaganden.
- a)
Den 10 januari 2020 är början på det kinesiska nyårets reseyra och den 23 januari 2020 är datumet för Wuhan-avspärrningen. I de totalt 10 940 fallen är det endast 131 (1,2 %) fall där avresedatumet från Wuhan inte ligger under denna period. De utesluts från vår analys.
- b)
Om den verkliga genomsnittliga dagliga andelen som lämnar Wuhan är större än den antagna p, kan detta brott mot antagande 1 leda till en överskattning av antalet fall i Wuhan.
- c)
Om den genomsnittliga tiden från infektion till upptäckt är längre än den antagna d-dagarna skulle detta brott mot antagande 2 leda till en överskattning.
- d)
Om resenärer har en lägre smittorisk än invånare i Wuhan skulle detta brott mot antagande 6 leda till en underskattning.
- e)
Om smittade personer är mindre benägna att resa på grund av hälsotillståndet skulle detta brott mot antagande 7 orsaka en underskattning.
I det kompletterande appendixet A utför vi känslighetsanalysen av effekten av några av överträdelserna på våra resultat.
Anmärkningar
Låt dag t0 beteckna infektionsdatumet för det allra första fallet. Låt Nt vara det kumulativa antalet fall som bör bekräftas i Wuhan senast dag t. Andra notationer för vår modell definieras i tabell 3.
Talen Tt, It och Lt är de observerade data som används i vår modell, tc, r och K är de parametrar som bestämmer hur Nt förändras över tiden.
Modell
Växttrenden för storleken Nt hos den infekterade populationen bestäms av följande ordinära differentialekvation:
där K är storleken på den befolkning som är mottaglig för COVID-19 i Wuhan, och r är en konstant som kontrollerar tillväxttakten för Nt. Detta är den modifierade versionen av den berömda SIR-modellen inom epidemiologin. I ekvation (1) är tillväxttakten för Nt proportionell mot produkten av Nt och antalet K – Nt människor som är mottagliga men ännu inte smittade. Det är en rimlig modell för epidemisk överföring. I början av denna epidemi, när Nt är liten, har människor liten kunskap om COVID-19, Nt växer med en exponentiell hastighet r. När Nt blir större och begränsningsåtgärder vidtas för att kontrollera den, avtar tillväxttakten för Nt, vilket resulterar i en sigmoidkurva för Nt. Detaljerade förklaringar av modellen (1) ges i tilläggsbilaga B. Modellen (1) har en analytisk lösning,
där \( {f}_t=\frac{1}{1+{e}^{-r\left(t-{t}_c\right)}} \), och derivatan \( \frac{d{N}_t}{dt} \) maximeras vid t = tc, \( \frac{r}{2}=\frac{d\log {N}_{t_c}}{dt} \) är tillväxttakten för logNt vid tiden tc, K är en parameter som skall uppskattas.
Skattning
Vi använder uppgifter om de bekräftade fall som lämnade Wuhan mellan den 10 januari och 23 januari 2020 för att skatta K. Enligt antagande 2 kommer fall som smittats dag t att upptäckas dag t + d, så antalet smittade fall i Wuhan är Nt + d dag t. Om t0 ≤ t ≤ t ≤ t0 + d bör det inte finnas några bekräftade fall. Om t0 + d < t ≤ t0 + 2d är de importerade fallen dag t smittade i Wuhan dag t – d. Det finns Nt smittade fall i Wuhan dag t – d, varför antalet importerade fall xt dag t följer en binomialfördelning (Nt, p), där p är den antagna genomsnittliga dagliga sannolikheten för att lämna Wuhan mellan den 10 januari och den 23 januari 2020. Om t > t0 + 2d, enligt antagande 3, Nt – d patienter inte kan resa, har xt en binomial (Nt – Nt – d, p) fördelning. Låt Xt vara det kumulativa antalet importerade fall per dag t, då
Från ekvationerna (2) och (3), \( {X}_t\sim \mathrm{Binomial}\left(K\sum \limits_{k=t-d+1}^t{f}_k,p\right) \). Parameterskattningen \( \hat{K} \) fås genom att maximera sannolikhetsfunktionen
Den nedre och övre gränsen för det 95-procentiga konfidensintervallet \( \left \) är sådana värden att den kumulativa fördelningsfunktionen \( F(K)={\sum}_{x=0}^{X_t}l(K) \) är lika med 0,975 respektive 0,025. Rapporteringsgraden är det rapporterade kumulativa antalet fall i Wuhan dag t dividerat med vårt uppskattade antal \( \hat{N_t} \). Uppskattningen av datumet t0 för den första infektionen erhålls genom att lösa ekvationen \( {N}_{t_0}=1. \)
Bestämningen av antalet importerade fall xt spelar en avgörande roll i modelleringsförfarandet. Observera att alla fall inte har tydliga uppgifter om resehistorik eller bosättning i Wuhan, vi måste imputera de saknade värdena. Under antagande 4 är andelen importerade fall i Ut-patienterna utan information densamma som den observerade andelen \( \frac{I_k}{I_k+{L}_k} \). Därför
Den genomsnittliga dagliga andelen resenärer som lämnar Wuhan mellan den 10 januari och den 23 januari 2020 beräknas vara förhållandet mellan den dagliga volymen resenärer och befolkningen i Wuhan (14 miljoner). Mer än 5 miljoner människor beräknas lämna Wuhan på grund av vårfestivalen och epidemier . Denna siffra nämndes av Wuhans borgmästare vid en presskonferens. Vi antar att dessa passagerare lämnade Wuhan mellan det kinesiska nyårets början den 10 januari 2020 och stängningen av staden Wuhan den 23 januari 2020. Under resehelvetet reste 34 % av passagerarna över 300 km. Större städer utanför Hubeiprovinsen ligger i allmänhet över 300 km från Wuhan. Detta skulle innebära att den dagliga sannolikheten p för att resa från Wuhan till platser utanför Hubeiprovinsen i genomsnitt skulle vara 5 × 0,34/14/14 = 0,009. Li et al. uppskattade att den genomsnittliga inkubationstiden för 425 patienter med COVID-19 var 5,2 dagar (95 % KI: 4,1-7,0) . Medeltiden från symtomdebut till upptäckt beräknad utifrån våra uppgifter är 5,54 dagar, så vi väljer d = d1 + d2 = 11 dagar. Den 29 januari 2020 fanns det högsta antalet importerade fall. Eftersom xt har en binomial (Nt – Nt – d, p) fördelning med konstant p, når Nt – Nt – d också sitt maximum vid t= 29 januari 2020. Enligt den logistiska funktionen (2) är tc mittpunkten mellan t och t – d, dvs. \( t-\frac{d}{2}= \) den 24 januari 2020, vilket är strax efter det att staden Wuhan spärrades av . Wu et al. uppskattade epidemins fördubblingstid till 6,4 dagar (95 % KI: 5,8-7,1) från och med den 25 januari 2020 . Utifrån detta resultat uppskattar vi att \( \frac{r}{2}=\frac{d\log {N}_{t_c}}{dt}=\frac{\ln 2}{6,4}=0,1 \). Genom att använda dessa värden för parametrarna p, d, tc och r kan vi härleda den maximala sannolikhetsuppskattningen \( \hat{K}=51\ 273, \) med 95 % CI: 49 844-52 734.