Estimating the daily trend in the size of the COVID-19 infected population in Wuhan
De verspreiding van COVID-19 buiten de provincie Hubei is relatief gecontroleerd gezien de adequate medische middelen. We gebruiken het gerapporteerde aantal buiten Hubei omdat het een vrij nauwkeurige weergave is van de werkelijke epidemische situatie. In deze modelstudie schatten we eerst de omvang van de epidemie in Wuhan van 10 januari tot 5 april 2020, op basis van de bevestigde gevallen buiten de provincie Hubei die Wuhan op 23 januari 2020 hadden verlaten. Aangezien sommige bevestigde gevallen geen informatie hebben over de vraag of zij Wuhan eerder hebben bezocht, passen wij het aantal ingevoerde gevallen aan door rekening te houden met deze ontbrekende waarden. Vervolgens berekenen we de meldingsfrequentie in Wuhan van 20 januari tot 5 april 2020. Ten slotte schatten we de datum waarop de eerste patiënt werd besmet.
Data
Data opgehaald uit openbaar beschikbare records van provinciale en gemeentelijke gezondheidscommissies in China en ministeries van volksgezondheid in andere landen bevatten gedetailleerde informatie voor 10 940 bevestigde gevallen buiten de provincie Hubei. Een extra tabel in het aanvullend materiaal geeft deze websites in meer detail weer. Informatie over bevestigde gevallen, waaronder regio, geslacht, leeftijd, datum van het begin van de symptomen, datum van bevestiging, geschiedenis van reizen of verblijf in Wuhan, en datum van vertrek uit Wuhan. De demografische kenmerken van deze patiënten worden weergegeven in tabel 1. Van de 7500 patiënten met geslachtsgegevens zijn er 3509 (46,8%) vrouw. De gemiddelde leeftijd van de patiënten is 44,48 jaar en de mediane leeftijd is 44 jaar. De jongste bevestigde patiënt buiten de provincie Hubei was slechts 5 dagen oud, terwijl de oudste 97 jaar oud is (zie tabel 1).
We geven de epidemiologische gegevens gecategoriseerd naar de datum van bevestiging weer in tabel 2. Een geïmporteerd geval is een patiënt die in Wuhan was geweest en buiten de provincie Hubei werd ontdekt. Een lokaal geval is een bevestigd geval dat niet in Wuhan is geweest. Van de in totaal 10 940 gevallen beschikten 6903 (63,1%) over dergelijke epidemiologische informatie. Het aantal ingevoerde gevallen bereikte zijn piek op 29 januari 2020, en uit de vierde kolom van tabel 2 blijkt dat het aandeel ingevoerde gevallen in de loop van de tijd afneemt. Dit zou het effect kunnen weerspiegelen van de beheersingsmaatregelen die in de provincie Hubei zijn genomen om de COVID-19-uitbraak onder controle te krijgen. Ondertussen bedraagt het dagelijkse aantal lokale gevallen meer dan 300 van 2 februari tot 7 februari 2020, wat aangeeft dat infecties onder lokale inwoners een grote zorg moeten zijn voor de autoriteiten buiten de provincie Hubei.
De laatste kolom van tabel 2 vermeldt de gemiddelde tijd vanaf het begin van de symptomen tot de bevestiging voor patiënten die op elke dag zijn bevestigd. De mediane duur van alle gevallen is 5 dagen, en het gemiddelde is 5,54 dagen. In het algemeen is de opsporingstijd in de eerste week na 20 januari 2020 afgenomen, maar sindsdien toegenomen. De verbeteringen in detectiesnelheid en -capaciteit kunnen de aanvankelijke daling veroorzaken, en de stijging kan te wijten zijn aan grondiger screening, wat leidt tot de detectie van patiënten met milde symptomen die anders niet naar de ziekenhuizen zouden gaan.
Aannames
De voorgestelde methode berust op de volgende aannames:
- 1)
Tussen 10 januari en 23 januari 2020 is het gemiddelde dagelijkse aandeel van het vertrek uit Wuhan p.
- 2)
Er is een venster van d = d1 + d2 dagen tussen besmetting en ontdekking, met inbegrip van een incubatieperiode van d1 dagen en een vertraging van d2 dagen tussen het begin van de symptomen en de ontdekking.
- 3)
Patiënten zijn niet in staat om te reizen d dagen na besmetting.
- 4)
Het aandeel van de ingevoerde gevallen bij de patiënten zonder informatie is gelijk aan het waargenomen aandeel op elke dag.
- 5)
De reisduur is lang genoeg dat een reizende patiënt die in Wuhan besmet is, eerder symptomen zal ontwikkelen en op andere plaatsen zal worden opgespoord dan na terugkeer in Wuhan.
- 6)
Alle reizigers die Wuhan verlaten, inclusief transferpassagiers, hebben hetzelfde risico op infectie als plaatselijke bewoners.
- 7)
Reizen is onafhankelijk van het blootstellingsrisico aan COVID-19 of van de infectiestatus.
- 8)
Herhalingen worden in deze methode buiten beschouwing gelaten.
Aannames 1-4 worden expliciet gebruikt in het gedeelte over de methoden. Het zijn fundamentele veronderstellingen voor ons statistisch model. Andere veronderstellingen kunnen ook van invloed zijn op het resultaat van ons model, en we maken enkele opmerkingen over onze veronderstellingen.
- a)
10 januari 2020 is het begin van de Chinese nieuwjaarsdrukte, en 23 januari 2020, is de datum van de vergrendeling van Wuhan. Van de in totaal 10 940 gevallen valt slechts 131 (1,2%) niet in deze periode. Zij zijn van onze analyse uitgesloten.
- b)
Als het werkelijke gemiddelde dagelijkse aandeel van het verlaten van Wuhan groter is dan de veronderstelde p, kan deze schending van veronderstelling 1 leiden tot overschatting van het aantal gevallen in Wuhan.
- c)
Als de gemiddelde tijd tussen besmetting en ontdekking langer is dan de veronderstelde d dagen, zou deze schending van veronderstelling 2 tot een overschatting leiden.
- d)
Als reizigers een lager infectierisico hebben dan inwoners van Wuhan, zou deze schending van veronderstelling 6 tot een onderschatting leiden.
- e)
Als besmette personen door de gezondheidsomstandigheden minder geneigd zijn te reizen, zou deze schending van veronderstelling 7 tot een onderschatting leiden.
In de aanvullende bijlage A voeren wij een gevoeligheidsanalyse uit van het effect van een aantal schendingen op onze resultaten.
Notaties
Laat Dag t0 de datum van besmetting voor het allereerste geval zijn. Laat Nt het cumulatieve aantal gevallen zijn dat tegen dag t in Wuhan moet zijn bevestigd. Andere notaties van ons model zijn gedefinieerd in tabel 3.
De getallen Tt, It en Lt zijn de waargenomen gegevens die in ons model worden gebruikt, tc, r en K zijn de parameters die bepalen hoe Nt in de loop van de tijd verandert.
Model
De groeitrend van de grootte Nt van de besmette populatie wordt bepaald door de volgende gewone differentiaalvergelijking:
waarin K de grootte is van de populatie die vatbaar is voor COVID-19 in Wuhan, en r een constante is die de groeisnelheid van Nt regelt. Dit is de gewijzigde versie van het beroemde SIR-model in de epidemiologie. In vergelijking (1) is de groeisnelheid van Nt evenredig met het product van Nt en het aantal K – Nt van mensen die vatbaar zijn maar nog niet besmet. Het is een redelijk model voor de overdracht van een epidemie. In het begin van de epidemie, wanneer Nt klein is, hebben de mensen weinig kennis van COVID-19, Nt groeit met een exponentiële snelheid r. Naarmate Nt groter wordt, worden inperkingsmaatregelen genomen om de epidemie onder controle te krijgen, de groeisnelheid van Nt vertraagt, wat resulteert in een sigmoïde curve van Nt. Gedetailleerde uitleg van het model (1) wordt gegeven in het aanvullend aanhangsel B. Het model (1) heeft een analytische oplossing,
waarin \( {f}_t=\frac{1}{1+{e}^{-r}^left(t-{t}_c\rechts)}} \), en de afgeleide \( \frac{d{N}_t}{dt} \) is gemaximaliseerd op t = tc, \( \frac{r}{2}=\frac{d\log {N}_{t_c}{dt} \) is de groeisnelheid van logNt op tijdstip tc, K is een parameter die moet worden geschat.
Raming
We gebruiken gegevens over de bevestigde gevallen die Wuhan tussen 10 januari en 23 januari 2020 hebben verlaten, om K te schatten. Onder aanname 2 zullen op dag t besmette gevallen op dag t + d worden opgespoord, zodat het aantal besmette gevallen in Wuhan Nt + d is op dag t. Als t0 ≤ t ≤ t0 + d, mogen er geen bevestigde gevallen zijn. Als t0 + d < t ≤ t0 + 2d, zijn de op Dag t ingevoerde gevallen in Wuhan besmet op Dag t – d. Er zijn Nt besmette gevallen in Wuhan op Dag t – d, zodat het aantal ingevoerde gevallen xt op Dag t een binomiale (Nt, p) verdeling volgt, waarbij p de veronderstelde gemiddelde dagelijkse waarschijnlijkheid is dat Wuhan tussen 10 januari en 23 januari 2020 wordt verlaten. Als t > t0 + 2d, onder aanname 3, Nt – d patiënten niet kunnen reizen, heeft xt een binomiale (Nt – Nt – d, p) verdeling. $$
Uit vergelijkingen (2) en (3) volgt \( {X}_t\sim \mathrm{Binomiaal} links(K\sum \limits_{k=t-d+1}^t{f}_k,p\rechts) \). De parameterschatting ( \hat{K} \) wordt afgeleid door de likelihoodfunctie
De onder- en bovengrens van het 95%-betrouwbaarheidsinterval \( \left \) zijn waarden zodanig dat de cumulatieve verdelingsfunctie \( F(K)={\sum}_{x=0}^{X_t}l(K) \) gelijk is aan respectievelijk 0,975 en 0,025. De meldingsfrequentie is het gerapporteerde cumulatieve aantal gevallen in Wuhan op dag t gedeeld door ons geschatte aantal {N_t} }. De schatting van de datum t0 van eerste besmetting wordt verkregen door de vergelijking \( {N}_{t_0}=1. \)
Het bepalen van het aantal ingevoerde gevallen xt speelt een cruciale rol in de modelleerprocedure. Niet alle gevallen hebben duidelijke gegevens over de reis- of verblijfsgeschiedenis in Wuhan; we moeten de ontbrekende waarden toerekenen. Onder veronderstelling 4 is het aandeel van de geïmporteerde gevallen in de Ut patiënten zonder informatie hetzelfde als het waargenomen aandeel xt( \frac{I_k}{I_k+{L}_k} xt). Daarom is
Het gemiddelde dagelijkse aandeel van het vertrek uit Wuhan tussen 10 januari en 23 januari 2020 wordt geschat op de verhouding van het dagelijkse volume van reizigers tot de bevolking van Wuhan (14 miljoen). Naar schatting zullen meer dan 5 miljoen mensen Wuhan verlaten wegens het Lentefeest en een epidemie . Dit aantal is genoemd door de burgemeester van Wuhan in een persconferentie. Wij gaan ervan uit dat deze passagiers Wuhan hebben verlaten tussen het begin van de reisdrukte tijdens het Chinese Nieuwjaar op 10 januari 2020 en de afsluiting van de stad Wuhan op 23 januari 2020. Tijdens de reisdrukte reisde 34% van de passagiers over een afstand van 300 km. Grote steden buiten de provincie Hubei liggen doorgaans op meer dan 300 km van Wuhan. Dit zou betekenen dat de dagelijkse waarschijnlijkheid p om van Wuhan naar plaatsen buiten de provincie Hubei te reizen gemiddeld 5 × 0,34/14/14 = 0,009 zou zijn. Li et al. schatten dat de gemiddelde incubatietijd van 425 patiënten met COVID-19 5,2 dagen bedroeg (95% CI: 4,1-7,0) . De gemiddelde tijd vanaf het begin van de symptomen tot de ontdekking, berekend op basis van onze gegevens, is 5,54 dagen, dus kiezen we d = d1 + d2 = 11 dagen. Op 29 januari 2020 was er het maximumaantal ingevoerde gevallen. Aangezien xt een binomiale (Nt – Nt – d, p) verdeling met constante p heeft, bereikt Nt – Nt – d ook zijn maximum op t= 29 januari 2020. Uit de logistische functie (2) volgt dat tc het midden is van t en t – d, dus 24 januari 2020, kort na de vergrendeling van de stad Wuhan. Wu et al. schatten de verdubbelingstijd van de epidemie op 6,4 dagen (95% CI: 5,8-7,1) vanaf 25 januari 2020. Op basis van dit resultaat schatten wij dat \( \frac{r}{2}=\frac{d\log {N}_{t_c}}{dt}=\frac{\ln 2}{6.4}=0.1 \). Met deze waarden voor parameters p, d, tc, en r, kunnen we de maximale waarschijnlijkheidsschatting \( \hat{K}=51 273, \) afleiden met 95% CI: 49 844-52 734.