Articles

Schätzung des täglichen Trends in der Größe der mit COVID-19 infizierten Bevölkerung in Wuhan

Die Ausbreitung von COVID-19 außerhalb der Provinz Hubei ist angesichts der angemessenen medizinischen Ressourcen relativ kontrolliert. Wir verwenden die gemeldete Zahl außerhalb von Hubei, da sie die tatsächliche epidemische Situation ziemlich genau wiedergibt. In dieser Modellierungsstudie schätzen wir zunächst das Ausmaß der Epidemie in Wuhan vom 10. Januar bis zum 5. April 2020 auf der Grundlage der bestätigten Fälle außerhalb der Provinz Hubei, die Wuhan bis zum 23. Januar 2020 verlassen haben. Da bei einigen bestätigten Fällen keine Informationen darüber vorliegen, ob sie Wuhan zuvor besucht haben, passen wir die Zahl der importierten Fälle unter Berücksichtigung dieser fehlenden Werte an. Anschließend berechnen wir die Melderate in Wuhan vom 20. Januar bis zum 5. April 2020. Schließlich schätzen wir das Datum, an dem der erste Patient infiziert wurde.

Daten

Die Daten, die aus öffentlich zugänglichen Aufzeichnungen von provinziellen und kommunalen Gesundheitskommissionen in China und Gesundheitsministerien in anderen Ländern abgerufen wurden, enthalten detaillierte Informationen für 10 940 bestätigte Fälle außerhalb der Provinz Hubei. Eine zusätzliche Tabelle in den ergänzenden Materialien zeigt diese Websites im Detail. Zu den Informationen über die bestätigten Fälle gehören Region, Geschlecht, Alter, Datum des Auftretens der Symptome, Datum der Bestätigung, Reise- oder Wohnsitzgeschichte in Wuhan und Datum der Abreise aus Wuhan. Die demografischen Merkmale dieser Patienten sind in Tabelle 1 aufgeführt. Von den 7500 Patienten mit Angaben zum Geschlecht sind 3509 (46,8 %) weiblich. Das Durchschnittsalter der Patienten liegt bei 44,48 Jahren, der Median bei 44 Jahren. Der jüngste bestätigte Patient außerhalb der Provinz Hubei war nur 5 Tage alt, während der älteste 97 Jahre alt ist (siehe Tabelle 1).

Tabelle 1 Demografische Merkmale von Patienten mit COVID-19 außerhalb der Provinz Hubei

Wir zeigen die epidemiologischen Daten kategorisiert nach dem Datum der Bestätigung in Tabelle 2. Ein importierter Fall ist ein Patient, der in Wuhan war und außerhalb der Provinz Hubei entdeckt wurde. Ein lokaler Fall ist ein bestätigter Fall, der nicht in Wuhan aufgetreten ist. Von den insgesamt 10 940 Fällen weisen 6903 (63,1 %) solche epidemiologischen Informationen auf. Die Zahl der importierten Fälle erreichte am 29. Januar 2020 ihren Höhepunkt, und die vierte Spalte von Tabelle 2 zeigt, dass der Anteil der importierten Fälle im Laufe der Zeit abnimmt. Dies könnte die Wirkung der Eindämmungsmaßnahmen widerspiegeln, die in der Provinz Hubei zur Kontrolle des COVID-19-Ausbruchs ergriffen wurden. In der Zwischenzeit liegt die tägliche Zahl der lokalen Fälle vom 2. Februar bis zum 7. Februar 2020 bei über 300, was darauf hindeutet, dass Infektionen unter den Einheimischen für die Behörden außerhalb der Provinz Hubei ein wichtiges Anliegen sein sollten.

Tabelle 2 Patientendaten kategorisiert nach dem Datum der Bestätigung

Die letzte Spalte von Tabelle 2 listet die mittlere Zeit vom Auftreten der Symptome bis zur Bestätigung für Patienten auf, die an jedem Tag bestätigt wurden. Der Median aller Fälle liegt bei 5 Tagen, der Mittelwert bei 5,54 Tagen. Im Allgemeinen verringerte sich die Erkennungszeit in der ersten Woche nach dem 20. Januar 2020, stieg dann aber wieder an. Die Verbesserungen bei der Erkennungsgeschwindigkeit und -kapazität könnten die Ursache für den anfänglichen Rückgang sein, und der Anstieg könnte auf ein gründlicheres Screening zurückzuführen sein, das zur Erkennung von Patienten mit leichten Symptomen führt, die andernfalls nicht in die Krankenhäuser gehen würden.

Annahmen

Die vorgeschlagene Methode beruht auf den folgenden Annahmen:

  1. 1)

    Zwischen dem 10. Januar und dem 23. Januar 2020 ist der durchschnittliche tägliche Anteil der Abreisen aus Wuhan p.

  2. 2)

    Es gibt ein d = d1 + d2-Tage-Fenster zwischen Infektion und Entdeckung, einschließlich einer d1-Tage-Inkubationszeit und einer d2-Tage-Verzögerung vom Auftreten der Symptome bis zur Entdeckung.

  3. 3)

    Patienten können d Tage nach der Infektion nicht reisen.

  4. 4)

    Der Anteil der importierten Fälle bei den Patienten ohne Informationen ist der gleiche wie der beobachtete Anteil an jedem Tag.

  5. 5)

    Die Reisedauer ist lang genug, dass ein reisender Patient, der sich in Wuhan infiziert hat, eher an anderen Orten Symptome entwickelt und entdeckt wird als nach seiner Rückkehr nach Wuhan.

  6. 6)

    Alle Reisenden, die Wuhan verlassen, einschließlich Umsteigepassagiere, haben das gleiche Infektionsrisiko wie Einheimische.

  7. 7)

    Reisen ist unabhängig vom Expositionsrisiko gegenüber COVID-19 oder vom Infektionsstatus.

  8. 8)

    Wiederfunde werden bei dieser Methode nicht berücksichtigt.

Die Annahmen 1-4 werden im Abschnitt Methoden explizit verwendet. Sie sind grundlegende Annahmen für unser statistisches Modell. Da auch andere Annahmen das Ergebnis unseres Modells beeinflussen können, machen wir einige Anmerkungen zu unseren Annahmen.

  1. a)

    Der 10. Januar 2020 ist der Beginn des Reiseansturms zum chinesischen Neujahrsfest und der 23. Januar 2020 ist das Datum der Sperrung von Wuhan. Von den insgesamt 10 940 Fällen fällt nur bei 131 (1,2 %) das Datum der Abreise aus Wuhan nicht in diesen Zeitraum. Sie werden aus unserer Analyse ausgeschlossen.

  2. b)

    Wenn der tatsächliche durchschnittliche tägliche Anteil der Abreise aus Wuhan größer ist als das angenommene p, könnte diese Verletzung der Annahme 1 zu einer Überschätzung der Zahl der Fälle in Wuhan führen.

  3. c)

    Wenn die durchschnittliche Zeit von der Infektion bis zur Entdeckung länger ist als die angenommenen d Tage, würde dieser Verstoß gegen Annahme 2 zu einer Überschätzung führen.

  4. d)

    Wenn Reisende ein geringeres Infektionsrisiko haben als Einwohner in Wuhan, würde dieser Verstoß gegen Annahme 6 zu einer Unterschätzung führen.

  5. e)

    Wenn infizierte Personen aufgrund der gesundheitlichen Bedingungen seltener reisen, würde dieser Verstoß gegen Annahme 7 zu einer Unterschätzung führen.

Im ergänzenden Anhang A führen wir eine Sensitivitätsanalyse zu den Auswirkungen einiger Verstöße auf unsere Ergebnisse durch.

Anmerkungen

Lassen Sie den Tag t0 das Datum der Infektion für den allerersten Fall bedeuten. Nt sei die kumulative Anzahl der Fälle, die bis zum Tag t in Wuhan bestätigt werden sollten. Andere Bezeichnungen unseres Modells sind in Tabelle 3 definiert.

Tabelle 3 Bezeichnungen für unser Modell

Die Zahlen Tt, It und Lt sind die in unserem Modell verwendeten Beobachtungsdaten, tc, r und K sind die Parameter, die bestimmen, wie sich Nt im Laufe der Zeit verändert.

Modell

Der Wachstumstrend der Größe Nt der infizierten Population wird durch die folgende gewöhnliche Differentialgleichung bestimmt:

$$ \frac{d{N}_t}{dt}=\frac{r}{K}{N}_t\left(K-{N}_t\right),\kern0.5em r>0,K>0, $$
(1)

wobei K die Größe der Bevölkerung ist, die für COVID-19 in Wuhan empfänglich ist, und r eine Konstante ist, die die Wachstumsrate von Nt kontrolliert. Dies ist die modifizierte Version des berühmten SIR-Modells in der Epidemiologie. In Gleichung (1) ist die Wachstumsrate von Nt proportional zum Produkt aus Nt und der Anzahl K – Nt der Personen, die anfällig, aber noch nicht infiziert sind. Dies ist ein vernünftiges Modell für die epidemische Übertragung. Zu Beginn der Epidemie, wenn Nt klein ist und die Menschen wenig über COVID-19 wissen, wächst Nt mit einer exponentiellen Rate r. Wenn Nt größer wird und Maßnahmen zur Eindämmung ergriffen werden, verlangsamt sich die Wachstumsrate von Nt, was zu einer sigmoiden Kurve von Nt führt. Detaillierte Erklärungen zu Modell (1) finden sich im ergänzenden Anhang B. Das Modell (1) hat eine analytische Lösung,

$$ {N}_t=\frac{K}{1+{e}^{-r\left(t-{t}_c\right)}}=K{f}_t, $$
(2)

wobei \( {f}_t=\frac{1}{1+{e}^{-r\left(t-{t}_c\right)}} \), und die Ableitung \( \frac{d{N}_t}{dt} \) ist bei t = tc maximiert, \( \frac{r}{2}=\frac{d\log {N}_{t_c}}{dt} \) ist die Wachstumsrate von logNt zum Zeitpunkt tc, K ist ein zu schätzender Parameter.

Schätzung

Wir verwenden Daten über die bestätigten Fälle, die Wuhan zwischen dem 10. Januar und dem 23. Januar 2020 verlassen haben, um K zu schätzen. Unter Annahme 2 werden die am Tag t infizierten Fälle am Tag t + d entdeckt, so dass die Anzahl der infizierten Fälle in Wuhan am Tag t Nt + d beträgt. Wenn t0 ≤ t ≤ t0 + d, sollte es keine bestätigten Fälle geben. Wenn t0 + d < t ≤ t0 + 2d, sind die importierten Fälle am Tag t in Wuhan am Tag t – d infiziert. Es gibt Nt infizierte Fälle in Wuhan am Tag t – d, daher folgt die Anzahl der importierten Fälle xt am Tag t einer Binomialverteilung (Nt, p), wobei p die angenommene durchschnittliche tägliche Wahrscheinlichkeit ist, Wuhan zwischen dem 10. Januar und dem 23. Januar 2020 zu verlassen. Wenn t > t0 + 2d, unter Annahme 3, Nt – d Patienten nicht reisen können, hat xt eine Binomialverteilung (Nt – Nt – d, p). Sei Xt die kumulative Anzahl der importierten Fälle bis zum Tag t, dann

$$ {X}_t=\sum \limits_{k=1}^t{x}_k\sim \mathrm{Binomial}\left(\sum \limits_{k=t-d+1}^t{N}_k,p\right),\kern0.75em t\ge {t}_0+2d. $$
(3)

Aus Gleichungen (2) und (3) ergibt sich \( {X}_t\sim \mathrm{Binomial}\left(K\sum \limits_{k=t-d+1}^t{f}_k,p\right) \). Die Parameterschätzung \( \hat{K} \) ergibt sich durch Maximierung der Likelihood-Funktion

$$ l(K)=\left(\genfrac{}{}{0pt}{}{K\sum \limits_{k=t-d+1}^t{f}_k}{X_t}\right){p}^{X_t}{\left(1-p\right)}^{K\sum \limits_{k=t-d+1}^t{f}_k-{X}_t}. $$
(4)

Die untere und obere Grenze des 95%-Konfidenzintervalls \( \left \) sind Werte, bei denen die kumulative Verteilungsfunktion \( F(K)={\sum}_{x=0}^{X_t}l(K) \) gleich 0,975 bzw. 0,025 ist. Die Melderate ist die gemeldete kumulative Zahl der Fälle in Wuhan am Tag t geteilt durch unsere geschätzte Zahl \( \hat{N_t} \). Die Schätzung des Datums t0 der Erstinfektion ergibt sich aus der Lösung der Gleichung \( {N}_{t_0}=1. \)

Die Bestimmung der Zahl der importierten Fälle xt spielt eine entscheidende Rolle im Modellierungsverfahren. Es ist zu beachten, dass nicht für alle Fälle eindeutige Aufzeichnungen über die Geschichte der Reise oder des Aufenthalts in Wuhan vorliegen; wir müssen die fehlenden Werte imputieren. Unter Annahme 4 ist der Anteil der importierten Fälle an den Ut-Patienten ohne Informationen derselbe wie der beobachtete Anteil \( \frac{I_k}{I_k+{L}_k} \). Daher,

$$ {x}_t={I}_t+{U}_t\times \frac{I_k}{I_k+{L}_k}={T}_k\times \frac{I_k}{I_k+{L}_k}. $$
(5)

Der durchschnittliche tägliche Anteil der Reisenden, die Wuhan zwischen dem 10. Januar und dem 23. Januar 2020 verlassen, wird auf das Verhältnis zwischen dem täglichen Reiseaufkommen und der Bevölkerung von Wuhan (14 Millionen) geschätzt. Schätzungen zufolge werden mehr als 5 Millionen Menschen Wuhan aufgrund des Frühlingsfestes und der Epidemie verlassen. Diese Zahl wurde vom Bürgermeister von Wuhan in einer Pressekonferenz genannt. Wir gehen davon aus, dass diese Passagiere Wuhan zwischen dem Beginn des Reiseansturms zum chinesischen Neujahrsfest am 10. Januar 2020 und der Abriegelung der Stadt Wuhan am 23. Januar 2020 verlassen haben. Während des Reiseansturms reisten 34 % der Passagiere über 300 km weit. Die größeren Städte außerhalb der Provinz Hubei sind in der Regel mehr als 300 km von Wuhan entfernt. Dies würde bedeuten, dass die tägliche Wahrscheinlichkeit p einer Reise von Wuhan zu Orten außerhalb der Provinz Hubei im Durchschnitt 5 × 0,34/14/14 = 0,009 beträgt. Li et al. schätzten die mittlere Inkubationszeit von 425 Patienten mit COVID-19 auf 5,2 Tage (95% CI: 4,1-7,0). Die aus unseren Daten berechnete mittlere Zeit vom Auftreten der Symptome bis zur Entdeckung beträgt 5,54 Tage, so dass wir d = d1 + d2 = 11 Tage wählen. Am 29. Januar 2020 gab es die höchste Anzahl an importierten Fällen. Da xt eine Binomialverteilung (Nt – Nt – d, p) mit konstantem p hat, erreicht auch Nt – Nt – d sein Maximum am t= 29. Januar 2020. Aus der logistischen Funktion (2) ergibt sich, dass tc der Mittelpunkt von t und t – d ist, d. h. \( t-\frac{d}{2}= \) 24. Januar 2020, also kurz nach der Abriegelung der Stadt Wuhan. Wu et al. schätzten die Verdopplungszeit der Epidemie auf 6,4 Tage (95% CI: 5,8-7,1) ab dem 25. Januar 2020. Aus diesem Ergebnis schätzen wir, dass \( \frac{r}{2}=\frac{d\log {N}_{t_c}}{dt}=\frac{\ln 2}{6,4}=0,1 \). Unter Verwendung dieser Werte für die Parameter p, d, tc und r können wir die Maximum-Likelihood-Schätzung \( \hat{K}=51\ 273, \) mit 95% CI ableiten: 49 844-52 734.