Articles

Oszacowanie dziennego trendu wielkości populacji zakażonej COVID-19 w Wuhan

Rozprzestrzenianie się COVID-19 poza prowincję Hubei jest stosunkowo kontrolowane, biorąc pod uwagę odpowiednie zasoby medyczne. Używamy zgłoszonej liczby poza Hubei, ponieważ jest to dość dokładna reprezentacja rzeczywistej sytuacji epidemicznej. W niniejszym badaniu dotyczącym modelowania najpierw szacujemy rozmiar epidemii w Wuhan w okresie od 10 stycznia do 5 kwietnia 2020 r. na podstawie potwierdzonych przypadków poza prowincją Hubei, które opuściły Wuhan do dnia 23 stycznia 2020 r. Ponieważ niektóre potwierdzone przypadki nie mają informacji o tym, czy odwiedzili Wuhan wcześniej, dostosowujemy liczbę importowanych przypadków po uwzględnieniu tych brakujących wartości. Następnie obliczamy wskaźnik zgłaszalności w Wuhan od 20 stycznia do 5 kwietnia 2020 r. Wreszcie, szacujemy datę, kiedy pierwszy pacjent został zakażony.

Dane

Dane pobrane z publicznie dostępnych rejestrów z prowincjonalnych i miejskich komisji zdrowia w Chinach oraz ministerstw zdrowia w innych krajach zawierają szczegółowe informacje dotyczące 10 940 potwierdzonych przypadków poza prowincją Hubei. Dodatkowa tabela w Materiałach uzupełniających pokazuje te strony internetowe w sposób bardziej szczegółowy . Informacje o potwierdzonych przypadkach, w tym region, płeć, wiek, data wystąpienia objawów, data potwierdzenia, historia podróży lub pobytu w Wuhan i data wyjazdu z Wuhan. Wyświetlamy charakterystykę demograficzną tych pacjentów w Tabeli 1. Wśród 7500 pacjentów z danymi dotyczącymi płci, 3509 (46,8%) to kobiety. Średni wiek pacjentów wynosi 44,48 lat, a mediana wieku wynosi 44 lata. Najmłodszy potwierdzony pacjent spoza prowincji Hubei miał zaledwie 5 dni, podczas gdy najstarszy 97 lat (patrz Tabela 1).

Tabela 1 Charakterystyka demograficzna pacjentów z COVID-19 spoza prowincji Hubei

W Tabeli 2 przedstawiamy dane epidemiologiczne skategoryzowane według daty potwierdzenia. Przypadek importowany oznacza pacjenta, który przebywał w Wuhan i został wykryty poza prowincją Hubei. Przypadek lokalny oznacza potwierdzony przypadek, który nie przebywał w Wuhan. Spośród wszystkich 10 940 przypadków, 6903 (63,1%) posiada takie informacje epidemiologiczne. Liczba przypadków importowanych osiągnęła najwyższy poziom w dniu 29 stycznia 2020 r., a w czwartej kolumnie tabeli 2 pokazano, że odsetek przypadków importowanych zmniejsza się z czasem. Może to odzwierciedlać skutki środków ograniczających podjętych w prowincji Hubei w celu opanowania ogniska COVID-19. Tymczasem dzienna liczba lokalnych przypadków wynosi ponad 300 od 2 lutego do 7 lutego 2020 r., Co wskazuje, że infekcje wśród lokalnych mieszkańców powinny być głównym problemem dla władz poza prowincją Hubei.

Tabela 2 Dane pacjentów skategoryzowane według daty potwierdzenia

Ostatnia kolumna Tabeli 2 zawiera listę średniego czasu od początku objawów do potwierdzenia dla pacjentów potwierdzonych w każdym dniu. Mediana czasu trwania wszystkich przypadków wynosi 5 dni, a średnia wynosi 5,54 dnia. Ogólnie rzecz biorąc, okres wykrywania zmniejszył się w pierwszym tygodniu po 20 stycznia 2020 r., ale od tego czasu wzrósł. Poprawa szybkości i zdolności wykrywania może spowodować początkowy spadek, a wzrost może być spowodowany dokładniejszym badaniem przesiewowym, prowadzącym do wykrywania pacjentów z łagodnymi objawami, którzy w przeciwnym razie nie trafiliby do szpitali .

Założenia

Proponowana metoda opiera się na następujących założeniach:

  1. 1)

    Pomiędzy 10 stycznia a 23 stycznia 2020 r., średni dzienny odsetek wyjeżdżających z Wuhan wynosi p.

  2. 2)

    Istnieje d = d1 + d2-dniowe okno między zakażeniem a wykryciem, w tym d1-dniowy okres inkubacji i d2-dniowe opóźnienie od początku objawów do wykrycia.

  3. 3)

    Pacjenci nie są w stanie podróżować d dni po zakażeniu.Proporcja importowanych przypadków wśród pacjentów bez informacji jest taka sama jak obserwowana proporcja każdego dnia.

  4. 5)

    Czas trwania podróży jest wystarczająco długi, aby podróżujący pacjent zakażony w Wuhan rozwinął objawy i został wykryty w innych miejscach, a nie po powrocie do Wuhan.

  5. 6)

    Wszyscy podróżni opuszczający Wuhan, w tym pasażerowie transferowi, mają takie samo ryzyko zakażenia jak lokalni mieszkańcy.

  6. 7)

    Podróżowanie jest niezależne od ryzyka narażenia na COVID-19 lub od statusu zakażenia.

  7. 8)

    Recovery nie są brane pod uwagę w tej metodzie.

Założenia 1-4 są użyte wprost w sekcji Metody. Są one podstawowymi założeniami dla naszego modelu statystycznego. Inne założenia mogą również wpłynąć na wynik naszego modelu, dlatego też przedstawiamy kilka uwag na temat naszych założeń.

  1. a)

    10 stycznia 2020 r. to początek chińskiego Nowego Roku, a 23 stycznia 2020 r. to data zamknięcia Wuhan. W całkowitej liczbie 10 940 przypadków, tylko 131 (1,2%) dat wyjazdu z Wuhan nie znajduje się w tym okresie. Są one wyłączone z naszej analizy.

  2. b)

    Jeśli prawdziwy średni dzienny odsetek opuszczających Wuhan jest większy niż zakładane p, to naruszenie założenia 1 może prowadzić do przeszacowania liczby przypadków w Wuhan.

  3. c)

    Jeśli średni czas od zakażenia do wykrycia jest dłuższy niż założone d dni, to naruszenie Założenia 2 doprowadziłoby do przeszacowania.

  4. d)

    Jeśli podróżujący mają niższe ryzyko zakażenia niż mieszkańcy Wuhan, to naruszenie Założenia 6 spowodowałoby niedoszacowanie.

  5. e)

    Jeśli zakażone osoby są mniej skłonne do podróżowania z powodu warunków zdrowotnych, to naruszenie założenia 7 spowodowałoby niedoszacowanie.

W Dodatku Uzupełniającym A przeprowadzamy analizę wrażliwości na wpływ niektórych naruszeń na nasze wyniki.

Uwagi

Niech dzień t0 oznacza datę infekcji dla pierwszego przypadku. Niech Nt będzie skumulowaną liczbą przypadków, które powinny być potwierdzone w Wuhan do dnia t. Inne notacje naszego modelu są zdefiniowane w Tabeli 3.

Tabela 3 Notacje dla naszego modelu

Liczby Tt, It, i Lt są obserwowanymi danymi użytymi w naszym modelu, tc, r, i K są parametrami, które określają jak Nt zmienia się w czasie.

Model

Tendencja wzrostu wielkości Nt zainfekowanej populacji jest określona przez następujące równanie różniczkowe zwyczajne:

$ \frac{d{N}_t}{dt}= \frac{r}{K}{N}_t}left(K-{N}_t}right),\kern0.5em r>0,K>0, $$
(1)

gdzie K jest wielkością populacji, która jest podatna na COVID-19 w Wuhan, a r jest stałą, która kontroluje tempo wzrostu Nt. Jest to zmodyfikowana wersja słynnego modelu SIR w epidemiologii. W równaniu (1), tempo wzrostu Nt jest proporcjonalne do iloczynu Nt i liczby K – Nt osób, które są podatne, ale jeszcze nie zakażone. Jest to rozsądny model transmisji epidemii. Na początku epidemii, gdy Nt jest małe, ludzie mają niewielką wiedzę na temat COVID-19, Nt rośnie w tempie wykładniczym r. W miarę jak Nt staje się większe, podejmowane są środki ograniczające, aby je kontrolować, tempo wzrostu Nt spada, w wyniku czego Nt ma krzywą sigmoidalną. Szczegółowe objaśnienia modelu (1) znajdują się w Dodatku uzupełniającym B. Model (1) ma rozwiązanie analityczne,

$$ {N}_t=frac{K}{1+{e}^{-r}left(t-{t}_c}right)}}=K{f}_t, $$
(2)

gdzie \( {f}_t= \frac{1}{1+{e}^{-r\left(t-{t}_c\right)}} \), a pochodna \( \frac{d{N}_t}{dt} \) jest zmaksymalizowana w t = tc, \( \frac{r}{2}= \frac{dlog {N}_{t_c}}{dt} \) jest stopą wzrostu logNt w czasie tc, K jest parametrem do oszacowania.

Estymacja

W celu oszacowania K wykorzystujemy dane dotyczące potwierdzonych przypadków, które opuściły Wuhan między 10 stycznia a 23 stycznia 2020 roku. Zgodnie z założeniem 2, przypadki zakażone w dniu t zostaną wykryte w dniu t + d, więc liczba zakażonych przypadków w Wuhan wynosi Nt + d w dniu t. Jeśli t0 ≤ t ≤ t0 + d, nie powinno być żadnych potwierdzonych przypadków. Jeżeli t0 + d < t ≤ t0 + 2d, przywożone przypadki w dniu t są zakażone w Wuhan w dniu t – d. W Wuhan jest Nt zakażonych przypadków w dniu t – d, stąd liczba przywożonych przypadków xt w dniu t ma rozkład dwumianowy (Nt, p), gdzie p jest zakładanym średnim dziennym prawdopodobieństwem opuszczenia Wuhan w okresie od 10 stycznia do 23 stycznia 2020 r. Jeśli t > t0 + 2d, zgodnie z założeniem 3, Nt – d pacjentów nie jest w stanie podróżować, xt ma rozkład dwumianowy (Nt – Nt – d, p). Niech Xt będzie skumulowaną liczbą importowanych przypadków do dnia t, wtedy

$$ {X}_t= suma \limits_{k=1}^t{x}_k \sim \mathrm{Binomial} \left(\sum \limits_{k=t-d+1}^t{N}_k,p\right),\kern0.75em t\ge {t}_0+2d. $$
(3)

Z równań (2) i (3) wynika, że \( {X}_t \sim \mathrm{Binomial} \left(K \limits_{k=t-d+1}^t{f}_k,p\right) \). Estymatę parametru \( \hat{K} \) uzyskuje się przez maksymalizację funkcji prawdopodobieństwa

$$ l(K)=left(\genfrac{}{0pt}{Ksum \limits_{k=t-d+1}^t{f}_k}{X_t}\right){p}^{X_t}{\left(1-p\right)}^{K\sum \limits_{k=t-d+1}^t{f}_k-{X}_t}. $$
(4)

Dolna i górna granica 95% przedziału ufności \( \left \) to wartości takie, że funkcja rozkładu skumulowanego \( F(K)={sum}_{x=0}^{X_t}l(K) \) równa się odpowiednio 0,975 i 0,025. Wskaźnik zgłaszalności to zgłoszona skumulowana liczba przypadków w Wuhan w dniu t podzielona przez naszą szacunkową liczbę ( ≥{N_t} ≥). Oszacowanie daty t0 pierwszego zakażenia uzyskuje się poprzez rozwiązanie równania ( {N}_{t_0}=1. \)

Określenie liczby importowanych przypadków xt odgrywa kluczową rolę w procedurze modelowania. Należy zauważyć, że nie wszystkie przypadki mają wyraźne zapisy dotyczące historii podróży lub zamieszkania w Wuhan, musimy imputować brakujące wartości. Zgodnie z założeniem 4, proporcja przypadków importowanych w grupie pacjentów Ut bez informacji jest taka sama jak obserwowana proporcja \( \frac{I_k}{I_k+{L}_k} \). W związku z tym,

$$ {x}_t={I}_t+{U}_t razy \frac{I_k}{I_k+{L}_k}={T}_k razy \frac{I_k}{I_k+{L}_k}. $$
(5)

Średni dzienny odsetek wyjeżdżających z Wuhan w okresie od 10 stycznia do 23 stycznia 2020 roku szacuje się jako stosunek dziennego wolumenu podróżnych do liczby ludności Wuhan (14 mln). Szacuje się, że ponad 5 milionów osób opuści Wuhan z powodu Festiwalu Wiosennego i epidemii. Liczba ta została podana przez burmistrza Wuhan na konferencji prasowej. Zakładamy, że ci pasażerowie opuścili Wuhan w okresie od rozpoczęcia szczytu podróży z okazji Chińskiego Nowego Roku w dniu 10 stycznia 2020 r. do zamknięcia miasta Wuhan w dniu 23 stycznia 2020 r. Podczas szczytu podróżnego 34% pasażerów podróżowało na odległość ponad 300 km . Główne miasta poza prowincją Hubei są zazwyczaj oddalone od Wuhan o ponad 300 km. Oznaczałoby to, że średnio dzienne prawdopodobieństwo p podróży z Wuhan do miejsc poza prowincją Hubei wynosiłoby 5 × 0,34/14/14 = 0,009. Li i wsp. oszacowali, że średni okres inkubacji u 425 pacjentów z COVID-19 wynosił 5,2 dnia (95% CI: 4,1-7,0). Średni czas od początku objawów do ich wykrycia obliczony na podstawie naszych danych wynosi 5,54 dnia, zatem wybieramy d = d1 + d2 = 11 dni. W dniu 29 stycznia 2020 r. odnotowano maksymalną liczbę importowanych przypadków. Ponieważ xt ma rozkład dwumianowy (Nt – Nt – d, p) ze stałym p, Nt – Nt – d również osiąga maksimum w t= 29 stycznia 2020. Z funkcji logistycznej (2) wynika, że tc jest punktem środkowym t i t – d, czyli 24 stycznia 2020 r. ( t -frac{d}{2}= \), czyli krótko po zamknięciu miasta Wuhan. Wu i in. oszacowali czas podwojenia epidemii na 6,4 dnia (95% CI: 5,8-7,1) na dzień 25 stycznia 2020 r. Na podstawie tego wyniku szacujemy, że \( \frac{r}{2}= \frac{dlog {N}_{t_c}}{dt}= \frac{ln 2}{6,4}=0,1 \). Używając tych wartości dla parametrów p, d, tc i r, możemy otrzymać oszacowanie maksymalnego prawdopodobieństwa \ ( \hat{K}=51\ 273, \) z 95% CI: 49 844-52 734.