Oszacowanie dziennego trendu wielkości populacji zakażonej COVID-19 w Wuhan
Rozprzestrzenianie się COVID-19 poza prowincję Hubei jest stosunkowo kontrolowane, biorąc pod uwagę odpowiednie zasoby medyczne. Używamy zgłoszonej liczby poza Hubei, ponieważ jest to dość dokładna reprezentacja rzeczywistej sytuacji epidemicznej. W niniejszym badaniu dotyczącym modelowania najpierw szacujemy rozmiar epidemii w Wuhan w okresie od 10 stycznia do 5 kwietnia 2020 r. na podstawie potwierdzonych przypadków poza prowincją Hubei, które opuściły Wuhan do dnia 23 stycznia 2020 r. Ponieważ niektóre potwierdzone przypadki nie mają informacji o tym, czy odwiedzili Wuhan wcześniej, dostosowujemy liczbę importowanych przypadków po uwzględnieniu tych brakujących wartości. Następnie obliczamy wskaźnik zgłaszalności w Wuhan od 20 stycznia do 5 kwietnia 2020 r. Wreszcie, szacujemy datę, kiedy pierwszy pacjent został zakażony.
Dane
Dane pobrane z publicznie dostępnych rejestrów z prowincjonalnych i miejskich komisji zdrowia w Chinach oraz ministerstw zdrowia w innych krajach zawierają szczegółowe informacje dotyczące 10 940 potwierdzonych przypadków poza prowincją Hubei. Dodatkowa tabela w Materiałach uzupełniających pokazuje te strony internetowe w sposób bardziej szczegółowy . Informacje o potwierdzonych przypadkach, w tym region, płeć, wiek, data wystąpienia objawów, data potwierdzenia, historia podróży lub pobytu w Wuhan i data wyjazdu z Wuhan. Wyświetlamy charakterystykę demograficzną tych pacjentów w Tabeli 1. Wśród 7500 pacjentów z danymi dotyczącymi płci, 3509 (46,8%) to kobiety. Średni wiek pacjentów wynosi 44,48 lat, a mediana wieku wynosi 44 lata. Najmłodszy potwierdzony pacjent spoza prowincji Hubei miał zaledwie 5 dni, podczas gdy najstarszy 97 lat (patrz Tabela 1).
W Tabeli 2 przedstawiamy dane epidemiologiczne skategoryzowane według daty potwierdzenia. Przypadek importowany oznacza pacjenta, który przebywał w Wuhan i został wykryty poza prowincją Hubei. Przypadek lokalny oznacza potwierdzony przypadek, który nie przebywał w Wuhan. Spośród wszystkich 10 940 przypadków, 6903 (63,1%) posiada takie informacje epidemiologiczne. Liczba przypadków importowanych osiągnęła najwyższy poziom w dniu 29 stycznia 2020 r., a w czwartej kolumnie tabeli 2 pokazano, że odsetek przypadków importowanych zmniejsza się z czasem. Może to odzwierciedlać skutki środków ograniczających podjętych w prowincji Hubei w celu opanowania ogniska COVID-19. Tymczasem dzienna liczba lokalnych przypadków wynosi ponad 300 od 2 lutego do 7 lutego 2020 r., Co wskazuje, że infekcje wśród lokalnych mieszkańców powinny być głównym problemem dla władz poza prowincją Hubei.
Ostatnia kolumna Tabeli 2 zawiera listę średniego czasu od początku objawów do potwierdzenia dla pacjentów potwierdzonych w każdym dniu. Mediana czasu trwania wszystkich przypadków wynosi 5 dni, a średnia wynosi 5,54 dnia. Ogólnie rzecz biorąc, okres wykrywania zmniejszył się w pierwszym tygodniu po 20 stycznia 2020 r., ale od tego czasu wzrósł. Poprawa szybkości i zdolności wykrywania może spowodować początkowy spadek, a wzrost może być spowodowany dokładniejszym badaniem przesiewowym, prowadzącym do wykrywania pacjentów z łagodnymi objawami, którzy w przeciwnym razie nie trafiliby do szpitali .
Założenia
Proponowana metoda opiera się na następujących założeniach:
- 1)
Pomiędzy 10 stycznia a 23 stycznia 2020 r., średni dzienny odsetek wyjeżdżających z Wuhan wynosi p.
- 2)
Istnieje d = d1 + d2-dniowe okno między zakażeniem a wykryciem, w tym d1-dniowy okres inkubacji i d2-dniowe opóźnienie od początku objawów do wykrycia.
- 3)
Pacjenci nie są w stanie podróżować d dni po zakażeniu.Proporcja importowanych przypadków wśród pacjentów bez informacji jest taka sama jak obserwowana proporcja każdego dnia.
- 5)
Czas trwania podróży jest wystarczająco długi, aby podróżujący pacjent zakażony w Wuhan rozwinął objawy i został wykryty w innych miejscach, a nie po powrocie do Wuhan.
- 6)
Wszyscy podróżni opuszczający Wuhan, w tym pasażerowie transferowi, mają takie samo ryzyko zakażenia jak lokalni mieszkańcy.
- 7)
Podróżowanie jest niezależne od ryzyka narażenia na COVID-19 lub od statusu zakażenia.
- 8)
Recovery nie są brane pod uwagę w tej metodzie.
Założenia 1-4 są użyte wprost w sekcji Metody. Są one podstawowymi założeniami dla naszego modelu statystycznego. Inne założenia mogą również wpłynąć na wynik naszego modelu, dlatego też przedstawiamy kilka uwag na temat naszych założeń.
- a)
10 stycznia 2020 r. to początek chińskiego Nowego Roku, a 23 stycznia 2020 r. to data zamknięcia Wuhan. W całkowitej liczbie 10 940 przypadków, tylko 131 (1,2%) dat wyjazdu z Wuhan nie znajduje się w tym okresie. Są one wyłączone z naszej analizy.
- b)
Jeśli prawdziwy średni dzienny odsetek opuszczających Wuhan jest większy niż zakładane p, to naruszenie założenia 1 może prowadzić do przeszacowania liczby przypadków w Wuhan.
- c)
Jeśli średni czas od zakażenia do wykrycia jest dłuższy niż założone d dni, to naruszenie Założenia 2 doprowadziłoby do przeszacowania.
- d)
Jeśli podróżujący mają niższe ryzyko zakażenia niż mieszkańcy Wuhan, to naruszenie Założenia 6 spowodowałoby niedoszacowanie.
- e)
Jeśli zakażone osoby są mniej skłonne do podróżowania z powodu warunków zdrowotnych, to naruszenie założenia 7 spowodowałoby niedoszacowanie.
W Dodatku Uzupełniającym A przeprowadzamy analizę wrażliwości na wpływ niektórych naruszeń na nasze wyniki.
Uwagi
Niech dzień t0 oznacza datę infekcji dla pierwszego przypadku. Niech Nt będzie skumulowaną liczbą przypadków, które powinny być potwierdzone w Wuhan do dnia t. Inne notacje naszego modelu są zdefiniowane w Tabeli 3.
Liczby Tt, It, i Lt są obserwowanymi danymi użytymi w naszym modelu, tc, r, i K są parametrami, które określają jak Nt zmienia się w czasie.
Model
Tendencja wzrostu wielkości Nt zainfekowanej populacji jest określona przez następujące równanie różniczkowe zwyczajne:
gdzie K jest wielkością populacji, która jest podatna na COVID-19 w Wuhan, a r jest stałą, która kontroluje tempo wzrostu Nt. Jest to zmodyfikowana wersja słynnego modelu SIR w epidemiologii. W równaniu (1), tempo wzrostu Nt jest proporcjonalne do iloczynu Nt i liczby K – Nt osób, które są podatne, ale jeszcze nie zakażone. Jest to rozsądny model transmisji epidemii. Na początku epidemii, gdy Nt jest małe, ludzie mają niewielką wiedzę na temat COVID-19, Nt rośnie w tempie wykładniczym r. W miarę jak Nt staje się większe, podejmowane są środki ograniczające, aby je kontrolować, tempo wzrostu Nt spada, w wyniku czego Nt ma krzywą sigmoidalną. Szczegółowe objaśnienia modelu (1) znajdują się w Dodatku uzupełniającym B. Model (1) ma rozwiązanie analityczne,
gdzie \( {f}_t= \frac{1}{1+{e}^{-r\left(t-{t}_c\right)}} \), a pochodna \( \frac{d{N}_t}{dt} \) jest zmaksymalizowana w t = tc, \( \frac{r}{2}= \frac{dlog {N}_{t_c}}{dt} \) jest stopą wzrostu logNt w czasie tc, K jest parametrem do oszacowania.
Estymacja
W celu oszacowania K wykorzystujemy dane dotyczące potwierdzonych przypadków, które opuściły Wuhan między 10 stycznia a 23 stycznia 2020 roku. Zgodnie z założeniem 2, przypadki zakażone w dniu t zostaną wykryte w dniu t + d, więc liczba zakażonych przypadków w Wuhan wynosi Nt + d w dniu t. Jeśli t0 ≤ t ≤ t0 + d, nie powinno być żadnych potwierdzonych przypadków. Jeżeli t0 + d < t ≤ t0 + 2d, przywożone przypadki w dniu t są zakażone w Wuhan w dniu t – d. W Wuhan jest Nt zakażonych przypadków w dniu t – d, stąd liczba przywożonych przypadków xt w dniu t ma rozkład dwumianowy (Nt, p), gdzie p jest zakładanym średnim dziennym prawdopodobieństwem opuszczenia Wuhan w okresie od 10 stycznia do 23 stycznia 2020 r. Jeśli t > t0 + 2d, zgodnie z założeniem 3, Nt – d pacjentów nie jest w stanie podróżować, xt ma rozkład dwumianowy (Nt – Nt – d, p). Niech Xt będzie skumulowaną liczbą importowanych przypadków do dnia t, wtedy
Z równań (2) i (3) wynika, że \( {X}_t \sim \mathrm{Binomial} \left(K \limits_{k=t-d+1}^t{f}_k,p\right) \). Estymatę parametru \( \hat{K} \) uzyskuje się przez maksymalizację funkcji prawdopodobieństwa
Dolna i górna granica 95% przedziału ufności \( \left \) to wartości takie, że funkcja rozkładu skumulowanego \( F(K)={sum}_{x=0}^{X_t}l(K) \) równa się odpowiednio 0,975 i 0,025. Wskaźnik zgłaszalności to zgłoszona skumulowana liczba przypadków w Wuhan w dniu t podzielona przez naszą szacunkową liczbę ( ≥{N_t} ≥). Oszacowanie daty t0 pierwszego zakażenia uzyskuje się poprzez rozwiązanie równania ( {N}_{t_0}=1. \)
Określenie liczby importowanych przypadków xt odgrywa kluczową rolę w procedurze modelowania. Należy zauważyć, że nie wszystkie przypadki mają wyraźne zapisy dotyczące historii podróży lub zamieszkania w Wuhan, musimy imputować brakujące wartości. Zgodnie z założeniem 4, proporcja przypadków importowanych w grupie pacjentów Ut bez informacji jest taka sama jak obserwowana proporcja \( \frac{I_k}{I_k+{L}_k} \). W związku z tym,
Średni dzienny odsetek wyjeżdżających z Wuhan w okresie od 10 stycznia do 23 stycznia 2020 roku szacuje się jako stosunek dziennego wolumenu podróżnych do liczby ludności Wuhan (14 mln). Szacuje się, że ponad 5 milionów osób opuści Wuhan z powodu Festiwalu Wiosennego i epidemii. Liczba ta została podana przez burmistrza Wuhan na konferencji prasowej. Zakładamy, że ci pasażerowie opuścili Wuhan w okresie od rozpoczęcia szczytu podróży z okazji Chińskiego Nowego Roku w dniu 10 stycznia 2020 r. do zamknięcia miasta Wuhan w dniu 23 stycznia 2020 r. Podczas szczytu podróżnego 34% pasażerów podróżowało na odległość ponad 300 km . Główne miasta poza prowincją Hubei są zazwyczaj oddalone od Wuhan o ponad 300 km. Oznaczałoby to, że średnio dzienne prawdopodobieństwo p podróży z Wuhan do miejsc poza prowincją Hubei wynosiłoby 5 × 0,34/14/14 = 0,009. Li i wsp. oszacowali, że średni okres inkubacji u 425 pacjentów z COVID-19 wynosił 5,2 dnia (95% CI: 4,1-7,0). Średni czas od początku objawów do ich wykrycia obliczony na podstawie naszych danych wynosi 5,54 dnia, zatem wybieramy d = d1 + d2 = 11 dni. W dniu 29 stycznia 2020 r. odnotowano maksymalną liczbę importowanych przypadków. Ponieważ xt ma rozkład dwumianowy (Nt – Nt – d, p) ze stałym p, Nt – Nt – d również osiąga maksimum w t= 29 stycznia 2020. Z funkcji logistycznej (2) wynika, że tc jest punktem środkowym t i t – d, czyli 24 stycznia 2020 r. ( t -frac{d}{2}= \), czyli krótko po zamknięciu miasta Wuhan. Wu i in. oszacowali czas podwojenia epidemii na 6,4 dnia (95% CI: 5,8-7,1) na dzień 25 stycznia 2020 r. Na podstawie tego wyniku szacujemy, że \( \frac{r}{2}= \frac{dlog {N}_{t_c}}{dt}= \frac{ln 2}{6,4}=0,1 \). Używając tych wartości dla parametrów p, d, tc i r, możemy otrzymać oszacowanie maksymalnego prawdopodobieństwa \ ( \hat{K}=51\ 273, \) z 95% CI: 49 844-52 734.