Articles

Estimación de la tendencia diaria del tamaño de la población infectada por COVID-19 en Wuhan

La propagación de COVID-19 fuera de la provincia de Hubei está relativamente controlada dados los recursos médicos adecuados. Utilizamos el número reportado fuera de Hubei ya que es una representación bastante precisa de la situación epidémica real. En este estudio de modelización, primero estimamos el tamaño de la epidemia en Wuhan del 10 de enero al 5 de abril de 2020, basándonos en los casos confirmados fuera de la provincia de Hubei que salieron de Wuhan antes del 23 de enero de 2020. Como algunos casos confirmados no tienen información sobre si visitaron Wuhan antes, ajustamos el número de casos importados después de tener en cuenta estos valores perdidos. A continuación, calculamos la tasa de notificación en Wuhan del 20 de enero al 5 de abril de 2020. Por último, estimamos la fecha en que se infectó el primer paciente.

Datos

Los datos recuperados de los registros disponibles públicamente de las comisiones de salud provinciales y municipales de China y de los ministerios de salud de otros países incluyen información detallada de 10 940 casos confirmados fuera de la provincia de Hubei. Una tabla adicional en los Materiales Suplementarios muestra estos sitios web con más detalle . La información sobre los casos confirmados incluye la región, el sexo, la edad, la fecha de inicio de los síntomas, la fecha de confirmación, los antecedentes de viaje o residencia en Wuhan y la fecha de salida de Wuhan. En la tabla 1 mostramos las características demográficas de estos pacientes. Entre los 7500 pacientes con datos de género, 3509 (46,8%) son mujeres. La edad media de los pacientes es de 44,48 años y la mediana es de 44 años. El paciente más joven confirmado fuera de la provincia de Hubei tenía sólo 5 días de edad, mientras que el más viejo tiene 97 años (véase la Tabla 1).

Tabla 1 Características demográficas de los pacientes con COVID-19 fuera de la provincia de Hubei

Mostramos los datos epidemiológicos categorizados por la fecha de confirmación en la Tabla 2. Un caso importado significa un paciente que había estado en Wuhan y fue detectado fuera de la provincia de Hubei. Un caso local es un caso confirmado que no ha estado en Wuhan. Del total de 10.940 casos, 6.903 (63,1%) tienen esta información epidemiológica. El número de casos importados alcanzó su punto máximo el 29 de enero de 2020, y la cuarta columna de la Tabla 2 muestra que la proporción de casos importados disminuye con el tiempo. Esto podría reflejar el efecto de las medidas de contención adoptadas en la provincia de Hubei para controlar el brote de COVID-19 . Mientras tanto, los recuentos diarios de casos locales superan los 300 desde el 2 de febrero hasta el 7 de febrero de 2020, lo que indica que las infecciones entre los residentes locales deben ser una preocupación importante para las autoridades de fuera de la provincia de Hubei.

Tabla 2 Datos de los pacientes categorizados por la fecha de confirmación

La última columna de la Tabla 2 enumera el tiempo medio desde el inicio de los síntomas hasta la confirmación para los pacientes confirmados en cada día. La duración media de todos los casos es de 5 días, y la media es de 5,54 días. En general, el periodo de detección disminuyó en la primera semana después del 20 de enero de 2020, pero aumentó desde entonces. Las mejoras en la velocidad y la capacidad de detección podrían ser la causa del descenso inicial, y el aumento puede deberse a un cribado más exhaustivo, que lleva a la detección de pacientes con síntomas leves que, de otro modo, no acudirían a los hospitales.

Supuestos

El método propuesto se basa en los siguientes supuestos:

  1. 1)

    Entre el 10 de enero y el 23 de enero de 2020, la proporción media diaria de salidas de Wuhan es p.

  2. 2)

    Hay una ventana de d = d1 + d2 días entre la infección y la detección, incluyendo un período de incubación de d1 días y un retraso de d2 días desde el inicio de los síntomas hasta la detección.

  3. 3)

    Los pacientes no pueden viajar d días después de la infección.

  4. 4)

    La proporción de casos importados en los pacientes sin información es la misma que la proporción observada en cada día.

  5. 5)

    Las duraciones de los viajes son lo suficientemente largas como para que un paciente que viaja y se infecta en Wuhan desarrolle los síntomas y sea detectado en otros lugares en lugar de después de regresar a Wuhan.

  6. 6)

    Todos los viajeros que salen de Wuhan, incluidos los pasajeros en tránsito, tienen el mismo riesgo de infección que los residentes locales.

  7. 7)

    Viajar es independiente del riesgo de exposición a COVID-19 o del estado de la infección.

  8. 8)

    Las recuperaciones no se consideran en este método.

Los supuestos 1-4 se utilizan explícitamente en la sección de Métodos. Son supuestos fundamentales para nuestro modelo estadístico. Otros supuestos también podrían afectar al resultado de nuestro modelo, y hacemos algunas observaciones sobre nuestros supuestos.

  1. a)

    El 10 de enero de 2020 es el comienzo de la fiebre de viajes del Año Nuevo chino, y el 23 de enero de 2020, es la fecha del cierre de Wuhan . En el total de 10 940 casos, sólo 131 (1,2%) casos la fecha de salida de Wuhan no están en este período. Se excluyen de nuestro análisis.

  2. b)

    Si la verdadera proporción media diaria de salida de Wuhan es mayor que la p asumida, esta violación de la suposición 1 podría conducir a la sobreestimación del número de casos en Wuhan.

  3. c)

    Si el tiempo medio desde la infección hasta la detección es mayor que los d días supuestos, esta violación del supuesto 2 llevaría a una sobreestimación.

  4. d)

    Si los viajeros tienen un menor riesgo de infección que los residentes en Wuhan, esta violación del supuesto 6 causaría una subestimación.

  5. e)

    Si los individuos infectados son menos propensos a viajar debido a las condiciones de salud, esta violación del supuesto 7 causaría una subestimación.

En el Apéndice Suplementario A, realizamos el análisis de sensibilidad sobre el efecto de algunas de las violaciones en nuestros resultados.

Notaciones

Dejemos que el Día t0 denote la fecha de infección para el primer caso. Sea Nt el número acumulado de casos que deben confirmarse en Wuhan para el Día t. Otras notaciones de nuestro modelo se definen en la Tabla 3.

Tabla 3 Notaciones para nuestro modelo

Los números Tt, It y Lt son los datos observados utilizados en nuestro modelo, tc, r y K son los parámetros que determinan cómo cambia Nt con el tiempo.

Modelo

La tendencia de crecimiento del tamaño Nt de la población infectada viene determinada por la siguiente ecuación diferencial ordinaria:

$$ \frac{d{N}_t}{dt}=\frac{r}{K}{N}_t\left(K-{N}_t\right),\kern0.5em r>0,K>0, $$
(1)

donde K es el tamaño de la población susceptible de COVID-19 en Wuhan, y r es una constante que controla la tasa de crecimiento de Nt. Esta es la versión modificada del famoso modelo SIR en epidemiología. En la ecuación (1), la tasa de crecimiento de Nt es proporcional al producto de Nt y el número K – Nt de personas susceptibles pero aún no infectadas. Es un modelo razonable para la transmisión de la epidemia. Al principio de la epidemia, cuando Nt es pequeño, la gente tiene poco conocimiento de COVID-19, Nt crece a una tasa exponencial r. A medida que Nt se hace más grande, se toman medidas de contención para controlarlo, la tasa de crecimiento de Nt se ralentiza, dando lugar a una curva sigmoidea de Nt. En el Apéndice Suplementario B se ofrecen explicaciones detalladas del modelo (1). El modelo (1) tiene una solución analítica,

$$ {N}_t=\frac{K}{1+{e}^{r\left(t-{t}_c\right)}}=K{f}_t, $$
(2)

donde \f}_t=\frac{1}{1+{e}^{r\left(t-{t}_c\right)}} \), y la derivada \( \frac{d{N}_t}{dt}\) se maximiza en t = tc, \( \frac{r}{2}=\frac{log {N}_{t_c}{dt}\) es la tasa de crecimiento de logNt en el tiempo tc, K es un parámetro a estimar.

Estimación

Utilizamos los datos de los casos confirmados que salieron de Wuhan entre el 10 de enero y el 23 de enero de 2020, para estimar K. Bajo el supuesto 2, los casos infectados en el día t se detectarán en el día t + d, por lo que el número de casos infectados en Wuhan es Nt + d en el día t. Si t0 ≤ t ≤ t0 + d, no debería haber casos confirmados. Si t0 + d < t ≤ t0 + 2d, los casos importados en el Día t están infectados en Wuhan en el Día t – d. Hay Nt casos infectados en Wuhan en el Día t – d, por lo que el número de casos importados xt en el Día t sigue una distribución binomial (Nt, p), donde p es la probabilidad media diaria supuesta de salir de Wuhan entre el 10 de enero y el 23 de enero de 2020. Si t > t0 + 2d, bajo el supuesto 3, Nt – d pacientes no pueden viajar, xt tiene una distribución binomial (Nt – Nt – d, p). Sea Xt el número acumulado de casos importados para el día t, entonces

$$ {X}_t=\a suma {limits_{k=1}^t{x}_k\a}sim {mathrm{Binomial}\a la izquierda(\a suma {limits_{k=t-d+1}^t{N}_k,p\a la derecha),{kern0.75em t\a}t0+2d. $$
(3)

De las ecuaciones (2) y (3), \( {X}_t\sim \mathrm{Binomial}left(K\sum \limits_{k=t-d+1}^t{f}_k,p\right) \). La estimación del parámetro \( \hat{K} \) se obtiene maximizando la función de verosimilitud

$$ l(K)=\left(\genfrac{}{0pt}{K\sum \limits_{k=t-d+1}^t{f}_k}{X_t}\right){p}^{X_t}{\left(1-p\right)}^{K\sum \limits_{k=t-d+1}^t{f}_k-{X}_t}. $$
(4)

El límite inferior y superior del intervalo de confianza del 95% \( \left \) son valores tales que la función de distribución acumulativa \( F(K)={suma}_{x=0}^{X_t}l(K) \) es igual a 0,975 y 0,025, respectivamente. La tasa de notificación es el número acumulado notificado de casos en Wuhan en el día t dividido por nuestro número estimado \( \hat{N_t} \). La estimación de la fecha t0 de la primera infección se obtiene resolviendo la ecuación \( {N}_{t_0}=1. \)

La determinación del número de casos importados xt desempeña un papel crucial en el procedimiento de modelización. Tenga en cuenta que no todos los casos tienen registros claros sobre la historia de los viajes o la residencia en Wuhan, tenemos que imputar los valores que faltan. Bajo el supuesto 4, la proporción de casos importados en los pacientes de Ut sin información es la misma que la proporción observada \( \frac{I_k}{I_k+{L}_k} \). Por lo tanto,

$$ {x}_t={I}_t+{U}_t}veces \frac{I_k}{I_k+{L}_k}={T}_k}veces \frac{I_k}{I_k+{L}_k}. $$
(5)

La proporción media diaria de salidas de Wuhan entre el 10 de enero y el 23 de enero de 2020 se calcula como la relación entre el volumen diario de viajeros y la población de Wuhan (14 millones). Se estima que más de 5 millones de personas abandonarán Wuhan debido al Festival de Primavera y a la epidemia . Esta cifra fue mencionada por el alcalde de Wuhan en una conferencia de prensa. Suponemos que estos pasajeros salieron de Wuhan entre el inicio de la fiebre de viajes del Año Nuevo Chino, el 10 de enero de 2020, y el cierre de la ciudad de Wuhan el 23 de enero de 2020. Durante la fiebre de viajes, el 34% de los pasajeros viajaron a través de 300 km . Las principales ciudades fuera de la provincia de Hubei suelen estar a más de 300 km de Wuhan. Esto implicaría que, en promedio, la probabilidad diaria p de viajar desde Wuhan a lugares fuera de la provincia de Hubei sería de 5 × 0,34/14/14 = 0,009. Li et al. estimaron que el periodo medio de incubación de 425 pacientes con COVID-19 fue de 5,2 días (IC del 95%: 4,1-7,0) . El tiempo medio desde el inicio de los síntomas hasta la detección calculado a partir de nuestros datos es de 5,54 días, por lo que elegimos d = d1 + d2 = 11 días. El 29 de enero de 2020 se produjo el máximo recuento de casos importados. Como xt tiene una distribución binomial (Nt – Nt – d, p) con p constante, Nt – Nt – d también alcanza su máximo en t= 29 de enero de 2020. A partir de la función logística (2), tc es el punto medio de t y t – d, es decir \( t-\frac{d}{2}= \) 24 de enero de 2020, que es poco después del cierre de la ciudad de Wuhan . Wu et al. estimaron el tiempo de duplicación de la epidemia en 6,4 días (IC del 95%: 5,8-7,1) a partir del 25 de enero de 2020 . A partir de este resultado, estimamos que \ ( \frac{r}{2}=\frac{dlog {N}_{c}}{dt}=\frac{ln 2}{6,4}=0,1 \frac). Utilizando estos valores para los parámetros p, d, tc, y r, podemos derivar la estimación de máxima verosimilitud \( \hat{K}=51\ 273, \) con un IC del 95%: 49 844-52 734.