Articles

Estimando a tendência diária no tamanho da população infectada pela COVID-19 em Wuhan

A propagação da COVID-19 fora da província de Hubei é relativamente controlada dados os recursos médicos adequados. Usamos o número relatado fora da província de Hubei, pois é uma representação bastante precisa da situação epidêmica real. Neste estudo de modelização, primeiro estimamos a dimensão da epidemia em Wuhan de 10 de Janeiro a 5 de Abril de 2020, com base nos casos confirmados fora da província de Hubei que deixaram Wuhan até 23 de Janeiro de 2020. Uma vez que alguns casos confirmados não têm informação sobre se visitaram Wuhan antes, ajustamos o número de casos importados depois de levarmos em conta estes valores em falta. Em seguida, calculamos a taxa de informação em Wuhan de 20 de Janeiro a 5 de Abril de 2020. Finalmente, estimamos a data em que o primeiro paciente foi infectado.

Dados

Dados recuperados de registos disponíveis publicamente nas comissões de saúde provinciais e municipais na China e nos ministérios da saúde de outros países incluem informação detalhada de 10 940 casos confirmados fora da província de Hubei. Uma tabela adicional nos Materiais Suplementares mostra estes websites com mais detalhes . Informações sobre casos confirmados incluindo região, sexo, idade, data de início dos sintomas, data da confirmação, histórico de viagem ou residência em Wuhan, e data de partida de Wuhan. Apresentamos as características demográficas destes pacientes na Tabela 1. Entre os 7500 pacientes com dados de sexo, 3509 (46,8%) são do sexo feminino. A idade média dos pacientes é de 44,48 anos e a mediana é de 44 anos. O mais jovem paciente confirmado fora da província de Hubei tinha apenas 5 dias de idade enquanto o mais velho tem 97 anos (ver Tabela 1).

Tabela 1 Características demográficas dos pacientes com COVID-19 fora da província de Hubei

Representamos os dados epidemiológicos categorizados pela data de confirmação na Tabela 2. Um caso importado significa um paciente que tinha estado em Wuhan e foi detectado fora da província de Hubei. Um caso local significa um caso confirmado que não tinha estado em Wuhan. Entre o total de 10 940 casos, 6903 (63,1%) têm essa informação epidemiológica. O número de casos importados atingiu seu pico em 29 de janeiro de 2020, e a quarta coluna da Tabela 2 mostra que a proporção de casos importados diminui com o tempo. Isto pode reflectir o efeito das medidas de contenção tomadas na província de Hubei para controlar o surto da COVID-19. Entretanto, a contagem diária de casos locais é superior a 300 de 2 de Fevereiro a 7 de Fevereiro de 2020, o que indica que as infecções entre residentes locais devem ser uma grande preocupação para as autoridades fora da província de Hubei.

Tabela 2 Dados dos pacientes categorizados pela data de confirmação
>

A última coluna da Tabela 2 lista o tempo médio desde o início dos sintomas até à confirmação para os pacientes confirmados em cada dia. A duração mediana de todos os casos é de 5 dias, e a média é de 5,54 dias. Em geral, o período de detecção diminuiu na primeira semana após 20 de janeiro de 2020, mas aumentou desde então. As melhorias na velocidade e capacidade de detecção podem causar o declínio inicial, e o aumento pode ser devido a uma triagem mais completa, levando à detecção de pacientes com sintomas leves que de outra forma não iriam aos hospitais .

Premissas

O método proposto se baseia nas seguintes premissas:

  1. 1)

    Entre 10 de janeiro e 23 de janeiro de 2020, a proporção média diária de afastamento de Wuhan é p.

  2. 2)

    Existe uma janela d = d1 + d2 dias entre infecção e detecção, incluindo um período de incubação d1 dia e um atraso d2 dias desde o início dos sintomas até à detecção.

  3. 3)

    Os doentes não são capazes de viajar d dias após a infecção.

  4. 4)

    A proporção de casos importados nos pacientes sem informação é a mesma que a proporção observada em cada dia.

  5. 5)

    As durações de viagem são suficientemente longas para que um paciente viajante infectado em Wuhan desenvolva sintomas e seja detectado em outros lugares em vez de depois de retornar a Wuhan.

  6. 6)

    Todos os viajantes que deixam Wuhan, incluindo passageiros em transferência, têm o mesmo risco de infecção que os residentes locais.

  7. 7)

    Viagem é independente do risco de exposição à COVID-19 ou do estado de infecção.

  8. 8)

    Recuperações não são consideradas neste método.

Premissas 1-4 são usadas explicitamente na seção Métodos. Elas são suposições fundamentais para o nosso modelo estatístico. Outras suposições também podem afetar o resultado do nosso modelo, e nós fazemos algumas observações sobre nossas suposições.

  1. a)

    10 Janeiro 2020 é o início da corrida de viagens do Ano Novo Chinês, e 23 Janeiro 2020, é a data do fechamento de Wuhan . No total de 10 940 casos, apenas 131 (1,2%) casos da data de partida de Wuhan não estão neste período. Eles são excluídos da nossa análise.

  2. b)

    Se a verdadeira proporção média diária de saída de Wuhan for maior do que a suposta p, esta violação da Assunção 1 poderia levar à sobrestimação do número de casos em Wuhan.

  3. c)

    Se o tempo médio desde a infecção até a detecção for maior do que os dias supostos d, esta violação da Assunção 2 levaria a uma superestimação.

  4. d)

    Se os viajantes tiverem um risco de infecção menor do que os residentes em Wuhan, esta violação da Assunção 6 levaria a uma subestimação.

  5. e)

    Se os indivíduos infectados têm menos probabilidade de viajar devido às condições de saúde, esta violação da Suposição 7 causaria uma subestimação.

No Apêndice A Suplementar, realizamos a análise de sensibilidade sobre o efeito de algumas das violações em nossos resultados.

Notações

Dia t0 denota a data da infecção para o primeiro caso. Que Nt seja o número cumulativo de casos que devem ser confirmados em Wuhan por Dia t. Outras notações do nosso modelo estão definidas na Tabela 3.

>

>
Tabela 3 Notações do nosso modelo

>

Os números Tt, It, e Lt são os dados observados usados no nosso modelo, tc, r, e K são os parâmetros que determinam como Nt muda ao longo do tempo.

Modelo

A tendência de crescimento do tamanho Nt da população infectada é determinada pela seguinte equação diferencial comum:

$$ \frac{d{N}_t}{dt}=\frac{r}{K}{N}_t\ esquerda(K-{N}_t\ direita),\kern0.5em r>0,K>0, $$
(1)

onde K é o tamanho da população que é susceptível à COVID-19 em Wuhan, e r é uma constante que controla a taxa de crescimento do Nt. Esta é a versão modificada do famoso modelo do SIR em epidemiologia. Na equação (1), a taxa de crescimento do Nt é proporcional ao produto do Nt e ao número K – Nt de pessoas que são suscetíveis mas ainda não infectadas. É um modelo razoável para a transmissão da epidemia. No início desta epidemia, quando o Nt é pequeno, as pessoas têm pouco conhecimento da COVID-19, o Nt cresce a uma taxa exponencial r. medida que o Nt se torna maior, medidas de contenção são tomadas para controlá-lo, a taxa de crescimento do Nt abranda, resultando numa curva sigmóide do Nt. Explicações detalhadas do modelo (1) são dadas no Apêndice B Suplementar. O modelo (1) tem uma solução analítica,

$$ {N}_t=\frac{K}{1+{e}^{-r\i(t-{t}_c\i}direita)}=K{f}_t, $$
(2)

where \( {f}_t==\frac{1}{1+{e}^{-r}esquerda(t-{t}_c}_direita)}} \), e a derivada {d{d{n}_t}{dt}) é maximizada em t = tc, {d=frac{r}{2}=frac{d=log {n}_drac{dt_c}} é a taxa de crescimento do logNt no tempo tc, K é um parâmetro a ser estimado.

Estimativa

Usamos dados sobre os casos confirmados que deixaram Wuhan entre 10 de Janeiro e 23 de Janeiro de 2020, para estimar K. Na Assunção 2, os casos infectados no Dia t serão detectados no Dia t + d, portanto o número de casos infectados em Wuhan é Nt + d no Dia t. Se t0 ≤ t ≤ t0 + d, não deve haver casos confirmados. Se t0 + d < t ≤ t0 + 2d, os casos importados no Dia t estão infectados em Wuhan no Dia t – d. Existem casos de Nt infectados em Wuhan no Dia t – d, daí o número de casos importados xt no Dia t seguir uma distribuição binomial (Nt, p), onde p é a probabilidade média diária assumida de deixar Wuhan entre 10 de Janeiro e 23 de Janeiro de 2020. Se t > t0 + 2d, sob Assunção 3, Nt – d os pacientes não podem viajar, xt tem uma distribuição binomial (Nt – Nt – d, p). Que Xt seja o número cumulativo de caixas importadas por Dia t, então

$$ {X}_t=\sum {k=1}^t{x}_k\sim \mathrm{Binomial}}{k=t-d+1}^t{N}_k,p=direita),{kern0,75em tge {t}_0+2d. $$
(3)

Das equações (2) e (3), {X}_t{t}sim {binomial}{binomial}{k=t-d+1}^t{f}_k,p=direita) A estimativa do parâmetro {K} é derivada maximizando a função de probabilidade

$$ l(K)=esquerda(K)=-esquerda(K)=- 0pt}{}{K=sum {k=t-d+1}^t{f}_k}{X_t}\right){p}^{X_t}{\left(1-p\right)}^{K\sum \limits_{k=t-d+1}^t{f}_k-{X}_t}. $$
(4)

Os limites inferior e superior do intervalo de confiança de 95% \( esquerda \) são valores tais que a função de distribuição cumulativa \( F(K)={\sum}_{x=0}^{X_t}l(K) \) é igual a 0,975 e 0,025, respectivamente. A taxa de relato é o número cumulativo de casos relatados em Wuhan no Dia t dividido pelo nosso número estimado \( {N_t} \). A estimativa da data t0 da primeira infecção é obtida pela resolução da equação \( {N}_{t_0}=1. \)

Determinar o número de casos importados xt tem um papel crucial no procedimento de modelagem. Note que nem todos os casos têm registros claros sobre o histórico de viagem ou residência em Wuhan, precisamos imputar os valores em falta. Na Assunção 4, a proporção de casos importados nos pacientes Ut sem informação é a mesma que a proporção observada \( \frac{I_k}{I_k+{L}_k} \). Portanto,

$$ {x}_t={I}_t+{U}_t_______t_______t_______t_______t_______frac{I_k}{I_k+{L}_k}={T}_k_______k_______t={I_k+{L}_k}. $$
(5)

A proporção média diária de saída de Wuhan entre 10 de Janeiro e 23 de Janeiro de 2020 é estimada como a proporção do volume diário de viajantes para a população de Wuhan (14 milhões). Estima-se que mais de 5 milhões de pessoas deixarão Wuhan devido ao Festival da Primavera e à epidemia. Este número é mencionado pelo Presidente da Câmara de Wuhan numa conferência de imprensa. Presumimos que estes passageiros deixaram Wuhan entre o início do Ano Novo Chinês, a 10 de Janeiro de 2020, e o encerramento da cidade de Wuhan, a 23 de Janeiro de 2020. Durante a corrida de viagem, 34% dos passageiros viajaram ao longo de 300 km. As principais cidades fora da província de Hubei estão geralmente a mais de 300 km de Wuhan. Isto implicaria, em média, que a probabilidade p diária de viajar de Wuhan para lugares fora da província de Hubei seria 5 × 0,34/14/14 = 0,009. Li et al. estimaram que o período médio de incubação de 425 pacientes com COVID-19 foi de 5,2 dias (IC 95%: 4,1-7,0) . O tempo médio desde o início dos sintomas até a detecção calculado a partir de nossos dados é de 5,54 dias, portanto escolhemos d = d1 + d2 = 11 dias. Em 29 de janeiro de 2020, houve a contagem máxima de casos importados. Como o xt tem uma distribuição binomial (Nt – Nt – d, p) com constante p, Nt – Nt – d também atinge seu máximo em t= 29 de janeiro de 2020. A partir da função logística (2), tc é o ponto médio de t e t – d, ou seja {d}{2}= \i1} 24 de Janeiro de 2020, que é pouco depois do encerramento da cidade de Wuhan . Wu et al. estimaram o tempo de duplicação da epidemia em 6,4 dias (95% CI: 5,8-7,1) a partir de 25 de Janeiro de 2020 . A partir deste resultado, estimamos que {r}{2}=frac{d}=frac{d}log {n}_{t_c}=frac{n 2}{6,4}=0,1 }). Usando estes valores para os parâmetros p, d, tc e r, podemos obter a estimativa de máxima verosimilhança \( {K}=51\ 273, \) com 95% CI: 49 844-52 734.