Introdução
O coronavírus 2019 (COVID-19) gerou a maior crise sanitária e humanitária do século XXI, impondo um desafio sem precedentes para a saúde pública e a economia mundial,1 suscitando vigilância epidemiológica permanente.2-5 A região Norte do Brasil especialmente, em virtude da complexidade do contexto amazônico, apresentou altas taxas de mortalidade por COVID-19.6 No estado do Pará, até o dia 21 de fevereiro de 2021, foram registrados 355.128 casos da doença e 8.278 óbitos.7,8 O estado do Pará reúne diversas condições capazes de potencializar os impactos da COVID-19, como serviços de saúde deficitários e limitada capacidade de testagem, além da distância geográfica entre a capital e os municípios do interior.9
Para o monitoramento da COVID-19, podem-se utilizar técnicas de inteligência artificial e modelagem matemática, a exemplo das redes neurais artificiais (RNA), as quais apresentam como vantagem uma abordagem prática, matematicamente rigorosa, computacionalmente eficiente e capaz de assimilar as distorções e incertezas oriundas dos dados.10-13 A projeção da prevalência de doenças infecciosas por meio de RNA já é amplamente usada na investigação epidemiológica, tanto para avaliar picos epidêmicos como estimar o tamanho do risco e do alcance de doenças.14-16
O estudo teve como objetivo relatar o produto de pesquisa e extensão universitária denominado ‘Boletim COVID-PA’,17 que apresentou projeções sobre o comportamento da pandemia no estado do Pará.
Métodos
Contexto e coleta de dados
Trata-se de um relato de experiência com dados históricos relacionados à pandemia da COVID-19, coletados no sítio eletrônico da Secretaria de Estado de Saúde Pública do Pará (SESPA) entre 18 de março e 31 de agosto de 2020, período referente à primeira onda da pandemia no estado.7
O estado do Pará, localizado na região Norte do Brasil, ocupa cerca de 1.245.870 km² de extensão territorial e, com uma população estimada de 8.690.745 habitantes, apresenta uma densidade demográfica de 6,07 habitantes por km² e índice de desenvolvimento humano (IDH) de 0,646.18 No Pará, o rendimento mensal domiciliar per capita era de R$ 883,00 até 2010, quando 68,48% da população vivia em área urbana e 31,52% em área rural.19 A SESPA gere as ações de saúde do Sistema Único de Saúde (SUS) em 13 Centros Regionais de Saúde, distribuídos em regiões de saúde em todo o território paraense, com o propósito de descentralizar e regionalizar o atendimento a seus usuários, que era prestado por 2.057 estabelecimentos de saúde pública até 2010.7,18,19
No presente estudo, a coleta dos dados foi semanal. Os dados obtidos foram separados por registro diário, correspondente a cada dia da semana coletada. Para cada região de saúde, os dados coletados somaram 147 dias de observação para a variável ‘casos confirmados’, 161 dias para ‘óbitos’ e 72 dias para a variável ‘quantidade de leitos de unidades de terapia intensiva (UTI) ocupados’.
Os dados foram classificados em variáveis quantitativas e categóricas, conforme descrição a seguir: dia de ocorrência (data, variável categórica), casos acumulados (variável quantitativa), óbitos acumulados (quantitativa), casos diários (quantitativa), óbitos diários (quantitativa), cidade de ocorrência (variável categórica), microrregião (categórica), região de saúde do estado (categórica), região de gestão de leitos de UTI (categórica), densidade demográfica das cidades (quantitativa), leitos de UTI disponíveis (quantitativa), leitos de UTI ocupados (quantitativa), leitos clínicos disponíveis (quantitativa), leitos clínicos ocupados (quantitativa), médicos disponíveis (quantitativa), enfermeiros disponíveis (quantitativa), fisioterapeutas disponíveis (quantitativa) e técnicos de enfermagem disponíveis (quantitativa).
Uma equipe de pesquisadores da Universidade Federal Rural da Amazônia (UFRA) iniciou uma série de pesquisas. A posteriori, a equipe contou com a colaboração de outros pesquisadores, vinculados à Universidade Federal do Oeste do Pará (UFOPA), Universidade Federal do Pará (UFPA) e Universidade do Estado do Pará (UEPA), vindo a formar uma equipe multidisciplinar e interinstitucional. O escopo das pesquisas foi compreender a dinâmica de transmissão e gerar previsões capazes de identificar padrões nos dados observados. Alcançado esse propósito, seria possível fornecer informações confiáveis, que pudessem auxiliar as autoridades de saúde pública na tomada de decisões importantes para mitigar o surto em um ambiente mutável, onde vários fatores influenciam, positiva ou negativamente, a transmissão local e regional.
Uso das RNAs para a geração do Boletim COVID-PA
No presente trabalho, utilizaram-se as RNAs para projetar o número de óbitos e de casos confirmados, acumulados e diários, e a demanda de leitos de UTI nas diversas regiões de saúde do Pará, sendo os resultados sendo compilados semanalmente sob a forma de boletim. A publicação dos boletins teve início com a publicação de um artigo científico de autoria de Castro et al.20, que propôs o método de geração das primeiras projeções, e em seguida, por um artigo publicado por Braga et al.,21 que aprimorou os métodos utilizados neste estudo. O trabalho para a geração dos boletins seguiu os seguintes passos:
Coleta dos dados de casos confirmados, óbitos, recursos hospitalares, além de informações das cidades;
Integração e pré-processamento dos dados, gerando-se a tabela de aprendizado, apta para a execução da técnica de aprendizado de máquina;
Processamento/treinamento e seleção das melhores redes neurais;
Geração das projeções de casos e óbitos, com margem de erro em torno de 10%;
Análise de precisão, resíduos e erro das projeções de casos e óbitos;
Armazenamento das projeções pós-processadas;
Processamento e seleção da melhor rede neural treinada para a ocupação de leitos de UTI;
Geração das projeções da demanda de leitos de UTI, com margem de erro em torno de 10%;
Análise de precisão, resíduos e erro das projeções de ocupação de leitos de UTI;
Armazenamento dos dados gerados;
Compilação e disponibilização do acervo documental da próxima edição do Boletim COVID-PA no sítio eletrônico do projeto,17 e divulgação em mídias sociais.
Nas ciências exatas, o uso de RNAs é comum na análise de fenômenos que necessitam de um processo de identificação de padrões. O ajuste dos diferentes parâmetros, a partir de dados previamente conhecidos, permite que o modelo identifique padrões do problema e expresse, os dados reais, observados posteriormente, com satisfatória precisão. Essa etapa é conhecida como o treinamento do sistema inteligente, que requer extenso poder computacional para o processamento de centenas de RNAs criadas dinamicamente.
As RNAs treinadas foram de tipo multi layer perceptron (MLP), com uma camada oculta.19 O método de Fletcher-Gloss foi utilizado para definir o intervalo de número de neurônios na camada oculta, por meio da seguinte equação,
onde n é a quantidade de variáveis de entrada da rede neural, n 1 é a quantidade de neurônios na camada oculta e n 2 é a quantidade de neurônios na camada de saída.
As funções de ativação testadas foram a exponencial, a identidade, a logística e a tangente hiperbólica. O algoritmo de treinamento utilizado foi o Broyden-Fletcher-Goldfarb-Shanno (BFGS).20,21 Os pesos iniciais das RNAs foram gerados aleatoriamente. A validação das RNAs foi realizada mediante o particionamento aleatório dos dados em dois conjuntos: conjunto de treinamento (80%) e conjunto de validação (20%).
Após a seleção da melhor RNA treinada, iniciou-se a etapa de geração e visualização das projeções e, em seguida, a análise de precisão e erro, para atestar a validade do modelo, utilizando-se a seguinte equação,
sendo R os valores reais observados, P os valores projetados e N o número de observações. Neste artigo, o termo "precisão" é entendido como o quão próximo o valor previsto está do valor observado real, em valores percentuais.
As projeções de recursos hospitalares também foram estimadas neste estudo. A data de ocorrência e os óbitos diários projetados pela melhor RNA foram utilizados como variáveis preditoras, para estimar a demanda por leitos de UTI. Com a informação do número de leitos de UTI, é possível determinar a quantidade de recursos hospitalares22 e profissionais de saúde. Assim, uma RNA exclusiva foi treinada para projetar o número de leitos de UTI necessários para as diversas regiões do Pará, e seus resultados foram comparados com os dados reais de leitos de UTI ocupados. Por fim, essas informações foram armazenadas e usadas para gerar os gráficos e tabelas necessários à elaboração dos boletins COVID-PA.
Publicação dos boletins COVID-PA
Inicialmente, os boletins17 foram publicados a cada sete dias, referentes ao período entre o dia 18 de março de 2020, data do primeiro caso de COVID-19 confirmado no Pará, até 30 de julho de 2020. Subsequentemente, os boletins foram publicados a cada 14 dias, até o período de 31 de julho a 31 de agosto de 2020, data em que foi publicado o último boletim.
É importante relatar que, a partir do terceiro boletim (28/05/2020), a equipe multidisciplinar começou a apresentar as projeções específicas para cada uma das 13 regiões de saúde do Pará. No sexto boletim (19/06/2020), passou-se também a gerar projeções de ocupação de leitos de UTI, em virtude da necessidade de acompanhar essa informação que, no início da pandemia, ainda não era disponibilizada periodicamente. Por fim, no oitavo boletim (06/07/2020), passou-se a publicar as projeções para os 40 municípios mais populosos ou mais próximos das sedes de saúde do estado.
Consequentemente, após a publicação e encaminhamento dos boletins à SESPA, houve indução à resposta operacional de distribuição de recursos hospitalares e de informações para subsidiar medidas de restrição e flexibilização à mobilidade da população. As constatações de que medidas foram tomadas após a publicação dos boletins referem-se aos anúncios de novos leitos em regiões com alta pressão hospitalar, diretamente apontados nas projeções deste estudo, e citações diretas do estudo pelas mídias de divulgação governamentais (amostras de notícias do projeto: https://pastebin.com/embed_iframe/0mqMEQFY).
Esta pesquisa envolveu apenas dados de domínio público, não há identificação de identidade e tampouco envolvimento de seres humanos, pelo que não foi necessária a aprovação de um Comitê de Ética em Pesquisa (CEP).
Resultados
Os números publicados do Boletim COVID-PA indicaram projeções com precisão média de 97% para casos confirmados e de 96% para óbitos, quando comparadas com os dados observados posteriormente (Tabela 1). A projeção da demanda por leitos de UTI ficou próxima do número real de leitos de UTI ocupados, com precisão média igual a 86%. As projeções de mais de 20 dias, geradas no início da pandemia, foram divulgadas em formato de artigo científico20 e apresentaram uma precisão média de 96% e 87% para casos confirmados acumulados e óbitos acumulados, respectivamente.
Pode-se observar que o comportamento das projeções seguiu o número de casos confirmados acumulados (Figura 1a). Uma ocorrência foi observada nas projeções de óbitos acumulados no segundo e no terceiro boletins (Figura 1b): entre os dias 19 e 30 de maio de 2020, o segundo boletim mostrou uma curva exponencial, e o terceiro, um comportamento linear.
O gráfico comparativo das projeções de óbitos diários feitas pela RNA para o estado no Pará, publicado no último boletim, e sua respectiva ocorrência observada, indicam o período do pico do número de óbitos da primeira onda, que coincide, no mês de maio, com o período entre os dias 5 e 20 (Figura 2).
Na Figura 3, observa-se uma constante diminuição na ocupação de leitos (em números absolutos), com um decréscimo linear médio de aproximadamente 3,5 leitos por dia. Além do mais, as projeções das demandas de leitos de UTI, feitas pelas RNAs, acompanharam essa queda.
Trabalho técnico-científico | Data da publicação | Casos confirmados | Óbitos | Ocupação de leitos de UTIa | |
---|---|---|---|---|---|
(%) | (%) | ||||
Artigo científico20 | 30/04/2020 | 96 | 87 | - | |
Boletim 1b | 13/05/2020 | 96 | 94 | - | |
Boletim 2b | 20/05/2020 | 96 | 93 | - | |
Boletim 3b | 28/05/2020 | 94 | 88 | - | |
Boletim 4b | 05/06/2020 | 98 | 96 | - | |
Boletim 5b | 10/06/2020 | 98 | 97 | - | |
Boletim 6b | 18/06/2020 | 98 | 94 | - | |
Boletim 7 | 26/06/2020 | 97 | 98 | 87 | |
Boletim 8 | 06/07/2020 | 99 | 99 | 85 | |
Boletim 9 | 14/07/2020 | 99 | 98 | 91 | |
Boletim 10 | 21/07/2020 | 98 | 98 | 93 | |
Boletim 11c | 31/07/2020 | 98 | 99 | 90 | |
Boletim 12c | 14/08/2020 | 96 | 99 | 62 | |
Boletim 13c,d | 29/08/2020 | - | 99 | 93 | |
Média geral | - | 97 | 96 | 86 |
a) UTI: Unidade de terapia intensiva; b) As projeções da ocupação de leitos de UTI não foram apresentadas porque, inicialmente, esta variável não estava no escopo da pesquisa; c) As projeções foram realizadas para 14 dias, em vez de 7 dias; d) A projeção de casos confirmados não foi gerada, em função da troca da metodologia de testagem de casos confirmados pelo estado do Pará.
Discussão
Neste artigo, é relatada uma abordagem de inteligência artificial aplicada aos dados da pandemia da COVID-19 no estado do Pará, resultando em 13 boletins técnicos que apresentaram projeções confiáveis no curto prazo, com 97% de precisão de acerto para casos confirmados, 96% para óbitos e 86% para ocupação de leitos de UTI. Nos primeiros boletins, a equipe de trabalho focou a geração de projeções para o Pará. À medida que mais dados sobre o vírus foram disponibilizados, percebeu-se a necessidade de acompanhar cada região, pois ficou claro que ocorriam diferentes cenários epidemiológicos no estado.
O terceiro e o quarto boletins, publicados no fim de maio e no início de junho, respectivamente, indicaram uma incipiente queda na curva de óbitos e casos diários. Vários fatores podem ter contribuído para esse fato, tais como as políticas governamentais (por exemplo: implantação de clínicas itinerantes, com distribuição de máscaras e medicamentos complementares), medidas de higiene adotadas e suspensão de fluxo de pessoas.23 O novo comportamento da população em relação à proteção contra o vírus e o conhecimento adquirido pelas equipes de saúde quanto ao manejo dos casos de COVID-19, observados no final do mês de abril e nos primeiros dias de maio, também poderiam explicar essa redução. Vale destacar que, enquanto algumas regiões do Pará já mostravam estabilização dos casos de COVID-19 (por exemplo, a Região Metropolitana de Belém), outras alcançavam seu pico epidêmico (Baixo Amazonas, Tapajós e Araguaia), indicando a necessidade de realocação de recursos hospitalares de uma região estável para outra com alta demanda por atendimento, ao longo do ano de 2020.
Observa-se que, no penúltimo boletim, COVID-PA no 12, houve uma queda percentual para 62% de precisão, sobre a projeção da demanda de leitos de UTI, provável resultado da mudança na metodologia de testagem da COVID-19 - de molecular para sorológica - no período de 31 de julho a 17 de agosto de 2020. Essa mudança pode ter influenciado na precisão dos dados apresentados no boletim de no 12. Por conseguinte, a variável de entrada ‘casos confirmados’ foi retirada do modelo de RNA, fazendo com que a precisão da projeção aumentasse para 93% de acordo com o último boletim publicado (COVID-PA no 13).
O número de leitos de UTI disponibilizados mantinha-se superior a sua ocupação de fato, e superior à projeção de demanda de leitos apontada pelos boletins. Paralelamente, a oferta de leitos de UTI começou a cair a partir do mês de agosto, provavelmente devido ao encerramento de atividades em hospitais de campanha para pacientes com COVID-19 na rede pública, acompanhando a queda no número de casos e de óbitos.
A técnica de redes neurais artificiais suporta um número elevado de dados, modelando as incertezas associadas às projeções. Diversos estudos aplicaram a mesma técnica durante a pandemia, com o objetivo de projetar a prevalência e identificar a sazonalidade da doença.24-26 Dessa forma considerando-se a transmissibilidade do SARS-CoV-2, torna-se necessária a observação periódica do aumento substancial da capacidade de leitos de UTI, para um rápido isolamento de doentes,27 mediante iniciativas que já foram executadas e relatadas, com base em dados históricos.28,29 Essa estrutura quantitativa, em escala espacial e temporal, fornece informações úteis para avaliar o impacto das intervenções de controle, e de como as mudanças de comportamento afetam a dinâmica da transmissão.13,30
Os dados utilizados na fase de treinamento resultam em uma dependência do modelo aos dados coletados, dados estes provenientes de fontes secundárias, compostas por casos confirmados, óbitos e leitos de UTI. Tal condição implica ajuste periódico dos parâmetros do modelo. No entanto, as projeções realizadas ao longo do tempo, posteriormente avaliadas, demonstraram que essa limitação não alterou significativamente os resultados do presente estudo.
As projeções de curto prazo, com suporte das RNAs, cumpriram a função de antever o comportamento de surtos epidemiológicos, auxiliando na prevenção de colapsos no sistema de saúde do estado do Pará, no ano de 2020, especialmente na realocação de leitos hospitalares, cuja eficiência ajudou na tomada de decisão dos gestores públicos, além de informar a sociedade sobre o comportamento epidemiológico da doença. Finalmente, os boletins COVID-PA, produzidos pela presente pesquisa de extensão universitária, indicam que parcerias entre as universidades, a vigilância de saúde e a gestão estadual são fundamentais para a produção de informações relevantes, em um período crítico de pandemia, contribuindo para a preservação das vidas na capital e no interior do Pará.