Introdução
O Sistema de Informação de Agravos de Notificação (Sinan) foi implantado no Brasil em 1993 e regulamentado em 1998, tornando-se obrigatória a alimentação regular da base de dados nacional pelos municípios, estados e Distrito Federal.1
O Sinan, principal base para o funcionamento do sistema de vigilância epidemiológica de doenças transmissíveis, foi concebido para dimensionar a magnitude de uma determinada doença, detectar surtos e epidemias e elaborar hipóteses epidemiológicas a serem testadas em estudos epidemiológicos específicos e, ademais, ser utilizado como um importante instrumento para o planejamento das ações de saúde.1
Entretanto, o Sinan possui uma característica que o diferencia dos demais sistemas de informações em saúde (SIS): a notificação do agravo deve ser remetida o mais breve possível, seguindo um processo dinâmico, variável em função do perfil epidemiológico, ações de controle e geração de conhecimento científico e tecnológico.2 Críticas à qualidade dos dados são realizadas durante análise de rotina de qualidade, efetuada nos diversos níveis, diferentemente dos demais SIS, em que essas críticas ocorrem antes do envio a qualquer nível governamental.2
Mesmo com versões aprimoradas, a natureza dinâmica das notificações no Sinan permite que o sistema apresente recorrentes problemas de qualidade dos dados. Os fatores que contribuem para tal cenário referem-se a falhas na coleta de dados pelos profissionais responsáveis, provocando ausência de dados epidemiológicos e clínicos, volume expressivo de campos a serem preenchidos, além da ausência de retroalimentação do sistema, com redistribuição dos casos segundo o local de residência dos pacientes.2-4
Sistemas de informações padronizados e confiáveis são essenciais para o monitoramento de qualidade e cobertura de serviços de saúde.5 A qualidade de um SIS depende diretamente da qualidade dos dados, característica que pode ser comprometida quando os formulários não são adequadamente preenchidos ou há lacunas em sua produção e gerenciamento.
As dimensões da qualidade de um SIS compreendem sua acessibilidade, clareza metodológica, cobertura, completitude, confiabilidade, consistência, não duplicidade, oportunidade e validade.6 Duplicidade, cobertura, completitude e confiabilidade são atributos relacionados à acurácia das informações.7 Especificamente sobre registros repetidos (nomeados como duplicidades), a falta de correção é um obstáculo à qualidade dos dados de notificação, podendo gerar superestimação dos coeficientes de incidência e de prevalência da doença. A replicação indevida de registros (duplicidade) em um SIS acontece quando (i) o mesmo indivíduo foi notificado mais de uma vez pela mesma unidade ou outro estabelecimento de saúde, para o mesmo agravo - caso de agravo agudo -, no mesmo período de tempo entre os primeiros sintomas e o início dos sinais/sintomas servidos de base do diagnóstico estabelecido, ou quando (ii) o mesmo paciente foi notificado mais de uma vez pela mesma unidade de saúde durante seu tratamento - caso de doença crônica.8
Mesmo que os registros repetidos afetem a qualidade de um sistema de informações em saúde, o tema ainda carece de maior atenção na literatura nacional e internacional, evidenciando-se uma lacuna na pesquisa sobre a qualidade desses sistemas. O objetivo deste estudo foi descrever a proporção de registros repetidos no Sistema de Informação de Agravos de Notificação - Sinan - no Brasil, em 2008 e 2009.
Métodos
Foi realizado estudo ecológico descritivo, incluindo-se todos os casos de dengue, hanseníase, leishmaniose visceral (LV) e leishmaniose tegumentar americana (LTA), meningites e tuberculose notificados ao Sinan, no Brasil, no período de janeiro de 2008 a dezembro de 2009.
O Sinan nacional possui uma lista de 45 doenças de notificação compulsória.9 O sistema permite que um mesmo indivíduo seja notificado mais de uma vez naquelas doenças que não conferem imunidade permanente. Por essa razão, neste estudo, a presença do termo 'duplicidade indevida' refere a notificação de 'caso novo/confirmado' de um mesmo indivíduo no período de acompanhamento do episódio específico do agravo e/ou antes do encerramento do caso, seja por óbito, transferência, recidiva, reingresso ou descarte.
A seleção das doenças circunscreveu-se às infecciosas e parasitárias consideradas na estimação dos Anos de Vida Perdidos Ajustados à Incapacidade (Disability-Adjusted Life Year [DALY]) realizada pelo projeto de pesquisa 'Carga de Doença no Brasil, 2008',10 que classificou os agravos em três grandes grupos: I - Doenças infecciosas e parasitárias, condições maternas, perinatais e deficiências nutricionais; II - Doenças não transmissíveis; e III - Causas externas.
Os critérios de seleção dos casos acompanharam os critérios do Ministério da Saúde:8 para LTA, tuberculose e hanseníase, consideraram-se os casos novos, e para LV, os casos novos e confirmados; para as meningites, foram considerados os casos confirmados; e para dengue, abarcou-se as notificações de dengue hemorrágica, clássica, dengue com complicações e síndrome de choque da dengue, classificação vigente à época do estudo. Portanto, excluíram-se os casos descartados, as recidivas, os reingressos e as transferências.
Previamente à identificação de registros repetidos, foi feita a checagem da incompletude de variáveis sobre as quais se julgaram a replicação ou não dos registros. Dada a importância do 'nome do paciente', realizou-se análise de qualidade do preenchimento desse campo quanto ao aspecto de legibilidade, e posterior correção, se necessária, com base no campo 'fonética' (referente ao primeiro e ao último nome do paciente).
A identificação de registros repetidos foi realizada pelo aplicativo Reclink III, para cada agravo separadamente. Todos os procedimentos basearam-se no método proposto por Camargo Jr. e Coeli.11 As etapas seguiram a eliminação de (a) caracteres especiais (()/',.;:-¤\°`!@#$%&*+/?\=[]"_^<>), (b) espaços duplos e (c) todos os acentos. Foram transformados todos os caracteres para letras maiúsculas e criadas novas variáveis, denominadas PBLOCO e UBLOCO, caracterizadas como campos de blocagem, constituídas, respectivamente, com o primeiro e último nome do paciente.
Após a padronização, o banco de dados foi reduzido aos campos necessários para análise dos registros repetidos: nome do paciente; nome da mãe; data de nascimento; sexo; município de residência; PBLOCO e UBLOCO. Nesse banco de dados, a pesquisa de duplicidade foi repetida em cinco passos, utilizando-se de combinações diferentes dos campos, a saber: (1) PBLOCO, UBLOCO e sexo; (2) PBLOCO e sexo; (3) UBLOCO e sexo; (4) PBLOCO e UBLOCO; (5) data de nascimento e sexo.11 Para cada passo, o Reclink III gerou uma variável chamada 'único', campo de sequência numérica que permite identificar as repetições. Em cada etapa, esse campo único foi associado ao banco de dados original.
Com o banco de dados original, já com a indexação do campo único, foi realizada inspeção manual dos registros utilizando-se o nome do paciente, nome da mãe, data de nascimento, sexo, município de residência, datas de diagnóstico e sintomas, datas de notificação e de tratamento.
Foram considerados os seguintes parâmetros:11 nome completo do paciente com probabilidade de par verdadeiro positivo = 98,0%, probabilidade de par falso positivo = 1,0% e limiar = 85,0%; nome completo da mãe do paciente com probabilidade de par verdadeiro positivo de 74,0%, probabilidade de par falso positivo = 4,0% e limiar = 85,0%; e data de nascimento do paciente com probabilidade de par verdadeiro positivo = 98,0%, probabilidade de par falso positivo = 2,0% e limiar = 65,0%. Em todos os 5 passos, o escore mínimo utilizado foi de 9,6 - valor indicado por ser bastante específico.12
Os percentuais de registros repetidos foram calculados segundo estados e macrorregiões. Com o propósito de investigar o impacto do porte populacional na geração de registros repetidos, os municípios foram divididos em três categorias: pequeno porte (menos de 50.000 hab.), porte intermediário (50.000 a 99.999 hab.) e grande porte (100.000 hab. e mais). Verificou-se a associação entre a proporção dos registros repetidos e o porte populacional por meio do teste do qui-quadrado de Pearson, com nível de significância de 5,0%.
Os softwares utilizados foram o Reclink III, para identificação dos registros repetidos, o SPSS 17.0, para inspeção manual dos registros, correção do nome do paciente e aplicação da metodologia de Camargo Jr e Coeli,11 e o R 3.0.2, para elaboração de um gráfico de tipo mosaic plot.
Os dados foram obtidos na Gerência Nacional do Sinan, da Secretaria de Vigilância em Saúde, Departamento de Vigilância em Saúde do Ministério da Saúde, após assinatura do Termo de Concessão e Confidencialidade pela coordenação do projeto do estudo 'Carga de Doença no Brasil, 2008' e subsequente aprovação pelo Comitê de Ética em Pesquisa da Escola Nacional de Saúde Pública Sérgio Arouca (ENSP)/Fundação Instituto Oswaldo Cruz (Fiocruz) - CAAE: 0054.0.031.000-11 -, nos termos da Resolução do Conselho Nacional de Saúde (CNS) nº 196, de 10 de outubro de 1996, em vigor à época do estudo.
Resultados
Os casos notificados no Sinan, para cada agravo, e seus critérios de seleção encontram-se na Figura 1. A leishmaniose visceral - LV - teve a menor participação proporcional de casos (42%), seguida da dengue (48%), enquanto as maiores proporções corresponderam à leishmaniose tegumentar americana - LTV - (94%) e à tuberculose (83%). O agravo com maior número absoluto de notificações foi a dengue (1.522.530). A LV teve o menor número de casos (18.541).
A Tabela 1 apresenta os percentuais de incompletude dos campos utilizados na pesquisa de registros repetidos e de correção no preenchimento do nome do paciente. De modo geral, os campos apresentaram excelente completitude, à exceção do nome da mãe do paciente de dengue (11,8%) e do nome do bairro de residência dos casos de LTA (33,8%). Ressalta-se a importante estratégia utilizada para a correção do nome do paciente, de recorrer à fonética, permitindo a recuperação de 13,5% de casos para LV, a despeito de ter permanecido um pequeno percentual de nomes ilegíveis, sem possibilidade de correção, correspondente a 0,9% dos casos desse agravo.
a) Correção com base na fonética do nome
Nota: x = variáveis não incluídas no banco de dados da doença
A distribuição dos percentuais de casos repetidos - por estado e macrorregião - está apresentada na Tabela 2. No Brasil, as maiores proporções desses casos foram para LV (5,3%) e meningites (3,6%). Nas macrorregiões Norte e Nordeste, as meningites atingiram proporções (5,2% e 5,7%, respectivamente) similares à encontrada para LV. Na observância por estados, aquele que apresentou maior proporção de casos de LV repetidos, na comparação com a média nacional, foi o Pará (10,7%); para LTA, o Mato Grosso do Sul (4,4%); para tuberculose, o Piauí (4,1%); para dengue, Espírito Santo (2,4%); para meningites, Rondônia (9,6%); e para hanseníase, o Rio Grande do Norte (5,1%).
Quanto à variabilidade na proporção de repetições por doença segundo macrorregiões, verificou-se maior concentração no Nordeste, para hanseníase (56,6%) (mosaic plot da Figura 2). Em relação à LTA, as maiores proporções corresponderam ao Norte (46,4%), e em relação à dengue, ao Sudeste (37,0%). No Sul essa proporção, quando mais elevada, foi encontrada para a tuberculose (17,1%). O Centro-Oeste apresentou 24,6% de notificações indevidas para dengue.
A Tabela 3 apresenta a distribuição proporcional dos registros repetidos segundo o porte populacional do município. À exceção da dengue, observou-se um gradiente na proporção de registros repetidos inversamente proporcional ao porte populacional: municípios com maior concentração populacional apresentaram menor percentual de notificação repetida, enquanto municípios com menor porte apresentaram maior percentual de notificação repetida. A amplitude de variação da proporção de registros repetidos por porte populacional alcançou valores desde 7,1% para LV em municípios com menos de 50.000 hab. até 2,9% para meningites em municípios com mais de 100.000 hab.
A diferença entre as proporções de registros repetidos e portes populacionais dos municípios só não apresentou resultado significativo para LTA: p-valor = 0,070 (Tabela 3).
Afinal, o percentual de notificações repetidas de LV, tuberculose, meningites e hanseníase foi significativamente menor nos municipios de maior porte populacional. Para dengue, com já foi dito, observou-se o inverso: maiores proporções de notificações repetidas nos municípios de maior porte.
Discussão
Em uma breve síntese dos principais resultados do presente estudo, destacam-se a leishmaniose e as meningites com as maiores proporções de notificações repetidas, e a hanseníase como o agravo com menor proporção de duplicidade. Os estados que apresentaram as maiores proporções de repetições, para mais de uma doença, foram Rio Grande do Norte, Rio de Janeiro e Goiás. A macrorregião Nordeste teve a maior concentração de proporção de registros repetidos, em quatro das seis doenças analisadas. À exceção da dengue, observou-se que os municípios com maior concentração populacional apresentaram menor percentual de notificação repetida, e municípios de menor porte, maior percentual dessas repetições.
Para todos os agravos analisados, alguns campos utilizados na avaliação de registros repetidos apresentaram alta completude, principalmente quanto ao nome do paciente, data de notificação, data de diagnóstico, data dos primeiros sintomas, sexo e município de residência. Entretanto, a avaliação da qualidade de preenchimento do nome do paciente mostrou que esse campo foi corrigido para todos os agravos, evidenciando o comprometimento da qualidade das informações disponibilizadas ao usuário dessa base de dados.
Dentre as doenças analisadas, a hanseníase foi a que apresentou maior percentual de impossibilidade de acesso à informação sobre o nome do paciente. Problemas relativos à qualidade da informação de dados demográficos e socioeconômicos desse agravo também foram ressaltados por estudo realizado em Pernambuco.13
No presente estudo, a LV foi identificada como a doença com menor qualidade de preenchimento do nome do paciente: praticamente 14,0% dos casos não tinha o nome legível. Questões relacionadas à qualidade da informação do Sinan para LV foram abordadas por um estudo sobre subnotificação do agravo14 e, ainda que a duplicidade não tenha sido o foco principal da referida pesquisa, seus resultados apontaram a necessidade de melhorias na qualidade das notificações: alguns casos não foram avaliados devido a registros sem preenchimento ou ignorados.
Concernente à LTA, o percentual de 2,0% encontrado aqui foi inferior ao de 3,7% reportado para Mato Grosso do Sul, segundo estudo de Piovesan.15
Uma avaliação da qualidade de informação no Sinan relativa à dengue,16 de 2010, encontrou completude excelente nos campos de preenchimento obrigatório, embora não avaliasse a qualidade do preenchimento dos dados. No tocante à duplicidade, o mesmo estudo não encontrou registros repetidos, em função, provavelmente, de a análise ter-se restringido a um único município.
Outra pesquisa cujo objetivo foi avaliar a qualidade e oportunidade da notificação de dengue no Sinan, esta desenvolvida no Paraná entre 2011 e 2013, encontrou registros duplicados na ordem de 0,3% no período 2011-2012 e de 0,6% no período 2012-2013.17 Entre as possíveis explicações para valores, apontou-se uma epidemia ocorrida nos anos estudados, além de deficiências na rotina de trabalho dos profissionais responsáveis pelas notificações.
A qualidade da informação sobre dengue no Sinan foi motivo de um estudo sobre confiabilidade do diagnóstico final na epidemia de 2001-2002, no município do Rio de Janeiro.18 Entre seus achados, observou-se a presença de altos percentuais de registros ignorados em grande parte dos campos de preenchimento, inclusive aqueles relativos ao diagnóstico da doença.
Aperfeiçoamentos promovidos entre as versões Sinan-Windows e Sinan-Net contribuíram para a melhoria da qualidade das notificações de dengue, principalmente nos campos de identificação do paciente;19 contudo, o percentual de 1,4% de duplicidades encontrado no estudo em tela evidencia a persistência de problemas na qualidade da informação.
Bierrenbach e colaboradores,20 ao avaliarem o impacto de registros repetidos nas estimativas de prevalência de tuberculose, observaram 22,7% de notificações duplicadas no período de 2001 a 2007; ao excluí-las, a taxa de incidência viu-se reduzida em 4,0% (2001) e 5,5% (2007). No presente trabalho, a incidência de tuberculose apresentou 1,7% dos registros repetidos. Certamente, cabe aqui ressaltar as diferenças metodológicas entre ambos estudos: Bierrenbach e cols.20 analisaram casos prevalentes, ao passo que neste estudo, foram considerados somente os casos incidentes. A existência de registros repetidos para tuberculose sugere que as rotinas de análise de duplicidades ainda não são realizadas adequadamente.21
A meningite foi o segundo agravo com maior percentual de duplicidades: 3,6%. Um estudo avaliativo do Sinan para meningite, realizado no município de São Paulo de 2006 a 2008, encontrou percentuais de duplicidades da ordem de 5,7% (2006) e 5,9% (2008).22 Em contrapartida, outro estudo, este para avaliar a confiabilidade do diagnóstico final das meningites em Belém no ano de 2009, não encontrou duplicidades de registros no Sinan.23 Ressalta-se, porém, que este último trabalho analisou apenas casos cuja notificação ocorreu no mesmo município de residência do paciente.
A literatura sobre impactos na remoção de registros repetidos é incipiente, provavelmente devido ao fato de a etapa de remoção caracterizar-se mais como um item de processo que de resultados em si. Lima e cols.6 apontaram que a dimensão 'não duplicidade' somente foi contemplada em 4,0% dos estudos de análise de qualidade da informação.
Os estudos supracitados pressupõem que o nível de agregação das bases de dados (Brasil, estados ou município) pode influenciar os registros repetidos no Sinan. As rotinas de verificação de duplicidades encontram-se implementadas no sistema; porém, o fato de ainda existir duplicidades na base nacional evidencia que as medidas corretivas, visando à exclusão dos registros nos níveis municipal e estadual, podem não estar a ser devidamente aplicadas; ou não há capacitação profissional para essa tarefa.20
Mesmo que o Sinan seja objeto de constante aperfeiçoamento, as deficiências observadas na qualidade dos dados, decorrentes de lacunas no processo de preenchimento das informações, nos recursos computacionais e na capacitação profissional, permanecem como um desafio para gestores e usuários.4,24,25
Destaca-se, ademais a ausência de orientação técnica para operacionalização do procedimento nas situações de notificação de um caso por um município e investigação/confirmação por outro que já o notificara - o que se passa a nomear aqui como 'invasão de território'. Nesse sentido, compete à União, estados e municípios:
[...] avaliar regularidade, completude, consistência e integridade dos dados e duplicidade de registros, efetuando os procedimentos definidos como de responsabilidade do seu nível, para a manutenção da qualidade da base de dados.1
A exclusão de registro deve ser efetuada no primeiro nível informatizado, ou seja, onde a ficha foi inicialmente digitada.
Percebe-se que o problema de 'invasão de território' persiste, mesmo após a implementação do Sinan-NET. A instância autorizada a corrigir os registros repetidos não tem acesso à informação de 'invasão de território', detectada apenas em um nível superior de agregação do dado (estado; União) que não tem autorização para corrigi-lo na fonte que o originou.13
Vê-se a existência de um problema de fluxo entre esferas de gestão, ainda não solucionado, aliado à deficiência de recursos humanos qualificados, o que pode justificar, parcialmente, a existência de registros repetidos encontrada por este estudo. É possível que os registros repetidos decorram desses fatores relacionados ao gerenciamento e operacionalização do Sinan.26,27
A avaliação dos municípios por porte populacional foi realizada para verificar a hipótese de a ocorrência das duplicidades ser maior nos municípios de menor porte, supostamente com insuficiência de recursos humanos capacitados e equipamentos compatíveis para conduzir a implementação e gerenciar os sistemas de informações em saúde. Os resultados apresentados confirmaram essa hipótese: encontrou-se um gradiente inversamente progressivo, entre a concentração populacional dos municípios e seu percentual de notificação repetida.
Dengue foi a única doença cuja proporção de registros repetidos aumentou conforme o crescimento do porte populacional. Este cenário pode, em parte, ser explicado pela ordem de grandeza do agravo em termos endêmicos - cerca de 1 milhão e meio de notificações entre 2008 e 2009 -, como também pela maior proporção de casos notificados em municípios de grande porte do país: em 2008, cerca de 33,0% do total de notificações deu-se em municípios com até 50.000 hab., 12,0% em municípios de 50.000 a 100.000 mil hab. e 55,0% naqueles com mais de 100.000 hab.28 Em São Paulo, no período de 2007-2008, a proporção de municípios com dengue aumentou progressivamente, acompanhando o porte populacional.15 Outrossim, municípios de grande porte não dispõem de estrutura adequada a seu tamanho populacional para combate ao vetor; esta situação relaciona-se, também, ao sistema de vigilância epidemiológica da dengue, não integrado ao sistema de vigilância entomológica.19
Têm-se empreendido esforços pela constante melhoria da qualidade do Sinan, principalmente na questão de registros repetidos. O chamado Fluxo de Retorno, criado em 2007 e reformulado recentemente, foi desenvolvido como uma funcionalidade do Sinan, com a intenção de complementar o processo de apoio à investigação e análise da vigilância epidemiológica.29 O objetivo principal do Fluxo de Retorno é enviar dados sobre notificações de pacientes fora do seu município de residência, fazendo com que as unidades notificantes investiguem o caso e o encaminhem ao banco de dados nacional como um único registro.
Deve-se considerar uma importante limitação do método aplicado nesta análise: a possibilidade de que registros repetidos não tenham sido detectados pelo aplicativo RecLink III. Observou-se baixa qualidade na informação dos campos referentes ao nome da mãe do paciente (não corrigido) e datas, evidenciada em caracteres incompreensíveis e dados faltantes.
Também é mister citar outros fatores limitantes, capazes de comprometer as estimativas de parâmetros clínico-epidemiológicos: a subnotificação dos pacientes que sequer chegam a acessar o serviço de saúde, o sub-registro dos que o acessam, bem como a falta de completude dos campos daqueles que são registrados.
A avaliação da qualidade da informação em saúde é um importante item de subsídio ao planejamento e gestão de recursos, além de fundamentar medidas de proteção e promoção da saúde. Assim, faz-se necessário o preenchimento das lacunas existentes quanto à qualidade dos registros. O não monitoramento do processo de notificação configura perda de oportunidade para avaliar a gravidade de uma doença ou agravo, o retardo na detecção de casos e, consequentemente, no início do tratamento, acarretando possível prejuízo para sua efetividade.