Introdução
Tuberculose e diabetes são problemas de Saúde Pública de grande relevância. O risco de uma pessoa com diabetes desenvolver tuberculose pode representar de 2,44 a 8,33 vezes o mesmo risco para uma pessoa sem diabetes.1 Todavia não foi encontrada explicação sobre a maior ocorrência da infecção pelo bacilo de Koch, causador da tuberculose, entre diabéticos. A comorbidade tuberculose-diabetes requer atenção e cuidados mais complexos, uma vez que a diabetes pode interferir no metabolismo dos fármacos antituberculose.2
A tuberculose é um agravo de notificação compulsória. As principais medidas para o controle da doença e interrupção de sua cadeia de transmissão são o diagnóstico e o tratamento correto e oportuno dos casos de tuberculose pulmonar.3,4
Em 2014, em todo o mundo, foram estimadas 9,6 milhões de pessoas com tuberculose: 5,4 milhões de homens, 3,2 milhões de mulheres e 1 milhão de crianças. Entretanto, cerca de 6 milhões de casos novos da doença - menos de dois terços (62,5%) - foram notificados à Organização Mundial da Saúde (OMS), indicando que 37,5% dos casos não foram diagnosticados ou não foram registrados. Para o mesmo ano de 2014, foram estimadas 1,5 milhões de mortes por tuberculose.5
De acordo com a OMS, em 2015, o Brasil foi um dos 22 países que concentraram 80% da carga mundial de tuberculose, ocupando a 18ª posição em número absoluto de casos novos e a 22ª em relação ao coeficiente de incidência.5 Segundo o Ministério da Saúde, de 2003 a 2012, a taxa de incidência da tuberculose apresentou declínio de 38,7%; e a taxa de mortalidade, redução de 33,6%.6,7
O crescimento no número de pessoas com diabetes no mundo, de 171 milhões de casos em 2000 para uma estimativa de 440 milhões em 2030, pode representar um fator adicional a dificultar o controle da tuberculose.2
Em 2012, entre os países da América Central e do Sul, a prevalência de diabetes foi estimada em 26,4 milhões de pessoas, sendo projetada para 40 milhões em 2030. No Brasil, a prevalência de diabetes foi estimada em 4,6% no ano 2000 (8ª posição entre os referidos países). A estimativa para 2030 aponta uma prevalência de 11,3% (6ª posição) em 2030.8,9
No Brasil, os casos de tuberculose são registrados no Sistema de Informação de Agravos de Notificação (Sinan). O cadastramento e o acompanhamento das pessoas com diabetes no Sistema Único de Saúde (SUS) eram feitos no Sistema de Gestão Clínica de Hipertensão Arterial e Diabetes Mellitus da Atenção Básica (Hiperdia), até 2013. A partir de então, o Hiperdia foi substituído pelo e-SUS Atenção Básica (AB), ou e-SUS AB: um processo de informatização qualificada, estratégia do Departamento de Atenção Básica, da Secretaria de Atenção à Saúde do Ministério da Saúde, para reestruturar as informações da Atenção Básica oferecida pelo Sistema Único de Saúde (SUS).10-14
A crescente disponibilidade de sistemas informatizados capazes de armazenar dados de abrangência nacional requer a utilização de metodologias que relacionem esses dados de forma a obter bases mais robustas para análises epidemiológicas.15,16 A ausência de um identificador unívoco nas bases de dados para associar registros dos diferentes sistemas de informações em saúde existentes representa um desafio adicional.
Visando garantir a qualidade das fontes de registro que auxiliam a vigilância da tuberculose, o entre bases de dados justifica-se pela qualificação das informações de forma não onerosa e com baixo custo operacional, possibilitando detectar casos identificados por outros sistemas, embora não captados pela vigilância da doença.17-19
Este estudo objetivou descrever o perfil dos casos de comorbidade tuberculose-diabetes no Brasil, no período de 2007 a 2011.
Métodos
Foi realizado estudo descritivo com dados dos casos de comorbidade tuberculose-diabetes no Brasil, obtidos a partir do relacionamento probabilístico das bases de dados do Sinan referentes às notificações por tuberculose (Sinan-tuberculose), e do Hiperdia, referente aos registros de casos por diabetes. A base de dados do Sinan-tuberculose considerou os casos notificados de 1o/1/2001 até 31/12/2012, e a base de dados do Hiperdia, de 1o/1/2007 a 31/12/2011.
O Sinan-tuberculose é alimentado pela Ficha de Notificação/Investigação de Tuberculose, que contempla informações obtidas do caso, seu local de residência, a situação clínica e a classificação de acordo com seu tipo de entrada, entre outras. Para fins de vigilância epidemiológica, o Programa Nacional de Controle da Tuberculose definiu como caso notificado no Sinan-tuberculose somente o caso confirmado da doença.20
O Hiperdia era utilizado para cadastramento e acompanhamento das pessoas com diabetes e/ou hipertensão atendidas na rede ambulatorial do SUS. Criado em 2002, o sistema permitia gerar informações que subsidiassem a aquisição, dispensação e distribuição de medicamentos para os cadastrados, além de contribuir para o planejamento eficaz de prevenção e controle de complicações nos indivíduos já diagnosticados com a doença.10-13 O registro com entrada única da pessoa diagnosticada com diabetes no Hiperdia possibilitava sua identificação e vinculação às unidades de saúde ou equipes da Atenção Básica do SUS, que registravam os dados, permitindo a geração de informações sobre o desempenho e os resultados clínicos durante o acompanhamento.21
De acordo com a Portaria Conjunta nº 2 das Secretarias de Vigilância em Saúde e Executiva do Ministério da Saúde, de 5 de março de 2002, em seu art. 5º, o gestor municipal, para integrar o Programa Nacional de Assistência Farmacêutica para Hipertensão Arterial e Diabetes Mellitus, deveria assinar um Termo de Adesão responsabilizando-se por integrar o programa de assistência farmacêutica, cadastrar e acompanhar as pessoas com essas doenças no Hiperdia, de forma a assegurar aos cadastrados o recebimento dos medicamentos padronizados prescritos.22
A alimentação da base de dados nacional do Hiperdia, a cargo dos municípios que aderiram ao Programa de Assistência Farmacêutica à Hipertensão Arterial e à Diabetes Mellitus, era feita via cadastramento dos usuários no Subsistema Centralizador Municipal do sistema ou mediante a exportação de dados de aplicativo próprio.13,23
Na fase de pareamento, para reduzir possíveis erros, realizou-se uma preparação prévia das bases com a exclusão de registros duplicados e a padronização (aplicação da mesma grafia para as primeiras sílabas de nomes com a mesma fonética) e codificação dos campos. Para melhorar a qualidade de campos de ‘nome’ utilizados no processo, foi necessária a remoção de informações ou caracteres, tais como &, #, @, entre outros equivocadamente adicionados ao nome da pessoa.
Visando obter uma base conjunta, contemplando os casos de tuberculose e diabetes, e diminuir o número de comparações entre os registros, foram utilizados, em ambas as bases, procedimentos probabilísticos estabelecidos pelo programa Reclink versão 3.1.6.3160, empregando-se campos comuns para verificar se os registros pareados pertenciam ao mesmo indivíduo. Foram adotadas as seguintes rotinas para a padronização dos campos comuns: (i) comparação de ‘nome da pessoa’, ‘nome da mãe’ e ‘data de nascimento’, e aplicação de algoritmos para comparação aproximada de cadeias de caracteres, com o objetivo de contornar erros fonéticos e de grafia; (ii) blocagem, dividindo-se as bases em blocos mutuamente exclusivos, com comparações restritas aos registros de um mesmo bloco e otimização da comparação entre registros; (iii) cálculo de escores, para indicar o grau de concordância entre registros de um mesmo par; e (iv) definição de limiares para classificação dos pares de registros e sua identificação como verdadeiros ou não pares.24,25
Os procedimentos probabilísticos também foram aplicados na identificação de possíveis duplicidades na base de dados do Hiperdia. A rotina de remoção de duplicidade não foi aplicada na base do Sinan-tuberculose, porque foi feita pelo Programa Nacional de Controle da Tuberculose previamente à cessão dos dados.
Para agilizar o processamento dos bancos, utilizou-se a blocagem em múltiplos passos, uma vez que os bancos somavam mais de 1.000.000 (1 milhão) de registros e os computadores utilizados não dispunham de memória e velocidade suficientes para o processamento de tantos dados. Assim, foi realizada uma divisão do banco do Hiperdia em seis blocos - considerando-se a primeira letra do nome da pessoa -, para serem relacionados com o banco Sinan-tuberculose:
1o Nomes iniciados por A até C
2o Nomes iniciados por D até I
3o Nomes iniciados por J até L
4o Nomes iniciados por M
5o Nomes iniciados por N até R
6o Nomes iniciados por S até Z
A comparação dos registros dentro de cada bloco considerou três passos:
Comparação do nome completo do paciente, nome completo da mãe do paciente e data de nascimento utilizando-se a chave de blocagem PBLOCO+UBLOCO+SEXO
Comparação do nome completo do paciente, nome completo da mãe do paciente e data de nascimento utilizando-se a chave de blocagem PBLOCO+UBLOCO
Comparação do nome completo do paciente, nome completo da mãe do paciente e data de nascimento utilizando-se a chave de blocagem PBLOCO+SEXO
Os relacionamentos probabilísticos requerem maior atenção aos pares duvidosos, situados na fronteira de incerteza, conhecida como zona cinza.26 Para maximizar a capacidade da ferramenta em identificar os pares verdadeiros, os parâmetros de relacionamento foram estimados com a aplicação da ferramenta disponível do Reclink - procedimentos ‘gera matriz’ e ‘calcula parâmetros’ - sobre as informações das próprias bases de dados, gerando a distribuição teórica do escore: -1,6843 a 30,0763.
Como as bases de dados eram muito extensas, utilizou-se a fração amostral de 1% com o propósito de escolher os melhores parâmetros no relacionamento, ou seja, a capacidade de melhor discriminar os pares dos não pares. Realizou-se uma inspeção na base, com o objetivo de identificar o melhor limiar para classificação dos pares: os registros com valores de escore maiores ou iguais a 24,9 foram considerados pares verdadeiros e os com escores inferiores a 24,9 foram considerados não pares ou pares duvidosos. Com os parâmetros estimados, alcançou-se um bom desempenho na identificação dos pares verdadeiros, permitindo supor que a revisão manual da chamada zona cinza não acrescentaria um volume substancial de registros ao conjunto dos pareados. Assim, optou-se por não revisar a zona cinza e chamar os pares duvidosos de não pares.27
Após o processamento dos seis blocos relacionados ao banco do Sinan-TB, os respectivos blocos foram juntados novamente, resultando em um único banco, cujas denominações para as origens dos dados foram codificadas por:
01 = banco Sinan-tuberculose
10 = banco Hiperdia
11 = banco comorbidade tuberculose-diabetes (relacionado)
Para o banco final, foram incluídos no estudo os códigos 01 e 11 (respectivamente: casos de tuberculose sem a comorbidade tuberculose-diabetes notificados no Sinan de 1o/1/2007 até 30 de junho de 2011; e casos com comorbidade tuberculose-diabetes - casos notificados no Sinan-tuberculose com a informação da associação com a diabetes e casos recuperados após o relacionamento dos bancos do Sinan-tuberculose e do Hiperdia). Foram considerados sem comorbidade os casos de tuberculose notificados no Sinan-tuberculose sem diabetes associada, ou seja, casos de tuberculose cuja variável ‘doenças e agravos associados - diabetes’ da ficha do Sinan apresentasse o código ‘2’ (Não); foram excluídos os casos com código ‘9’ (ignorado) ou sem preenchimento (em branco) para a mesma variável. Para os casos com a comorbidade tuberculose-diabetes, foram considerados:
- caso de tuberculose notificado no Sinan em que a variável ‘doenças e agravos associados - diabetes’ apresentava o código ‘1’ (Sim);
- caso de diabetes registrado no Hiperdia antes de o caso de tuberculose ser notificado no Sinan; e
- casos de diabetes e tuberculose registrados e notificados no mesmo ano em ambos os sistemas - Hiperdia e Sinan.
Foram excluídos os casos de tuberculose registrados no Sinan após junho de 2011, uma vez que os indivíduos diagnosticados no segundo semestre de 2011 deveriam concluir o tratamento recomendado (de seis meses) somente em 2012, período fora do estudo e sem informações dos registros de diabetes.
Para descrever o perfil sociodemográfico das pessoas com a comorbidade tuberculose-diabetes, foram consideradas as seguintes variáveis da ficha de notificação do Sinan-tuberculose:
- sexo (masculino; feminino);
- faixa etária (em anos: até 19; 20 a 39; 40 a 59; 60 ou mais);
- raça/cor de pele (branca; preta/parda; outras);
- escolaridade (em anos de estudo: até 4; 5 a 8; 8 ou mais);
- uso regular de álcool (sim; não); e
- sorologia para o vírus da imunodeficiência humana, o HIV (positivo; negativo).
As análises foram feitas pelo teste de qui-quadrado de Pearson, para comparação das proporções entre o grupo do relacionamento e o do Sinan-tuberculose, com nível de significância estatística de 5%.
As bases de dados nominais do Sinan e do Hiperdia foram disponibilizadas pelo Ministério da Saúde, por meio do Programa Nacional de Controle da Tuberculose e do Departamento de Informática do SUS (Datasus), mediante assinatura de Termo de Responsabilidade pelo pesquisador. O projeto da pesquisa foi aprovado pelo Comitê de Ética em Pesquisa da Faculdade de Ciências da Saúde da Universidade de Brasília: Parecer no 552.561, de 11 de março de 2014.
Resultados
Após organização das bases, foram contabilizados 1.090.375 registros de casos de tuberculose e 1.246.137 cadastros de diabetes relativos ao período estudado. (Figura 1).

Figura 1 - Fluxograma da base de dados das pessoas com tuberculose, com e sem a comorbidade tuberculose-diabetes mellitus
Do primeiro bloco, de A a C do banco Hiperdia, de 209.370 cadastros, foram removidas 13.347 duplicidades. Do segundo bloco, de D a I do banco Hiperdia, de 225.089 cadastros, foram removidas 15.497 duplicidades. Do terceiro bloco, de J a L do banco Hiperdia, de 238.660 cadastros, foram removidas 14.795 duplicidades. Do quarto bloco, letra inicial M do banco Hiperdia, de 284.337 cadastros, foram removidas 20.387 duplicidades. Do quinto bloco, de N a R do banco Hiperdia, de 146.261 cadastros, foram removidas 10.746 duplicidades. Por fim, do total do sexto bloco, de S a Z do banco Hiperdia, de 142.412 cadastros, foram removidas 9.148 duplicidades. Ao todo, foram removidas 83.920 duplicidades. Outrossim, do total de cadastros de diabetes (n=1.246.137), oito continham informação não válida no campo ‘nome do indivíduo’ para criação do bloco, sendo esses excluídos da análise.
Após o relacionamento entre os bancos do Sinan-tuberculose e do Hiperdia, foram encontrados 7.287 registros de pessoas em ambos os bancos, ou seja, com a comorbidade tuberculose-diabetes (Tabela 1):
Tabela 1 - Número de pares encontrados após relacionamento entre os blocos dos bancos padronizados do Sinan-tuberculosea e do Hiperdia.b Brasil, 2007-2011
a) Sinan-tuberculose: Sistema de Informação de Agravos de Notificação - Tuberculose
b) Hiperdia: Sistema de Gestão Clínica de Hipertensão Arterial e Diabetes Mellitus da Atenção Básica
- bloco 1 [A a C], 1.057 pares;
- bloco 2 [D a I], 987 pares;
- bloco 3 [J a L], 2.097 pares;
- bloco 4 [M], 1.765 pares;
- bloco 5 [N a R], 734 pares; e
- bloco 6 [S a Z], 647 pares.
Afinal, conforme a origem do banco (Sinan-tuberculose; relacionamento Sinan-Hiperdia) e considerando-se os critérios de inclusão de casos para o estudo, resultaram para análise 335.644 casos de tuberculose com ou sem comorbidade no Sinan e 3.181 casos da comorbidade diabetes-tuberculose recuperados no relacionamento, ou seja, que não estavam com o campo da informação da associação tuberculose-diabetes assinalado no Sinan-tuberculose, totalizando 338.825 casos. Desse total, 314.382 não apresentavam a comorbidade e 24.443 tinham tuberculose e diabetes (21.262 provenientes do Sinan-tuberculose e 3.181 do banco relacionado) (Figuras 1 e 2).

Figura 2 - Número de indivíduos com tuberculose, com e sem diabetes, segundo base de dados de identificação da comorbidade, Brasil, 2007-2011
Entre os casos de comorbidade tuberculose-diabetes identificados após o relacionamento, observou-se predominância do sexo masculino (57,2%), faixa etária de 40 a 59 anos (52,3%), raça/cor da pele preta/parda (68,4%), cinco a oito anos de estudo (78,4%), uso não regular de álcool (86,5%) e sorologia negativa para HIV (91,8%). Entre os casos de comorbidade registrados no banco Sinan-tuberculose, predominaram indivíduos do sexo masculino (63,1%), faixa etária de 40 a 59 anos (53,1%), raça/cor da pele preta/parda (56,1%), cinco a oito anos de estudo (87,0%), uso não regular de álcool (84,9%) e sorologia negativa para HIV (91,4%). Não houve diferença estatisticamente significativa (p>0,05) entre os casos de comorbidade identificados após o relacionamento e os casos identificados exclusivamente no Sinan, no que concerne a sexo, raça/cor da pele e anos de estudo (Tabela 2).
Tabela 2 - Distribuição dos pacientes com comorbidade tuberculose-diabetes mellitus segundo origem do banco de dados e variáveis sociodemográficas, Brasil, 2007-2011 (n= 24.443)a
a) Número de observações válidas
b) Sinan-tuberculose: Sistema de Informação de Agravos de Notificação - Tuberculose
c) Hiperdia: Sistema de Gestão Clínica de Hipertensão Arterial e Diabetes Mellitus da Atenção Básica
d) Teste de qui-quadrado de Pearson
e) HIV: vírus da imunodeficiência humana
Discussão
No presente estudo, o relacionamento probabilístico entre as bases de dados possibilitou a melhoria da captação da informação sobre a comorbidade tuberculose-diabetes não registrada na base nacional do Sinan-tuberculose. Seus resultados evidenciam a importância do trabalho de integração do Sinan-tuberculose com outros bancos de dados, principalmente com aqueles que detêm informações dos agravos associados à tuberculose, caso da diabetes.29 Mesmo sendo o Hiperdia o sistema utilizado para o cadastramento das pessoas com diabetes no período de 2002 a 2013 e existindo, no Sinan, a diabetes como campo-agravo associado à tuberculose, não foram encontrados estudos na literatura, tampouco publicações do Ministério da Saúde que abordassem o relacionamento entre esses bancos.
O relacionamento nominal de bases de dados é normalmente realizado com a aplicação de métodos probabilísticos que utilizam processos de pareamento de duas ou mais bases, com probabilidades de concordância - ou não - entre um conjunto de variáveis comuns a essas bases, buscando pares de registros referentes à mesma pessoa, ademais da padronização e qualificação dessas informações.28
Uma vez que na ficha do Sinan, o campo ‘agravo associado à tuberculose’ não é de preenchimento obrigatório, esse registro apresentou-se com grande percentual em branco. Assim, é possível que esta análise esteja prejudicada e por conseguinte, o desconhecimento das pessoas sobre a comorbidade tenha dificultado uma melhor assistência, além de prejudicar a investigação intradomiciliar de novos casos. Ressalta-se que o registro do referido campo é de extrema importância: a ocorrência dessa comorbidade vem crescendo e as condutas clínicas e o monitoramento dos casos tornam-se cada dia mais necessários.
A discordância de registros encontrada entre os dois sistemas demonstra a necessidade de melhorar a integração e o fluxo de dados entre sistemas de informações em saúde, também observada em estudos com outros sistemas oficiais.18,30
Mesmo diante da indisponibilidade, neste estudo, de computadores com memória suficiente para processar bancos de dados com grandes quantidades de registros, a divisão dos bancos em seis blocos possibilitou o relacionamento entre o Sinan-tuberculose e o Hiperdia sem causar prejuízos aos resultados encontrados. Não obstante, para estudos futuros, recomenda-se utilizar uma estratégia mais eficiente de relacionamento das bases, por meio do emprego, em todos os passos, de uma chave de blocagem (indexação) formada de, no mínimo, quatro campos: soundex do primeiro nome, do ultimo nome, do primeiro nome da mãe; ano de nascimento; sexo; e município de residência. A aplicação dessa estratégia no relacionamento de bases de dados permitiria a formação de diferentes chaves, com pelo menos quatro campos.
Como limitações deste estudo, destacam-se a falta de completude de variáveis utilizadas para o relacionamento e a utilização de dados secundários, e consequentemente, a possibilidade de subnotificações, não se podendo afirmar que o universo de pessoas com as duas doenças esteja representado na base de dados relacionada.
Entre os indivíduos com tuberculose e diabetes, assim como observaram outros estudos sobre tuberculose, houve predominância da raça/cor da pele preta/parda e do sexo masculino; diferentemente da diabetes no Brasil, para a qual a maior prevalência é feminina.5,6 Possivelmente, as mulheres com diabetes registradas no Hiperdia mantiveram um maior vínculo com os serviços, daí sua maior participação no banco relacionado quando comparados os dois grupos de gênero. Os resultados do presente estudo reiteram a importância de relacionar informações advindas de diferentes sistemas de informações em saúde, principalmente para a detecção e qualificação de casos registrados em outros sistemas - não captados pela vigilância da doença -, contribuindo para o aperfeiçoamento da gestão no SUS.
Em conclusão, a aplicação de relacionamentos de bancos de dados pode se transformar em uma ferramenta importante para o monitoramento da situação de saúde das pessoas com tuberculose e com diabetes em tratamento. Estudos futuros devem aprofundar o conhecimento dos diferentes perfis dessa comorbidade.