TL;DR: subregistro existe, é um problema e as taxas de mortalidade ingênuas estão provavelmente erradas. Mas não são inúteis.

Estive fazendo alguns exercícios de demografia e pensando sobre subregistro e o quanto isso é um problema. Resolvi pegar algumas leituras que fiz recentemente e tentar mostrar onde isso aparece.

Um pouco de história

Em alguns países, os registros de nascimentos e mortes é tão bom que você pode calcular as estimativas mortalidade infantil diretamente. Esse é o caso da Suécia, por exemplo. E não é por acaso. As paróquias luteranas da Suécia registravam casamentos, batismos, e enterros desde 1608, passando a ser responsabilidade do Estado em 1686, e produzindo estatísticas vitais desde 1748 (Hakkert, 1996, p. 32).

No Brasil, as coisas são um pouco mais complicadas. Embora houvesse um registro administrado pela Igreja, o Registro Civil só foi criado em 1888. Os próprios párocos até estimulavam o registro eclesiástico em detrimento do registro civil: o número de nascimentos no registro das igrejas superava o do próprio registro civil “até poucos anos atrás”, segundo Hakkert (1996, p. 34). Só com o Decreto 4.857 de 1939 que o atestado de óbito se tornou obrigatório para a realização de enterros. Esse decreto foi revogado pela Lei 6.015 de 1973, A Lei dos Registros Públicos. Além disso, os registros de nascimentos e de óbitos só passaram a ser gratuitos a partir da Lei 9.534 de 1997, sem necessidade de comprovação do “estado de pobreza” (Silveira e Soboll, 1973). Jannuzzi (2012, p. 61) explica que o Registro Civil é responsabilidade do Poder Judiciário, que delega para os cartórios essa atividade, com alguns autores sustentando que esta é uma das causas da nossa falha de cobertura.

Além do registro civil, existe outra fonte importante de informações sobre mortalidade: o Sistema de Informação de Mortalidade do Ministério da Saúde (SIM/MS), criado em 1975 (Mello Jorge, Laurenti e Gotlieb, 2009). Existe uma diferença fundamental deste em relação ao Registro Civil: esse é o único que registra a causa do óbito.

O registro civil compila as certidões de óbito, enquanto o SIM compila as declarações de óbito. Esses documentos são bastante diferentes: a primeira é um ato notarial, enquanto o segundo é um ato médico. Em poucas palavras, a primeira está mais próxima de um procedimento jurídico, enquanto a segunda é mais próxima de um instrumento de investigação epidemiológica.

O SIM/MS tem um atraso de dois anos na divulgação, enquanto o Registro Civil costuma ser atualizado continuamente. No entanto, o SIM tem microdados disponíveis e isso possibilita que diversos pesquisadores estudem a qualidade dos dados e sua cobertura. De fato, houve pesquisas de busca ativa de óbitos para avaliar a completude do SIM (Almeida et al., 2017).

Além dessas fontes mais tradicionais, o Censo Demográfico de 2010 perguntou sobre a ocorrência de mortes nos domicílios e a antiga Pesquisa Nacional por Amostra de Domicílio (PNAD) tinha perguntas que poderiam ser usadas para estimar algumas estatísticas de mortalidade por métodos indiretos.

Subregistro

Bom, falei demais e não trouxe nenhum número. Vamos mudar isso.

Recentemente, o IBGE fez uma análise cuidadosa da cobertura de óbitos do Registro Civil e do SIM/MS. A Tabela 1 abaixo traz as estimativas de subregistro1. Bom, os dois registros parecem caminhar na mesma direção, com Maranhão e Amapá tendo os valores mais altos nos dois sistemas. No entanto, o Registro Civil deixa de registrar quase 1/3 dos óbitos do Maranhão e 1/4 do Amapá, enquanto essa falha é menor no SIM/MS. Essa informação indica que devemos ter cuidado com os dados do Registro Civil, principalmente nos estados do Norte e Nordeste.

Table 1: Total Estimado e Sub-registro de Óbitos por Grandes Regiões e UF de residência do falecido - 2017
Subregistro em %
UF Óbitos Estimados Reg. Civil SIM/MS
Maranhão 37 309 27,87 4,60
Amapá 3 355 23,75 5,24
Pará 40 948 18,17 3,75
Roraima 2 545 12,99 3,09
Piauí 20 216 12,60 2,12
Rio Grande do Norte 22 209 10,10 3,52
Amazonas 17 661 9,82 1,84
Tocantins 8 332 8,87 2,83
Alagoas 21 340 8,44 2,95
Ceará 61 253 7,82 2,99
Sergipe 13 500 7,58 1,35
Bahia 93 974 6,90 2,90
Paraíba 27 831 4,18 3,22
Mato Grosso 18 013 4,15 1,53
Goiás 40 384 4,09 0,84
Acre 3 998 3,73 4,38
Pernambuco 65 232 3,72 1,25
Mato Grosso do Sul 16 138 2,49 1,10
Santa Catarina 40 464 2,28 1,34
Minas Gerais 139 616 1,65 1,39
Rondônia 8 349 1,32 1,76
Paraná 72 004 1,27 0,48
Espírito Santo 24 273 0,78 0,64
Rio Grande do Sul 86 633 0,72 0,45
Rio de Janeiro 137 191 0,62 0,40
São Paulo 295 776 0,55 0,32
Distrito Federal 12 502 0,46 0,35
Fonte: IBGE, Estatísticas do Registro Civil 2017.

No entanto, é razoável supor que as circunstâncias do óbito podem estar correlacionadas com a probabilidade não ser registrado, o que introduziria viés em estimativas “ingênuas”2. Outra publicação do IBGE usa os dados do Censo 2010 para calcular tábuas completas de mortalidade para as UFs. A Tabela 15 daquela publicação tem um resultado muito importante: o subregistro de óbito varia de acordo com o sexo e com a idade do falecido.

Não é muito difícil pensar que existam outros atributos afetam a probabilidade de uma morte ser registrada. Por exemplo, como a certidão de óbito tem um papel importante nos processos de inventário, é provável que óbitos de pessoas mais ricas tenham mais probabilidade de ser registrados do que de pessoas menos favorecidas. As distâncias e dificuldades de acesso em algumas regiões também podem afetar essa probabilidade de registro.

Mas por que isso é um problema?

A medida de mortalidade mais simples é a taxa de mortalidade bruta (TBM). Basicamente, a TBM é a razão entre o número de óbitos ocorridos em um ano dividido e a população no meio do ano. Consequentemente, quando há subregistro, as contagens de óbitos vão ser menores do que o real, subestimando a mortalidade.

Se as “probabilidades de registro” não variam de acordo com as características dos indivíduos, esse é um problema relativamente simples de resolver. Aplicando um fator de correção sobre o total de mortes registradas, temos uma estimativa das mortes efetivamente ocorridas.

No entanto, se as “probabilidades de registro” variam com as características dos indivíduos, o problema é mais complicado. Por exemplo, se as mulheres têm uma probabilidade menor de ser registradas, a TBM das mulheres será subestimada3. Agora imagine que diversas características afetam essa probabilidade de registro. Teríamos que calcular a probabilidade de registro de cada pessoa no registro para poder estimar, de fato, as mortes ocorridas.

Mas e as estimativas dos modelos? Bom, se o modelo não inclui as probabilidades de registro, não estamos prevendo as mortes ocorridas, mas apenas as mortes registradas, supondo que o subregistro é o mesmo dos anos anteriores. E isso é um problema: a cobertura pode ter melhorado ou piorado por causa da pandemia.

Isso significa que os números são inúteis? Não, eles são importantíssimos! Só não servem para este propósito.

Precisamos ter cuidado com o que eles dizem e, mais ainda, com o que eles não dizem. No momento, esses números são a única referência que temos para a formulação de políticas públicas4. Podemos estar errados, mas sabemos algo sobre a direção que erramos. E, se a cobertura não muda bruscamente durante a pandemia, o que não é uma hipótese muito ruim, as trajetórias são úteis, embora os valores sejam menos úteis.

Estatísticas de Qualidade

Um ponto que é frequentemente ignorado por cientistas de dados é o “Total Survey Error Framework”. A figura abaixo é extraída de Saris (2014). Ela é voltada para entender os erros nas estatísticas coletadas por pesquisas amostras, mas também ajuda a entender o erro de dados não-amostrais.

Diagrama do Total Survey Error
Diagrama do Total Survey Error

O que normalmente se vê é uma ênfase na última etapa, na produção dos números, com pouca reflexão sobre todos os outros erros: erros de medida, de cobertura, de não-resposta, etc. O desenvolvimento de métodos para lidar com esses problemas é parte do dia-a-dia dos amostristas.

Sugestão

Não deve ser novidade, mas eu sou bastante viesado nessa sugestão. Em maio de 2020, o professor Pedro Silva (ENCE/IBGE) comentou detalhadamente o estado das estatisticas oficiais na pandemia. Aos 20:00 do vídeo, ele comenta sobre os “fortes indícios de subnotificação” dos dados cartorários.

Referências

ALMEIDA, W. DA S. DE et al. Captação de óbitos não informados ao Ministério da Saúde: pesquisa de busca ativa de óbitos em municípios brasileiros. Revista Brasileira de Epidemiologia, v. 20, p. 200–211, jun. 2017.
HAKKERT, R. Fontes de Dados Demográficos. Belo Horizonte, Brasil: ABEP, 1996.
JANNUZZI, P. DE M. Indicadores Sociais no Brasil: conceitos, fontes de dados e aplicações. 5. ed. Campinas, São Paulo: Alínea, 2012.
MELLO JORGE, M. H. P. DE; LAURENTI, R.; GOTLIEB, S. L. D. O sistema de Informações sobre Mortalidade – SIM: Concepção, Implantação e Avaliação. Em: FUNDAÇÃO OSWALDO CRUZ, M. DA S. A. O. P.-A. DA S. A. (Ed.). A experiência brasileira em sistemas de informação em saúde. Brasília: [s.n.]. p. 71–108.
SARIS, W. E. Total Survey Error. Em: MICHALOS, A. C. (Ed.). Encyclopedia of Quality of Life and Well-Being Research. Dordrecht: Springer Netherlands, 2014. p. 6703–6704.
SILVEIRA, M. H.; SOBOLL, M. L. Sub-registro de nascimento: aspectos educativos visando à sua diminuição. Revista de Saúde Pública, v. 7, p. 151–160, jun. 1973.

  1. No caso do SIM/MS, o termo correto seria subnotificação, mas não quero complicar ainda mais.↩︎

  2. Falei um pouco sobre isso neste post↩︎

  3. Não é difícil pensar em motivos para isso. Antigamente, as mulheres enfrentavam barreiras legais para registrar imóveis em seu nome. Logo, e provável que houvesse menos interesse em registrar a morte destas mulheres em comparação com homens na mesma condição.↩︎

  4. Até não fazer nada é um tipo de política pública.↩︎