Sobre a interpretação do intervalo de confiança na inferência frequentista
Na semana passada, eu fui perguntar do professor Gustavo sobre uns cálculos relacionados a um modelo que estou tentando ajustar. Acabei ficando para a aula do primeiro semestre do mestrado/doutorado.
A aula era sobre intervalos de confiança. E um dos pontos principais deste assunto é a interpretação do intervalo de confiança. A interpretação (frequentista) correta é que, sob amostragem repetida, 95% dos intervalos de confiança cobrem o parâmetro populacional. Ou seja: não é uma afirmação sobre o intervalo em si, mas sobre o método de construção do intervalo.
Isso sempre é complicado de explicar. É recorrente ter interpretações do tipo “este intervalo tem 95% de chance de conter o parâmetro populacional”. Tentando explicar isso sem recorrer a abstrações, pensei num experimento mental para mostrar como este tipo de afirmação não faz sentido.
Imagine que você está sentado na porta de um auditório. Você dá uma moeda de um real para cada pessoa que entra no auditório. Você tinha 95 moedas, mas 100 pessoas entraram no auditório, de modo que 5 entraram mas não receberem a moeda.
Uma pessoa sai do auditório. Pergunta: quanto dinheiro esta pessoa recebeu?
Diante de uma pessoa, a resposta é: ela recebeu 1 real ou nada! Embora a média seja 95 centavos, é certo que aquela pessoa em particular não recebeu 95 centavos.
É isso que acontece com os intervalos de confiança frequentistas: em relação a todas as amostras possíveis, a probabilidade de ter um intervalo que cobre o parâmetro é 95%. No entanto, a partir do momento que a amostra foi selecionada, aquele intervalo de confiança só pode conter o parâmetro ou não.