As minhas quintas-feiras costumam ser divertidas. É o dia que eu almoço junto com os colegas de um dos trabalhos1 Hoje, um colega me perguntou:
Por que tem \(n-1\) no denominador da variância amostral?
Eu dei uma resposta curta, mas não muito boa: é o “desconto” da informação utilizada para estimar a média. Depois, lembrei de umas anotações sobre graus de liberdade; porém essa é muito resposta boa para outra coisa, mas muito longa e indireta.
Em todo período eleitoral, a gente vê gráficos com pontos e margens de erro de \(\pm\) 2 p.p. com nível de confiança de 95%. Estas de margens de erro são obtidas a partir do tamanho da amostra para determinado nível de confiança.
A pergunta central é: será que eles funcionam?
Bom, vamos investigar.
Definição formal do problema Sejam \(n_1 , n_2 , \dots , n_K\) as contagens observadas em uma amostra de tamanho \(n\) extraída da distribuição multinomial com \(K\) categorias — i.
Na semana passada, eu fui perguntar do professor Gustavo sobre uns cálculos relacionados a um modelo que estou tentando ajustar. Acabei ficando para a aula do primeiro semestre do mestrado/doutorado.
A aula era sobre intervalos de confiança. E um dos pontos principais deste assunto é a interpretação do intervalo de confiança. A interpretação (frequentista) correta é que, sob amostragem repetida, 95% dos intervalos de confiança cobrem o parâmetro populacional. Ou seja: não é uma afirmação sobre o intervalo em si, mas sobre o método de construção do intervalo.
Voltei de Southampton no dia 26/5. Mas, no domingo seguinte, viajei até o Peru para a “SAE-Peru”, uma conferência que teve muitos trabalhos interessantes sobre estimação em pequenas áreas.