Freakonomics revisitado e o efeito do Tea Party


Compartilhando algumas leituras:

Andrew Gelman discute com Stephen Dubner sobre suas críticas ao Freakonomics. O artigo original com as críticas, que são simples mas muito pertinentes, pode ser conferido aqui.

Mankiw dá a dica de um artigo que usa dias chuvosos como variável instrumental para capturar o efeito político do Tea Party.

O poder da estatística, ou como você é tão previsível.


Nos EUA, um pai ficou indignado ao encontrar, na sua caixa de correio, cupons de desconto para roupas de bebê enviados por uma cadeia de varejo em nome de sua filha menor de idade. Acusou a loja de tentar induzir a garota a ser mãe precocemente. Mas, após confrontar a adolescente, descobriu que a filha já estava grávida. Só ele não sabia. Os estatísticos da loja de departamentos Target não tiveram acesso a nenhum teste de gravidez. Apenas inferiram que aquela consumidora iria dar à luz cruzando informações de compras: a mudança no seu padrão de consumo era consistente com o de outras grávidas. Foram tão precisos quanto um exame de ultrassom.

Via Moral Hazard.

A evidência prova: você é obeso… mas não é gordo!


O p-valor (ou valor p) é, talvez, a estatística mais difundida entre médicos, psicólogos, economistas e quase toda profissão que utilize inferência estatística.

Virtualmente todo mundo que fez um curso de graduação ou pós-graduação já se deparou com o p-valor, seja nas disciplinas de estatística, seja ao realizar um trabalho empírico aplicado.

Entretanto, quase ninguém sabe muito bem o que o p-valor é ou pode ser considerado quando se trata de evidência. Sobre este ponto, há um artigo de 1996, do Schervish, que mostra como o p-valor não é uma medida coerente de evidência. Como assim? Bom, deixe-me tentar explicar de uma maneira simples.

Em geral, alguém é considerado obeso quando é muito gordo: o conceito de obeso pressupõe o conceito de gordo. Em outras palavras, é impossível ser obeso sem ser gordo.

Representemos obeso por O e gordo por G. Em termos formais, dizemos que O -> G (leia-se, O implica em G), isto é, se você é obeso, então você é gordo.

Note que o fato de O -> G não quer dizer que a volta é válida, isto é que, G -> O. Você pode ser gordo, mas apenas gordinho, ou gordo-magro, ou semi-gordo (ou diversos outros nomes que inventam por aí), mas pode não ser muito gordo e, consequentemente, não é obeso.

Bom, suponha agora que você queira descobrir se um determinado indivíduo é gordo ou é obeso. Suponha, também, que você tenha dados de exames deste indivíduo, que forneçam evidência para a hipótese de ele ser gordo ou ser obeso. Como uma boa evidência deveria se comportar?

Note que uma evidência “bem comportada” deveria ser coerente no seguinte sentido: se ela é uma evidência que dê bons indícios de que o indivíduo seja obeso, ela deve ser tão boa ou melhor evidência de que o indivíduo seja gordo. Por quê? Ora, porque, como vimos, se você é obeso, necessariamente você é gordo. Uma medida de evidência que indicasse que você é obeso, mas não é gordo, seria contraditória, certo?

Mas é isso que o p-valor, de certo modo,  faz.

Por exemplo, no exemplo simples de uma distribuição normal trazido por Schervish, utilizando um teste uniformemente mais poderoso não viesado para hipóteses intervalares,  quando se observa x=2,18, para uma hipótese de que a média esteja no intervalo [-0,82, 0,52], o p-valor é de 0,0498. Já para uma hipótese de que a média esteja no intervalo [-0,5, 0,5] o p-valor é de 0,0502. Note, entretanto, que, se a média não estiver no primeiro intervalo, necessariamente ela não está no segundo intervalo. Mas a evidência é “mais forte” contra a primeira hipótese do que contra a segunda. E se o limiar de 5% (que é comumente adotado) fosse utilizado para rejeitar ou aceitar uma hipótese (isso por si só já poderia ser bastante problemático, pois não rejeitar não é a mesma coisa de aceitar), você diria que a média não está em [-0,82, 0,52] mas que está em [-0,5, 0,5]. Isso é mais ou menos a mesma coisa de dizer que alguém é obeso, mas não é gordo.

Há vários problemas de interpretação com os métodos de inferência que estão sendo utilizados atualmente, e pretendo trazer outros pontos mais a frente.

Todos os modelos estão certos, a maioria é inútil


Palestra do Thaddeus Tarpey discutindo, de maneira simples, modelos e a realidade. O título é uma brincadeira com a conhecida frase do Box “Todos os modelos estão errados, alguns são úteis”.

Via Andrew Gelman.

Econometria – Redescobrindo fundamentos


Durante a revisão de literatura para minha dissertação, encontrei o artigo The Probability Approach in Econometrics do Trygve Haavelmo.

Este tipo de exposição e discussão tinha de voltar aos textos de pós-graduação.