Sobre a acurácia das variáveis econômicas II


Em post anterior tratamos da importância de se conhecer bem as variáveis com que se trabalha. Muitas vezes o economista utiliza dados que, por sua dificuldade de mensuração, são estimados por terceiros (IBGE, Banco Central, Tesouro Nacional etc). Assim, há uma tendência a se saber muito pouco sobre como esses dados são produzidos na prática e, sem entender quais suas limitações e quais seus pontos fortes, se esquece de tratá-los devidamente como estimativas.

Neste sentido, gostei muito de ver que outros blogs tem compartilhado desta mesma preocupação.

Dave Giles, por exemplo, resume algumas verdades importantes sobre dados oficiais, que são comumente esquecidas:

  • Dados são revisados o tempo inteiro: o número que saiu ontem do PIB pode mudar drasticamente amanhã.
  • Dados somem: eu já enfrentei isso com uma série de horas de trabalho que estava disponível no IPEA Data e que, alguns meses depois, simplesmente foi descontinuada e excluída.
  • As definições e metodologia mudam: por exemplo, a metodologia do Censo de Capitais Estrangeiros no País mudou recentemente. O usuário tem que ter isto em mente e não pode simplesmente comparar um dado com outro sem ajustes.
  • Os dados oficiais são estimativas: sobre isso tratamos no post anterior!

Dave Giles também recomendou alguns papers sobre o assunto e tratou de um interessante relatório sobre a qualidade dos dados chineses, aspecto fundamental para quem analisa aquela economia.

Já Mark Thoma começou a se dar conta do problema ao ler a notícia de que o IBGE americano está incorporando novos aspectos às contas nacionais que, simplesmente, podem “reescrever a história econômica”. Você já parou para se perguntar quantos “fatos estilizados” que conhecemos, como, por exemplo, a semi-estagnação de algumas economias desenvolvidas, podem (ou não) ser fruto da adoção de uma ou outra metodologia? Em posts futuros trarei exemplos interessantes de dados oficiais que são estimativas, mas agora queria tratar sobre aspectos que norteiam a discussão sobre a qualidade dos dados.

Sobre este quesito, o FMI tem um site inteiramente dedicado ao assunto: o Data Quality Reference Site. Trata-se de um louvável esforço para promover a agenda de pesquisa sobre a qualidade dos dados (macro)econômicos. O Fundo criou um interessante marco para a avaliação da qualidade – em um aspecto ainda qualitativo e não quantitativo – dividido em 6 dimensões:

0 – Condições Prévias: busca verificar alguns aspectos institucionais para a produção do dado, como o entorno jurídico e a quantidade de recursos disponível;

1 – Garantias de Integridade: avalia aspectos como o profissionalismo, a transparência e as normas éticas da produção;

2 – Rigor Metodológico: inspeciona se os conceitos e definições adotados estão conformes ao padrão internacional, se o alcance da pesquisa é suficiente, se as categorizações são adequadas;

3 – Acurácia e Confiança: verificam a adequação das fontes de dados utilizadas, se há um processo de avaliação, validação e revisão dos dados, se as técnicas estatísticas são sólidas;

4 – Utilidade para o Usuário: trata de questões de periodicidade, pontualidade, consistência e revisão;

5 – Acesso: aborda questões de acesso aos dado, acesso aos metadados (isso é, aos dados sobre como os dados foram produzidos) e assistência aos usuários.

O ideal seria termos, também, uma noção quantitativa do erro, mas este esforço já é um grande passo. Você pode encontrar o detalhamento destes pontos para contas nacionais, contas externas, finanças públicas, índices de preço, entre outros, em seu respectivo Data Quality Assessment Framework.

Você, que já trabalhou ou pretende trabalhar com dados em painel, comparando diversos países, já teve a curiosidade de se perguntar sobre a diferente qualidade dos dados que está misturando?

Para alguns países, é possível fazer isso analisando o seu Report on the Observance of Standards and Codes (mais conhecido como ROSC) sobre dados. Tomando o caso do Chile como exemplo, que possui um ROSC para dados no ano de 2007, seria possível descobrir que havia sérios problemas no escopo da pesquisa de índices de preços, e que havia propostas para solucionar a questão em dezembro de 2008. Perceba que, para quem trabalha com dados de preços chilenos antes de 2007, esta é uma informação fundamental!

Instituições e Piratas


Compartilho o interessante debate que está ocorrendo na blogosfera entre A&R e Peter Leeson. Aparentemente, os piratas que navegavam pelo Caribe no século 18 tinham instituições democráticas, votavam em seus lideres – cada pirata com direito a um voto – e ainda tinham modos de destitui-los do poder, caso seu desempenho não fosse satisfatório. Como essas instituições surgiram? Lesson argumenta que elas surgiram pois eram eficientes. A&R discordam. Você pode conferir o debate aqui, aqui e aqui.

Ensinem estatística ao Banco Mundial. Ou culto da significância estatística IV.


Considere duas amostras aleatórias, com 10 observações, retiradas de uma distribuição normal com médias diferentes e mesma variância desconhecida. Para utilizar um exemplo concreto, simulei no R duas amostras, uma de uma normal com média 5 e desvio-padrão 3 e a outra de uma normal com média 2 e desvio-padrão 3.

As amostras resultaram nas seguintes estatísticas:

***

Amostra 1

Média amostral: 5,3

Desvio-padrão amostral: 2,9

Intervalo de 95% de confiança: 3,2 a 7,4

***

Amostra 2

Média amostral: 2,6

Desvio-padrão amostral: 2,2

Intervalo de 95% de confiança: 0,7 a 4,5

***

Note que os intervalos de confiança se cruzam. O limite inferior da amostra 1 é 3,2 e o limite superior da amostra 2 é 4,5.

Isso quer dizer que a diferença entre as médias amostrais não é estatisticamente significante a 5%?

Não, fazendo um teste t para a diferença entre duas médias com variância igual você obtém um resultado estatisticamente significante a 5%, com intervalo de 95% de confiança indicando diferenças entre 0,5 a 5. Mesmo supondo que você não soubesse que as variâncias fossem iguais, o teste t de Welch nos dá um intervalo de 95% de confiança para a diferença entre as médias entre 0,1 e 5,3.

Agora imagine que esses dados eram de crescimento de PIB, isto é, um grupo tem média amostral de crescimento de 5,3% e outro de 2,6%. Se você comparasse os intervalos de confiança, você poderia tender a falar que os dois grupos não têm crescimento “diferentes”… quando, na verdade, o próprio teste clássico de diferenças entre médias indica uma diferença entre 0,5 e 5 pontos percentuais, que abarca magnitudes muito relevantes em termos de crescimento econômico!

Mas esse erro acontece?

Sim, no Banco Mundial. No EconBrowser, sobre a controvérsia Reinhart and Rogoff, Chinn divulgou este gráfico relacionando a média de crescimento e o percentual de endividamento público em relação ao PIB. As barras são a média e a linha preta representa o intervalo de 95% de confiança .

debtgdpgrowth.png

Note que, apesar de a média de crescimento dos países com alto endividamento (mais de 90% do PIB) ser bem menor do que a média dos demais, os intervalos de confiança se cruzam. Isso levou o pessoal do blog do banco mundial a dizer que “[…] the confidence intervals of all three bins above the 30 percent debt/GDP threshold also overlap. On this (admittedly crude) basis, then, any claim that a 1 percent growth differential over a decade compounds is simply overstating the case made by the data.”

Isso não é verdade, o simples fato de os intervalos de 95% de confiança cruzarem não quer dizer nada, mesmo se você achasse que significância estatística pura fosse o ponto relevante aqui. Como vimos no exemplo anterior, super simples, os intervalos de confiança podem se cruzar e mesmo assim a diferença ser “estatisticamente significante” e indicar diferenças economicamente relevantes! Cientes do erro, os autores fizeram um postscript alertando para o fato e reduzindo o intervalo de confiança do gráfico para um erro-padrão. O problema é que mesmo nesse caso, se houver alguma forma de dependência entre as amostras (o que provavelmente é o caso), a comparação também não é correta.

Apesar da brincadeira do título, isso não foi uma “burrice” do Banco Mundial. Um problema que tenho encontrado ao discutir estes assuntos é que, em geral, as pessoas acham que somente somente journals de “baixa qualidade” publicam coisas deste tipo. Ledo engano… a incompreensão sobre intervalos de confiança, significância estatística, p-valores é pervasiva nas ciências sociais, inclusive em trabalhos aplicados nas melhores revistas e com os melhores pesquisadores!

PS: como havia dito em post anterior, o risco de escrever em blogs é não ter revisor. Agradeço ao Fábio Gomes por corrigir um erro primário constante na primeira e afobada versão deste post, escrita ontem de madrugada!

III Enbeco, fotos e comentários


Confiram as fotos oficiais no blog do Cristiano e as fotos do happy hour no blog do Shikida. Comentários gerais sobre o evento no Prosa Econômica.

É hora de comprar ouro?


O texto de Jonas Faga Jr, recomendando a compra de ouro como um seguro, tem alguns pontos dos quais discordo e tenho discutido isso com alguns economistas. Para consolidar a discussão em um local só, seguem neste post alguns questionamentos. Jonas sugere que: (i) apesar de o preço do ouro flutuar no curto prazo, o metal mantém seu poder de compra no longo prazo; (ii) consequentemente, ele é um hedge para a inflação no longo prazo; e, por fim, (iii) o ouro seria um seguro contra catástrofes financeiras.

Os pontos (i) e (ii), a rigor, não me parecem verdade, pelo menos não para o que muita gente consideraria longo prazo. Como ilustração, basta um contra-exemplo: o período de 20 anos, entre 1980 e 1999, em que o preço do ouro, em dólar, despencou em termos reais (considerando a inflação).

Preço médio do Ouro a dólares constantes de 2009

Ouro 1980 1999

No blog Marginal Revolution, Tyler Cowen traz para discussão o trabalho Erb e Harvey que, dentre outras coisas, aponta justamente esta falta de correlação entre inflação e retorno do ouro em, pelo menos, períodos tão longos quanto 20 anos.

O ponto (iii), por sua vez, pode ser verdade, mas não deixa de ser especulação. Como se sabe, o ouro, historicamente, foi utilizado como moeda-mercadoria; e, como moeda, o ouro tem um menor risco de contra-parte, intrínseco a moedas fiduciárias. Deste modo, por exemplo, em um caso de catástrofe generalizada, seguida de falências de bancos e drástica perda de credibilidade das moedas fiduciárias, poderia ser que o ouro voltasse a exercer esta função em escala global. A demanda por ouro cresceria em magnitudes sem precedentes e, consequentemente, os ganhos da aplicação em ouro poderiam compensar, em alguma medida, as perdas dos outros ativos. Mas crises podem ocorrer de diversas formas. É possível imaginar diversos cenários em que o preço do ouro cairia mesmo em meio a uma crise financeira, como, por exemplo, em uma situação com a estagnação de grandes países emergentes (como a China) ou países em situação de crise fiscal, juntamente com a venda de ouro por parte desses bancos centrais.

Tendo isto em vista, você deve ou não comprar ouro como um seguro de longo prazo? A resposta depende de quais cenários futuros são mais plausíveis. E qual cenário, dentre todos, é mais plausível? Não sei. Mas é preciso estar claro que o ouro não é especial e tampouco é um seguro no sentido usual do termo. Você pode tanto ganhar quanto perder muito dinheiro, mesmo no longo prazo. Veja, não estou dizendo que seja uma má ideia comprar ouro agora, ou que diversificar seu portfólio seja ruim. Apenas enfatizo que, para você saber se deve ou não comprar ouro, seja com o horizonte de curto prazo, como 1 ano, ou mesmo com o horizonte de longo prazo, como 20 anos, você ainda tem de prever a evolução da oferta e da demanda pelo metal, da mesma forma que você faria para qualquer outro ativo.

PS: além do Marginal Revolution, a recente queda do preço do ouro tem tido repercussão em outros blogs como no EconBrowser e no Economist’s View.

Sete mitos sobre a economia brasileira


Por Drunkeynesian.

Leituras não recomendadas: estupro de fótons e preconceito linguístico.


Percebi que estava divulgando apenas as leituras mais interessantes. Mas, divulgar aqueles artigos em que o autor pisou na bola, principalmente daqueles sites que acompanhamos, talvez seja tão informativo quanto. Então, para variar, seguem abaixo dois textos não recomendados.

Nem tudo o que você pensa, por mais interessante que seja como abstração, deve ser externalizado. Um risco de se escrever em blog é justamente esse. Por haver pouca restrição antes da publicação (além de você mesmo), você pode acabar publicando raciocínios que, mesmo se válidos sob alguma ótica, simplesmente não precisavam ter visto a luz do dia. Steve Landsburg  argumenta que casos de estupro em que a vítima não se recorde de nada, e que não tenham nenhuma sequela física, não são, digamos, tão ruins assim. Como ilustração, afirmou que a penetração em si não quer dizer nada; pois, por exemplo, quando alguém acende uma luz, vários fótons penetram nosso corpo e nem por isso podemos processar legalmente esta pessoa. Para os incrédulos, segue o parágrafo:

Every time someone on my street turns on a porch light, trillions of photons penetrate my body. They cause me no physical harm and therefore the law does nothing to restrain them. Even if those trillions of tiny penetrations caused me deep psychic distress, the law would continue to ignore them, and I think there’s a case for that […] So for the issues we’re discussing here, bodily penetration does not seem to be in some sort of special protected category.

Nem preciso dizer que isso causou rebuliço na blogosfera. Por exemplo, Brad DeLong, exageradamente, é certo, conferiu à Landsburg o título de “pessoa mais estúpida viva”.

Já Guilherme Fiuza gasta mais da metade de seu artigo, que supostamente seria de crítica ao governo Dilma, apenas demonstrando desconhecimento de Linguística e de critérios de correção de prova. Não, por mais que eu não concorde com o governo, nem o caso do Miojo do ENEM, muito menos o caso de uma nota máxima a despeito de um mero erro ortográfico provariam o fracasso de uma política educacional, fosse do PT, do PSTU, do DEM ou do PSDB – se há fracasso neste campo, as razões e evidências são outras, e não estas.

Tampouco é interessante criticar a Dilma por ser mineira. Se um carioca falar “ishperto” ao invés de “esperto” ou “lião” ao invés de “leão” isso não é demonstração de ignorância, da mesma forma que não o é quando um mineiro fala “fazeno” ao invés de “fazendo”. Tudo bem, pode ser engraçado para pessoas de outras regiões; e a Dilma, como presidente, deveria vigiar sua fala e evitar regionalismos. Se o objetivo era fazer graça, tudo bem, piada é piada! Só não inclua isso em sua crítica ao governo; pois, se é para criticar, critique direito, do contrário a impressão que fica para pessoas de fora do seu círculo (pelo menos na minha amostra de 5 economistas consultados) é a de que, para chegar a este ponto, há muito pouco a ser criticado – o que definitivamente não é o caso!

Capitalismo para os pobres. O supra-sumo da discriminação de preços.


Os projetos estão andando, pouco tempo para procrastinar. Mas nem por isso deixo de compartilhar leituras interessantes de outros blogs, que atualmente tem mais tempo de procrastinação produtiva do que este.

Diogo Costa entra no mundo da blogosfera com o provocativo Capitalismo Para os Pobres. Diogo busca recuperar o caráter “progressista” do capitalismo, mostrando como este, quando bem aplicado, beneficia os mais pobres; busca diferenciar entre defender o mercado para todos, e defender privilégios de mercado para algumas empresas, que é o que atualmente se vê no Brasil: um capitalismo de compadres (ou de laços).

Enquanto os ricos têm capitalismo, aos pobres resta o fardo de uma economia ineficiente e regulada:

Pense no varejo. Rico faz compras em Miami. Pobre fica entre comprar produtos chineses altamente tarifados ou o substituto nacional altamente tributado. Pense no trabalho. Rico trabalha como Pessoa Jurídica. Os encargos trabalhistas não abocanhem seu salário. Pobre trabalha amarrado pela CLT. Todo empregado pobre é um trabalhador mais suas circunstâncias fiscais. Pense nas finanças. Rico consegue empréstimos subsidiados pelo BNDES. Pobre tem que pagar juros exorbitantes incluindo os subsídios governamentais. Pense na construção civil. Rico consegue licitação de obras com garantia lucros. Os pobres pagam a conta caso o projeto do rico dê errado. Pense nos impostos. A tributação brasileira é regressiva. Ricos pagam proporcionalmente menos tributos que os pobres.

Em post(s) futuro(s), vou tentar mostrar que essa visão “progressista” sobre o livre-mercado não é ou foi esposada somente por liberais, mas também o foi por muitos dos primeiros reformistas sociais (socialistas, anarquistas).

Alex Tabarrok nos traz um caso curioso de discriminação de preços, talvez o mais engenhoso que já vi.

Você já se perguntou por que companhias áreas vendem a passagem mais cara quanto mais próximo se está da viagem?

É uma forma de discriminar preços. Em geral, aqueles que compram a passagem em cima da hora tem algum compromisso inadiável (como uma reunião de trabalho) e estão dispostos a pagar mais caro. Os que desejam apenas passear são mais flexíveis e mais sensíveis a preços; se a passagem para certo destino e data ficar muito cara, muda-se ou a data, ou o destino, ou ambos. Assim, quem compra com antecedência, em geral, é aquele com a demanda mais elástica, e as companhias aéreas dão desconto.

Mas a única forma de discriminar preços seria pelo tempo da compra? Não. Aparentemente, a empresa GetGoing.com inventou uma nova forma: você escolhe dois destinos para os quais deseja ir e a data. A empresa então sorteia um desses destinos aleatoriamente e compra para você, com cerca de 40% de desconto. A relação é ganha-ganha: você viaja a menor custo; a companhia aérea consegue discriminar preços de maneira mais eficiente, pois, se você é tão flexível assim com relação ao local, você é um passageiro de demanda bastante elástica.

III ENBECO – Inscrições Abertas!


As inscrições para o III ENBECO já estão abertas e podem ser feitas aqui.

O evento será em Vitória-ES na FUCAPE, conforme informações abaixo:

Data: 12 de Abril de 2013 (Sexta-Feira)
Local: Auditório da FUCAPE (Av. Fernando Ferrari, 1358. Vitória-ES).
Horário: Das 13:00 à 18:30

III-ENBECO

 

Não deixe de se inscrever!

Diga-me o que curtes e te direi quem és: o poder da estatística, ou como você é tão previsível 3


Estudo de Kosinski, Stillwella e Graepelb com 58.000 usuários do Facebook mostra que é possível prever varias características pessoais com base apenas nas “curtidas” do indivíduo.

A figura abaixo ilustra o poder de previsão para algumas variáveis sensíveis, como preferência política, orientação sexual e uso de cigarro, drogas e bebidas.

20130312-220846.jpg

Veja mais aplicações da estatística neste blog aqui e aqui.

Via Marginal Revolution.