Sobre a acurácia das variáveis econômicas II


Em post anterior tratamos da importância de se conhecer bem as variáveis com que se trabalha. Muitas vezes o economista utiliza dados que, por sua dificuldade de mensuração, são estimados por terceiros (IBGE, Banco Central, Tesouro Nacional etc). Assim, há uma tendência a se saber muito pouco sobre como esses dados são produzidos na prática e, sem entender quais suas limitações e quais seus pontos fortes, se esquece de tratá-los devidamente como estimativas.

Neste sentido, gostei muito de ver que outros blogs tem compartilhado desta mesma preocupação.

Dave Giles, por exemplo, resume algumas verdades importantes sobre dados oficiais, que são comumente esquecidas:

  • Dados são revisados o tempo inteiro: o número que saiu ontem do PIB pode mudar drasticamente amanhã.
  • Dados somem: eu já enfrentei isso com uma série de horas de trabalho que estava disponível no IPEA Data e que, alguns meses depois, simplesmente foi descontinuada e excluída.
  • As definições e metodologia mudam: por exemplo, a metodologia do Censo de Capitais Estrangeiros no País mudou recentemente. O usuário tem que ter isto em mente e não pode simplesmente comparar um dado com outro sem ajustes.
  • Os dados oficiais são estimativas: sobre isso tratamos no post anterior!

Dave Giles também recomendou alguns papers sobre o assunto e tratou de um interessante relatório sobre a qualidade dos dados chineses, aspecto fundamental para quem analisa aquela economia.

Já Mark Thoma começou a se dar conta do problema ao ler a notícia de que o IBGE americano está incorporando novos aspectos às contas nacionais que, simplesmente, podem “reescrever a história econômica”. Você já parou para se perguntar quantos “fatos estilizados” que conhecemos, como, por exemplo, a semi-estagnação de algumas economias desenvolvidas, podem (ou não) ser fruto da adoção de uma ou outra metodologia? Em posts futuros trarei exemplos interessantes de dados oficiais que são estimativas, mas agora queria tratar sobre aspectos que norteiam a discussão sobre a qualidade dos dados.

Sobre este quesito, o FMI tem um site inteiramente dedicado ao assunto: o Data Quality Reference Site. Trata-se de um louvável esforço para promover a agenda de pesquisa sobre a qualidade dos dados (macro)econômicos. O Fundo criou um interessante marco para a avaliação da qualidade – em um aspecto ainda qualitativo e não quantitativo – dividido em 6 dimensões:

0 – Condições Prévias: busca verificar alguns aspectos institucionais para a produção do dado, como o entorno jurídico e a quantidade de recursos disponível;

1 – Garantias de Integridade: avalia aspectos como o profissionalismo, a transparência e as normas éticas da produção;

2 – Rigor Metodológico: inspeciona se os conceitos e definições adotados estão conformes ao padrão internacional, se o alcance da pesquisa é suficiente, se as categorizações são adequadas;

3 – Acurácia e Confiança: verificam a adequação das fontes de dados utilizadas, se há um processo de avaliação, validação e revisão dos dados, se as técnicas estatísticas são sólidas;

4 – Utilidade para o Usuário: trata de questões de periodicidade, pontualidade, consistência e revisão;

5 – Acesso: aborda questões de acesso aos dado, acesso aos metadados (isso é, aos dados sobre como os dados foram produzidos) e assistência aos usuários.

O ideal seria termos, também, uma noção quantitativa do erro, mas este esforço já é um grande passo. Você pode encontrar o detalhamento destes pontos para contas nacionais, contas externas, finanças públicas, índices de preço, entre outros, em seu respectivo Data Quality Assessment Framework.

Você, que já trabalhou ou pretende trabalhar com dados em painel, comparando diversos países, já teve a curiosidade de se perguntar sobre a diferente qualidade dos dados que está misturando?

Para alguns países, é possível fazer isso analisando o seu Report on the Observance of Standards and Codes (mais conhecido como ROSC) sobre dados. Tomando o caso do Chile como exemplo, que possui um ROSC para dados no ano de 2007, seria possível descobrir que havia sérios problemas no escopo da pesquisa de índices de preços, e que havia propostas para solucionar a questão em dezembro de 2008. Perceba que, para quem trabalha com dados de preços chilenos antes de 2007, esta é uma informação fundamental!

Mais Google: previsões de gripe e de dengue em “tempo real”


Como já havia dito, para quem gosta de trabalhar com dados, conciliando teoria e prática, o Google deve ser a empresa dos sonhos.

Agora, veja a empresa fornecendo mapas com tendências de gripe  e  de dengue ao redor do mundo, com detalhes anuais por país e em “tempo real”, tomando por base termos de pesquisa relacionados às doenças e seus sintomas.

Será que a dengue está pior este ano do que no ano passado no Brasil? Aparentemente sim. E os dados do Google podem fornecer uma resposta mais tempestiva do que os dados oficiais:

Dengue

Mas esses dados fornecem uma boa aproximação dos casos reais? Bom, julgue você mesmo com o gráfico abaixo, comparando o indicador do Google com os dados do Ministério da Saúde:

Dengue 2

Impressionante.

Mais sobre o Google aqui (entrevista com Nate Silver) e aqui (Hal Varian aplicando teoria dos jogos na prática).

Via Marginal Revolution

Um livro de História do nosso país


Após um período viajando, blog de volta. Para retomar as atividades, compartilho uma imagem não muito boa da realidade educacional de nosso país (via Roberto Ellery):

livro_imparcial

 

Imparcial e historicamente acurado, não?

Isso me lembrou uma prova para médicos, no mesmo nível, do Hospital de Clínicas da Universidade Federal do Paraná.

Investimento Estrangeiro Direto (IED) no Brasil – 2010 e 2011


O Banco Central do Brasil divulgou, hoje, os resultados do Censo de Capitais Estrangeiros no País para os anos de 2010 e 2011. O estoque total de IED estimado para 2010 é de US$670 bilhões e, para 2011, esse valor alcançou a cifra de US$688,6 bilhões.

O Censo agora conta com nova metodologia que permite estimar o estoque integral de IED, segundo os padrões internacionais definidos na sexta edição do Manual de Balanço de Pagamentos e Posição Internacional de Investimentos (conhecido como BPM6) do FMI, e na quarta edição das Definições de Referência de IED (conhecido como BD4). Entre as novidades da pesquisa encontram-se: (i) a mensuração do IED empréstimo intercompanhia; (ii) a valoração por valor de mercado do IED participação no capital; e, (iii) a separação entre país do investidor imediado e país do investidor final. Então é preciso cautela ao comparar os dados desses dois anos com os dados dos anos anteriores.

Quanto ao primeiro ponto, o IED empréstimo intercompanhia totalizou US$82,8 bilhões em 2010 e US$99,4 bilhões em 2011 valores, portanto, substanciais. Já a mensuração por valor de mercado, apesar de ter sido realizada para apenas 11% dos declarantes, respondeu por um aumento no estoque de IED participação no capital de US$121,2 bilhões, em 2010, e de US$89,9 bilhões, em 2011, em comparação ao valor por patrimônio líquido. Por fim, a diferenciação entre país do investidor imediato e país do investidor final permite reduzir a distorção das estatísticas causadas por paraísos fiscais. Por exemplo em 2010, pelo critério de investidor imediato, a Holanda tem estoque de US$163,3 bilhões de IED participação no capital, enquanto que, pelo critério de investidor final, este número cai para US$14,9 bilhões.

Vale ressaltar aqui outra novidade: o Censo, que antes era quinquenal, passou a ter uma edição anual, direcionada a declarantes de grande porte. Deste modo, enquanto, em 2010, a pesquisa contou com 16.844 declarantes, em 2011, a pesquisa foi realizada com 3.176, cerca de 19% do número anterior, mas representando estoque declarado de IED participação no capital de US$523,3 bilhões (89% do valor total). Os 11% restantes foram foram estimados com base na última declaração dos demais declarantes, acrescidos os fluxos do balanço de pagamentos e dados do registro de capital estrangeiro (RDE-IED).

Para aqueles que se interessam por dados de investimento estrangeiro no Brasil, confira a nota aqui e os dados em excel aqui.

Instituições e Piratas


Compartilho o interessante debate que está ocorrendo na blogosfera entre A&R e Peter Leeson. Aparentemente, os piratas que navegavam pelo Caribe no século 18 tinham instituições democráticas, votavam em seus lideres – cada pirata com direito a um voto – e ainda tinham modos de destitui-los do poder, caso seu desempenho não fosse satisfatório. Como essas instituições surgiram? Lesson argumenta que elas surgiram pois eram eficientes. A&R discordam. Você pode conferir o debate aqui, aqui e aqui.

Ensinem estatística ao Banco Mundial. Ou culto da significância estatística IV.


Considere duas amostras aleatórias, com 10 observações, retiradas de uma distribuição normal com médias diferentes e mesma variância desconhecida. Para utilizar um exemplo concreto, simulei no R duas amostras, uma de uma normal com média 5 e desvio-padrão 3 e a outra de uma normal com média 2 e desvio-padrão 3.

As amostras resultaram nas seguintes estatísticas:

***

Amostra 1

Média amostral: 5,3

Desvio-padrão amostral: 2,9

Intervalo de 95% de confiança: 3,2 a 7,4

***

Amostra 2

Média amostral: 2,6

Desvio-padrão amostral: 2,2

Intervalo de 95% de confiança: 0,7 a 4,5

***

Note que os intervalos de confiança se cruzam. O limite inferior da amostra 1 é 3,2 e o limite superior da amostra 2 é 4,5.

Isso quer dizer que a diferença entre as médias amostrais não é estatisticamente significante a 5%?

Não, fazendo um teste t para a diferença entre duas médias com variância igual você obtém um resultado estatisticamente significante a 5%, com intervalo de 95% de confiança indicando diferenças entre 0,5 a 5. Mesmo supondo que você não soubesse que as variâncias fossem iguais, o teste t de Welch nos dá um intervalo de 95% de confiança para a diferença entre as médias entre 0,1 e 5,3.

Agora imagine que esses dados eram de crescimento de PIB, isto é, um grupo tem média amostral de crescimento de 5,3% e outro de 2,6%. Se você comparasse os intervalos de confiança, você poderia tender a falar que os dois grupos não têm crescimento “diferentes”… quando, na verdade, o próprio teste clássico de diferenças entre médias indica uma diferença entre 0,5 e 5 pontos percentuais, que abarca magnitudes muito relevantes em termos de crescimento econômico!

Mas esse erro acontece?

Sim, no Banco Mundial. No EconBrowser, sobre a controvérsia Reinhart and Rogoff, Chinn divulgou este gráfico relacionando a média de crescimento e o percentual de endividamento público em relação ao PIB. As barras são a média e a linha preta representa o intervalo de 95% de confiança .

debtgdpgrowth.png

Note que, apesar de a média de crescimento dos países com alto endividamento (mais de 90% do PIB) ser bem menor do que a média dos demais, os intervalos de confiança se cruzam. Isso levou o pessoal do blog do banco mundial a dizer que “[…] the confidence intervals of all three bins above the 30 percent debt/GDP threshold also overlap. On this (admittedly crude) basis, then, any claim that a 1 percent growth differential over a decade compounds is simply overstating the case made by the data.”

Isso não é verdade, o simples fato de os intervalos de 95% de confiança cruzarem não quer dizer nada, mesmo se você achasse que significância estatística pura fosse o ponto relevante aqui. Como vimos no exemplo anterior, super simples, os intervalos de confiança podem se cruzar e mesmo assim a diferença ser “estatisticamente significante” e indicar diferenças economicamente relevantes! Cientes do erro, os autores fizeram um postscript alertando para o fato e reduzindo o intervalo de confiança do gráfico para um erro-padrão. O problema é que mesmo nesse caso, se houver alguma forma de dependência entre as amostras (o que provavelmente é o caso), a comparação também não é correta.

Apesar da brincadeira do título, isso não foi uma “burrice” do Banco Mundial. Um problema que tenho encontrado ao discutir estes assuntos é que, em geral, as pessoas acham que somente somente journals de “baixa qualidade” publicam coisas deste tipo. Ledo engano… a incompreensão sobre intervalos de confiança, significância estatística, p-valores é pervasiva nas ciências sociais, inclusive em trabalhos aplicados nas melhores revistas e com os melhores pesquisadores!

PS: como havia dito em post anterior, o risco de escrever em blogs é não ter revisor. Agradeço ao Fábio Gomes por corrigir um erro primário constante na primeira e afobada versão deste post, escrita ontem de madrugada!

III Enbeco, fotos e comentários


Confiram as fotos oficiais no blog do Cristiano e as fotos do happy hour no blog do Shikida. Comentários gerais sobre o evento no Prosa Econômica.

Statistics – Venezuela Style


Quase tinha deixado passar este belo e imparcial gráfico das eleições venezuelanas.

73112_590025221017123_1917180638_n

Veja aqui mais exemplos interessantes, desta vez da Fox News.

É hora de comprar ouro?


O texto de Jonas Faga Jr, recomendando a compra de ouro como um seguro, tem alguns pontos dos quais discordo e tenho discutido isso com alguns economistas. Para consolidar a discussão em um local só, seguem neste post alguns questionamentos. Jonas sugere que: (i) apesar de o preço do ouro flutuar no curto prazo, o metal mantém seu poder de compra no longo prazo; (ii) consequentemente, ele é um hedge para a inflação no longo prazo; e, por fim, (iii) o ouro seria um seguro contra catástrofes financeiras.

Os pontos (i) e (ii), a rigor, não me parecem verdade, pelo menos não para o que muita gente consideraria longo prazo. Como ilustração, basta um contra-exemplo: o período de 20 anos, entre 1980 e 1999, em que o preço do ouro, em dólar, despencou em termos reais (considerando a inflação).

Preço médio do Ouro a dólares constantes de 2009

Ouro 1980 1999

No blog Marginal Revolution, Tyler Cowen traz para discussão o trabalho Erb e Harvey que, dentre outras coisas, aponta justamente esta falta de correlação entre inflação e retorno do ouro em, pelo menos, períodos tão longos quanto 20 anos.

O ponto (iii), por sua vez, pode ser verdade, mas não deixa de ser especulação. Como se sabe, o ouro, historicamente, foi utilizado como moeda-mercadoria; e, como moeda, o ouro tem um menor risco de contra-parte, intrínseco a moedas fiduciárias. Deste modo, por exemplo, em um caso de catástrofe generalizada, seguida de falências de bancos e drástica perda de credibilidade das moedas fiduciárias, poderia ser que o ouro voltasse a exercer esta função em escala global. A demanda por ouro cresceria em magnitudes sem precedentes e, consequentemente, os ganhos da aplicação em ouro poderiam compensar, em alguma medida, as perdas dos outros ativos. Mas crises podem ocorrer de diversas formas. É possível imaginar diversos cenários em que o preço do ouro cairia mesmo em meio a uma crise financeira, como, por exemplo, em uma situação com a estagnação de grandes países emergentes (como a China) ou países em situação de crise fiscal, juntamente com a venda de ouro por parte desses bancos centrais.

Tendo isto em vista, você deve ou não comprar ouro como um seguro de longo prazo? A resposta depende de quais cenários futuros são mais plausíveis. E qual cenário, dentre todos, é mais plausível? Não sei. Mas é preciso estar claro que o ouro não é especial e tampouco é um seguro no sentido usual do termo. Você pode tanto ganhar quanto perder muito dinheiro, mesmo no longo prazo. Veja, não estou dizendo que seja uma má ideia comprar ouro agora, ou que diversificar seu portfólio seja ruim. Apenas enfatizo que, para você saber se deve ou não comprar ouro, seja com o horizonte de curto prazo, como 1 ano, ou mesmo com o horizonte de longo prazo, como 20 anos, você ainda tem de prever a evolução da oferta e da demanda pelo metal, da mesma forma que você faria para qualquer outro ativo.

PS: além do Marginal Revolution, a recente queda do preço do ouro tem tido repercussão em outros blogs como no EconBrowser e no Economist’s View.

Rethinking Macro Policy II: First Steps and Early Lessons


Conferência com Akerlof, Tirole, Roubini, Blanchard, Romer, Stiglitz, Woodford, Fischer – entre outros nomes – será transmitida ao vivo pelo site do FMI, dias 16 (amanhã) e 17 (quarta). Vale a pena conferir.