Analise a rede de seu facebook


Continuando o tema de análise de redes, abordado em post passado, vejamos agora um exemplo legal que você mesmo pode reproduzir!

O gráfico abaixo é o da minha rede do Facebook. Cada nódulo representa uma pessoa (não coloquei os nomes, mas você pode colocar caso queira) e cada arco uma relação de amizade entre elas.

Veja que as pessoas foram separadas em grupos com base nas relações de amizade, e cada grupo recebeu uma cor diferente. Isto foi feito por um algoritmo que, no meu caso, corretamente identificou os grupos sociais da rede (trabalho, família, viagens, cursos) com base em quão fortemente conectados os nódulos são. Perceba que algumas pessoas são representadas por nódulos maiores: no caso, elas são pessoas com alto nível de betweeness centrality, isto é, pessoas que são como uma ponte para grupos de amizades distintos dentro da rede – também seria possível mudar o tamanho dos nódulos segundo o número de conexões de cada pessoa (grau, na linguagem de rede) ou outras medidas de centralidade.

rede_do_facebook

Bacana, não?

Quer fazer o seu? Você vai precisar entrar no aplicativo Netvizz para baixar os dados do Facebook e, depois, rodá-los no programa Gephi (que pode ser baixado gratuitamente aqui). Caso tenha alguma dificuldade, há um didático tutorial na internet. Futuramente, para não dizer que não falamos de economia, vamos fazer esse mesmo experimento com a visualização de dados de investimento direto no exterior e ver o que sai.

Análise de redes e Moviegalaxies: seu filmes preferidos de uma forma que você nunca viu


Um campo de estudos que pode render muitos frutos na economia é o de análise de redes. Para quem tem curiosidade, há um curso bem interessante de análise de redes sociais no Coursera.

Mas, na verdade, o objetivo deste post é o de divulgar um site bem bacana, Moviegalaxies, que faz análise de rede com os personagens de filmes (você inclusive pode baixar os dados para o Gephi).

Um dos gráficos de que gostei é a o da rede de  “O Poderoso Chefão: parte II”:

The Godfather Part II

Nova base de dados de séries de tempo


Há pouco tempo surgiu uma nova base de dados de série de tempos – Quandl.

Além de agrupar diversas estatísticas de fontes diferentes, o site permite baixar os dados em vários formatos (como excel ou csv) e ainda permite importação de dados diretamente em várias ferramentas de análise, como R e Python. Isso é uma mão na roda em muitos casos.

Outra possibilidade no Quandl é a de incorporar gráficos diretamente nos posts, tal como o exemplo abaixo com a evolução do IPCA acumulado em 12 meses.

Graph of IPCA - Acumulado em 12 meses

Apesar da ressalva de ser uma fonte secundária de informações, para quem ainda não conhecia, certamente vale a pena conferir.

Análise de dados com R e ggplot2 – Hadley Wickham no Google Tech Talks


Vídeo antigo, mas com o qual só tomei contato agora. Hadley Wickham no Google Tech Talks.

Hadley Wickham é o criador de pacotes para o R como: ggplot2, plyr, reshape2.

Economia, Democratas e Republicanos


Ontem, dois blogs (Marginal Revolution e Econbrowser) comentaram um interessante artigo de Alan Blinder e Mark Watson. A economia americana, sob quase qualquer ótica que você escolher, se comportou melhor durante os governos democratas do que durante os governos republicanos. Vejam alguns indicadores:

PIB: 4,35% x 2,54%;

Recessões: 8 para os democratas x 41 para os republicanos;

Taxa de desemprego: 5,6% x 6,0% (e variação na taxa de desemprego, -0.8 p.p x +1.1 p.p);

Taxa de inflação: 2,97% x 3,44% (mas os democratas perdem na variação, +1.05 p.p x -0.83 p.p)

Mas o que explicaria essas diferenças? Os democratas governam melhor do que os republicanos? Não necessariamente. Os autores acreditam que os democratas, muito provavelmente, foram simplesmente sortudos. Segundo Blinder e Watson, os fatores que melhor explicam os diferenciais são: os choques de petróleo, os choques de produtividade e as expectativas dos consumidores.

Em suas palavras:

Specifically, Democratic presidents have experienced, on average, better oil shocks than Republicans, a better legacy of (utilization-adjusted) productivity shocks, and more optimistic consumer expectations (as measured by the Michigan ICE).

Minha opinião: o artigo é provocador, mas a evidência apresentada muito ambígua. Mesmo se aceitarmos que essas são as variáveis fundamentais, quer queira, quer não,  tanto o preço do petróleo, quanto as expectativas dos consumidores são variáveis bastante afetadas por decisões políticas; e a “produtividade dos fatores” é um resíduo, indefinido do ponto de vista econômico (os autores admitem essas três qualificações, mas timidamente).

Assim, me parece que, neste caso, não haveria como fugir de uma boa (e extensa) revisão histórica de como e por que se deram os choques (de petróleo e de produtividade), bem como uma boa fundamentação teórica (e, quem sabe, contrafactual) de como esses choques ocorreriam a despeito das decisões políticas de ambos os partidos.

Concentração do Investimento Brasileiro no Exterior e erro de medida


Já que falamos do CBE no post anterior, aproveito para destacar outro dado daquela pesquisa, que muitas vezes passa despercebido: a concentração do Investimento Brasileiro Direto (IBD) no exterior em poucos investidores. Na publicação dos resultados, os declarantes foram separados pelo tamanho de seu investimento, como, por exemplo, investidores que possuem investimentos no exterior de até US$ 1 milhão (a menor categoria) ou investidores que possuem investimentos no exterior maiores do que US$1 bilhão (a maior categoria).

No quadro 2 da publicação, você encontrará a seguinte distribuição, reproduzida no gráfico abaixo (agrupei as duas últimas categorias do quadro). Em vermelho, você tem o percentual de investidores que se encontram naquela faixa de investimento – perceba que quase 70% dos declarantes do CBE têm um investimento menor ou igual a  US$ 1 milhão e que apenas 0,3% dos declarantes possuem investimentos maiores do que US$500 milhões. Já em azul, você encontra o quanto cada uma dessas categorias responde pelo valor total declarado. Note que 0,3% dos declarantes respondem por cerca de 70% dos 356 bilhões de dólares que o Brasil possuía investidos no exterior.

Concentracao IBD

Em outras palavras, a distribuição do IBD tem cauda bastante pesada – poucas observações respondem pela quase totalidade do valor. Além de ilustrar  o grau de concentração deste tipo de investimento , isto tem uma implicação importante com relação ao (provável) erro de medida, e consequentemente, na incerteza dessas estatísticas.

Para tanto, vejamos o quadro 7, que é análogo ao quadro 2, mas faz a separação apenas para a modalidade de IBD participação no capital. Pelo quadro, 32 declarantes respondem por US$ 158 bilhões do estoque total, isto dá, na média, cerca de US$ 5 bilhões por declarante. Agora veja a distribuição da mesma modalidade por país (quadro 3). Em 2012, o maior estoque de IBD participação no capital, segundo o quadro 3 do CBE, estava na Áustria, com cerca de US$ 57 bilhões. Este valor, então, decresce exponencialmente, sendo a média por país mais ou menos US$ 6 bilhões e a mediana US$ 1 bilhão. Perceba que, caso apenas um dos grandes declarantes esteja classificado de forma errada – e considerando, conservadoramente, o valor médio do grupo – no melhor cenário, se o erro for na Áustria, isso responde por 10% do total estimado para aquele país; se for em um país de IBD médio, isso responde por um erro de 83%; e se for em um país de IBD mediano, o valor do erro é cinco vezes maior do que o valor estimado!

Então se, por um lado, o fato de a distribuição estar concentrada em poucos investidores reduz o número de declarantes que o Banco Central precisa investigar para validar grande parte do valor total declarado, por outro, o impacto de apenas um registro errado pode ser bastante significativo. Note a diferença deste tipo de estatística, para, por exemplo, a estimativa da expectativa de vida média do brasileiro – neste caso, vários registros errados dificilmente alterariam o valor médio de forma substancial.

Para finalizar,  uma curiosidade. Veja abaixo os gráficos do logaritmo do valor do investimento (X) contra o logaritmo da probabilidade de o investidor ter investimentos maiores do que X (a linha preta é reta de regressão). Lembra o gráfico de um lei de potência, não?

CBE_ConcentracaoMais sobre este tipo de assunto neste blog aqui.

 

Empresas com capital estrangeiro no país: informações contábeis e econômicas


Ontem foi publicado novo quadro no Censo de Capitais Estrangeiros no País, com algumas informações contábeis e econômicas das empresas com capital estrangeiro. Os dados podem ser acessados aqui, quadro nº 21.

Em 2010, os dados se referem a empresas de investimento estrangeiro direto, isto é, àquelas que detinham pelo menos um investidor estrangeiro com 10% ou mais do poder de voto. Naquele ano, por exemplo, essas empresas empregaram cerca de 2 milhões de pessoas e responderam por cerca de 40% das importações e exportações nacionais. É interessante notar que não entram nestes dados operacionais os números correspondentes às empresas de investimento estrangeiro indireto cujas informações não estejam consolidadas na matriz. Assim, muito provavelmente, esses números subestimam as atividades relacionadas ao capital estrangeiro no país.

Convém ressaltar que o quadro também apresenta dados contábeis e econômicos das empresas com capital estrangeiro de 1995 a 2005, mas esses não são diretamente comparáveis aos dados de 2010, pois houve uma mudança de metodologia na pesquisa. Em 1995, 2000 e 2005, os dados se referiam às empresas em que os investidores não residentes detinham, individualmente ou não, 10% ou mais das ações ou quotas com direito a voto, ou 20% de participação direta ou indireta no capital total, abarcando grupo de empresas mais amplo do que o da pesquisa de 2010.

Déficits causam câncer


Reinhart e Rogoff perderam muito tempo com os argumentos errados. Vejam o gráfico:

deficit_e_cancer

Brincadeiras à parte, gostei da carta dos autores a Krugman e do post do Hamilton.

Já DeLong argumenta que, se os autores dizem que a idéia geral do artigo não se altera radicalmente por causa dos erros, por outro lado, isso não muda o fato de o argumento ter sido fraco desde o princípio (não que eu concorde com DeLong, mas o ponto é mais do que pertinente):

The third thing to note is how small the correlation is. Suppose that we consider a multiplier of 1.5 and a marginal tax share of 1/3. Suppose the growth-depressing effect lasts for 10 years. Suppose that all of the correlation is causation running from high debt to slower future growth. And suppose that we boost government spending by 2% of GDP this year in the first case. Output this year then goes up by 3% of GDP. Debt goes up by 1% of GDP taking account of higher tax collections. This higher debt then reduces growth by… wait for it… 0.006% points per year. After 10 years GDP is lower than it would otherwise have been by 0.06%. 3% higher GDP this year and slower growth that leads to GDP lower by 0.06% in a decade. And this is supposed to be an argument against expansionary fiscal policy right now?….

Gráfico retirado de Os números (não) mentem.

Sobre a acurácia das variáveis econômicas II


Em post anterior tratamos da importância de se conhecer bem as variáveis com que se trabalha. Muitas vezes o economista utiliza dados que, por sua dificuldade de mensuração, são estimados por terceiros (IBGE, Banco Central, Tesouro Nacional etc). Assim, há uma tendência a se saber muito pouco sobre como esses dados são produzidos na prática e, sem entender quais suas limitações e quais seus pontos fortes, se esquece de tratá-los devidamente como estimativas.

Neste sentido, gostei muito de ver que outros blogs tem compartilhado desta mesma preocupação.

Dave Giles, por exemplo, resume algumas verdades importantes sobre dados oficiais, que são comumente esquecidas:

  • Dados são revisados o tempo inteiro: o número que saiu ontem do PIB pode mudar drasticamente amanhã.
  • Dados somem: eu já enfrentei isso com uma série de horas de trabalho que estava disponível no IPEA Data e que, alguns meses depois, simplesmente foi descontinuada e excluída.
  • As definições e metodologia mudam: por exemplo, a metodologia do Censo de Capitais Estrangeiros no País mudou recentemente. O usuário tem que ter isto em mente e não pode simplesmente comparar um dado com outro sem ajustes.
  • Os dados oficiais são estimativas: sobre isso tratamos no post anterior!

Dave Giles também recomendou alguns papers sobre o assunto e tratou de um interessante relatório sobre a qualidade dos dados chineses, aspecto fundamental para quem analisa aquela economia.

Já Mark Thoma começou a se dar conta do problema ao ler a notícia de que o IBGE americano está incorporando novos aspectos às contas nacionais que, simplesmente, podem “reescrever a história econômica”. Você já parou para se perguntar quantos “fatos estilizados” que conhecemos, como, por exemplo, a semi-estagnação de algumas economias desenvolvidas, podem (ou não) ser fruto da adoção de uma ou outra metodologia? Em posts futuros trarei exemplos interessantes de dados oficiais que são estimativas, mas agora queria tratar sobre aspectos que norteiam a discussão sobre a qualidade dos dados.

Sobre este quesito, o FMI tem um site inteiramente dedicado ao assunto: o Data Quality Reference Site. Trata-se de um louvável esforço para promover a agenda de pesquisa sobre a qualidade dos dados (macro)econômicos. O Fundo criou um interessante marco para a avaliação da qualidade – em um aspecto ainda qualitativo e não quantitativo – dividido em 6 dimensões:

0 – Condições Prévias: busca verificar alguns aspectos institucionais para a produção do dado, como o entorno jurídico e a quantidade de recursos disponível;

1 – Garantias de Integridade: avalia aspectos como o profissionalismo, a transparência e as normas éticas da produção;

2 – Rigor Metodológico: inspeciona se os conceitos e definições adotados estão conformes ao padrão internacional, se o alcance da pesquisa é suficiente, se as categorizações são adequadas;

3 – Acurácia e Confiança: verificam a adequação das fontes de dados utilizadas, se há um processo de avaliação, validação e revisão dos dados, se as técnicas estatísticas são sólidas;

4 – Utilidade para o Usuário: trata de questões de periodicidade, pontualidade, consistência e revisão;

5 – Acesso: aborda questões de acesso aos dado, acesso aos metadados (isso é, aos dados sobre como os dados foram produzidos) e assistência aos usuários.

O ideal seria termos, também, uma noção quantitativa do erro, mas este esforço já é um grande passo. Você pode encontrar o detalhamento destes pontos para contas nacionais, contas externas, finanças públicas, índices de preço, entre outros, em seu respectivo Data Quality Assessment Framework.

Você, que já trabalhou ou pretende trabalhar com dados em painel, comparando diversos países, já teve a curiosidade de se perguntar sobre a diferente qualidade dos dados que está misturando?

Para alguns países, é possível fazer isso analisando o seu Report on the Observance of Standards and Codes (mais conhecido como ROSC) sobre dados. Tomando o caso do Chile como exemplo, que possui um ROSC para dados no ano de 2007, seria possível descobrir que havia sérios problemas no escopo da pesquisa de índices de preços, e que havia propostas para solucionar a questão em dezembro de 2008. Perceba que, para quem trabalha com dados de preços chilenos antes de 2007, esta é uma informação fundamental!

Investimento Estrangeiro Direto (IED) no Brasil – 2010 e 2011


O Banco Central do Brasil divulgou, hoje, os resultados do Censo de Capitais Estrangeiros no País para os anos de 2010 e 2011. O estoque total de IED estimado para 2010 é de US$670 bilhões e, para 2011, esse valor alcançou a cifra de US$688,6 bilhões.

O Censo agora conta com nova metodologia que permite estimar o estoque integral de IED, segundo os padrões internacionais definidos na sexta edição do Manual de Balanço de Pagamentos e Posição Internacional de Investimentos (conhecido como BPM6) do FMI, e na quarta edição das Definições de Referência de IED (conhecido como BD4). Entre as novidades da pesquisa encontram-se: (i) a mensuração do IED empréstimo intercompanhia; (ii) a valoração por valor de mercado do IED participação no capital; e, (iii) a separação entre país do investidor imediado e país do investidor final. Então é preciso cautela ao comparar os dados desses dois anos com os dados dos anos anteriores.

Quanto ao primeiro ponto, o IED empréstimo intercompanhia totalizou US$82,8 bilhões em 2010 e US$99,4 bilhões em 2011 valores, portanto, substanciais. Já a mensuração por valor de mercado, apesar de ter sido realizada para apenas 11% dos declarantes, respondeu por um aumento no estoque de IED participação no capital de US$121,2 bilhões, em 2010, e de US$89,9 bilhões, em 2011, em comparação ao valor por patrimônio líquido. Por fim, a diferenciação entre país do investidor imediato e país do investidor final permite reduzir a distorção das estatísticas causadas por paraísos fiscais. Por exemplo em 2010, pelo critério de investidor imediato, a Holanda tem estoque de US$163,3 bilhões de IED participação no capital, enquanto que, pelo critério de investidor final, este número cai para US$14,9 bilhões.

Vale ressaltar aqui outra novidade: o Censo, que antes era quinquenal, passou a ter uma edição anual, direcionada a declarantes de grande porte. Deste modo, enquanto, em 2010, a pesquisa contou com 16.844 declarantes, em 2011, a pesquisa foi realizada com 3.176, cerca de 19% do número anterior, mas representando estoque declarado de IED participação no capital de US$523,3 bilhões (89% do valor total). Os 11% restantes foram foram estimados com base na última declaração dos demais declarantes, acrescidos os fluxos do balanço de pagamentos e dados do registro de capital estrangeiro (RDE-IED).

Para aqueles que se interessam por dados de investimento estrangeiro no Brasil, confira a nota aqui e os dados em excel aqui.