Links diversos: o Estatístico Automático e um pouco de história do R.


Seguem alguns links interessantes:

1. Andrew Gelman comentou sobre o estatístico automático e resolvi testar. Como ainda é um protótipo, por enquanto o site só trabalha com modelos lineares. O que o algoritmo tentará fazer? O seguinte:

 (…)  the automatic statistician will attempt to describe the final column of your data in terms of the rest of the data. After constructing a model of your data, it will then attempt to falsify its claims to see if there is any aspect of the data that has not been well captured by its model.

Testei com os dados dos votos municipais na Dilma vs variáveis socio-econômicas dos municípios (primeiro turno). Veja aqui os resultados.

2. Ok, este link só vai ser interessante se você tiver um pouco de curiosidade sobre o R. Rasmus Baath comprou os livros das antigas versões do S (a linguagem que deu origem ao R) e ressaltou alguns pontos interessantes sobre o desenvolvimento da linguagem ao longo do tempo.

Você Fiscal: ajude a fiscalizar o processo eleitoral brasileiro.


Aproveitando os posts sobre eleição, divulgo aqui o Você Fiscal, iniciativa do professor Diego Aranha. A idéia é que eleitores tirem fotos do Boletim de Urna logo após o encerramento das eleições para realizar uma apuração independente dos resultados. Há um aplicativo para Android, mas você também pode participar sem o aplicativo. Confira abaixo o vídeo sobre o projeto:

 

Artur Avila ganha Medalha Fields! E encontro de complexidade no IPEA.


Duas notícias que tenho de compartilhar:

A primeira – que você já deve ter visto mas que ainda assim vale reforçar – é que o brasileiro Artur Avila ganhou a Medalha Fields!

Já a segunda é que, agora no começo de setembro, haverá o Seminário Internacional Modelagem de Sistemas Complexos para Políticas Públicas no IPEA.

Nate Silver – Previsões para a copa do mundo


Nate Silver lançou suas previsões para a copa do mundo: Brasil sai como favorito, com 45% chances de ganhar.
20140609-213015-77415484.jpg
O que você acha das previsões? Quer entender como chegaram a esses números? Leia, aqui, a discussão que Nate faz sobre o modelo!

Os 24 tipos de autoritários e os 24 tipos de libertários


 

Os autoritários:autoritarismoE os libertários (em inglês):

types_of_libertarian1

Via information liberation, lefty cartoons e Economistas X (versão em português).

 

Analise a rede de seu facebook


Continuando o tema de análise de redes, abordado em post passado, vejamos agora um exemplo legal que você mesmo pode reproduzir!

O gráfico abaixo é o da minha rede do Facebook. Cada nódulo representa uma pessoa (não coloquei os nomes, mas você pode colocar caso queira) e cada arco uma relação de amizade entre elas.

Veja que as pessoas foram separadas em grupos com base nas relações de amizade, e cada grupo recebeu uma cor diferente. Isto foi feito por um algoritmo que, no meu caso, corretamente identificou os grupos sociais da rede (trabalho, família, viagens, cursos) com base em quão fortemente conectados os nódulos são. Perceba que algumas pessoas são representadas por nódulos maiores: no caso, elas são pessoas com alto nível de betweeness centrality, isto é, pessoas que são como uma ponte para grupos de amizades distintos dentro da rede – também seria possível mudar o tamanho dos nódulos segundo o número de conexões de cada pessoa (grau, na linguagem de rede) ou outras medidas de centralidade.

rede_do_facebook

Bacana, não?

Quer fazer o seu? Você vai precisar entrar no aplicativo Netvizz para baixar os dados do Facebook e, depois, rodá-los no programa Gephi (que pode ser baixado gratuitamente aqui). Caso tenha alguma dificuldade, há um didático tutorial na internet. Futuramente, para não dizer que não falamos de economia, vamos fazer esse mesmo experimento com a visualização de dados de investimento direto no exterior e ver o que sai.

Nova base de dados de séries de tempo


Há pouco tempo surgiu uma nova base de dados de série de tempos – Quandl.

Além de agrupar diversas estatísticas de fontes diferentes, o site permite baixar os dados em vários formatos (como excel ou csv) e ainda permite importação de dados diretamente em várias ferramentas de análise, como R e Python. Isso é uma mão na roda em muitos casos.

Outra possibilidade no Quandl é a de incorporar gráficos diretamente nos posts, tal como o exemplo abaixo com a evolução do IPCA acumulado em 12 meses.

Graph of IPCA - Acumulado em 12 meses

Apesar da ressalva de ser uma fonte secundária de informações, para quem ainda não conhecia, certamente vale a pena conferir.