Data Colada!


Fazia algum tempo que não descobria um blog tão bom quanto o Data Colada!

Em especial destaco esse post  que discute a falha na replicação de um estudo famoso sobre posições corporais e níveis de testosterona e cortisol (o vídeo do TED sobre o estudo tem mais de 26 milhões de exibições):

4-hormones-2

Detalhe que ao final do post há comentários dos autores tanto do artigo original, quanto da réplica.  E o post também discute o uso de curvas de p-valor para esse caso (há um web-app para construir as curvas de p-valor). Muito bacana.

Pessoas não gostam quando economistas dizem para elas fazerem mais sexo, descobrem economistas.


Tradução ipsis litteris do título do artigo do Quartz.

The findings seem to indicate that “the instruction to have more sex leads to a decline in wanting for sex and in enjoyment of sex.

Por mim, esse entra para a lista dos gag papers, mesmo que involuntariamente.

PS1: candidato ao Ig Nobel?

PS2: Subscrevo a dica do Quartz – Relationship pro-tip: Don’t take part in economics studies

Caçando p-valores, causalidade, LaCour e Pnad Contínua no R


Links diversos

Captura de Tela 2015-06-17 às 09.12.24

Livros de R – sugestões


Algumas pessoas têm pedido recomendações de livros de R, então seguem, abaixo, algumas dicas. Evidentemente essa lista não é exaustiva, na parte de estatística e machine learning, por exemplo, há uma infinidade de livros, muitos com temas bastante específicos (como métodos estatísticos voltados para genética etc).

Livros mais gerais

Se você está iniciando no R, comece estudando um dos livros abaixo (ou se sentir necessidade, dois). Eu recomendaria iniciar com o R for dummies.  Apenas depois de ler um desses, vá para os livros mais específicos.

·         R for dummies;
·         The Art of R programming;
·         R for everyone;
·         R in action.

Livros sobre gráficos

Esses são os três principais livros sobre gráficos no R e trabalham com gráficos base, ggplot2 e lattice. Vale lembrar que esses não são livros que vão te ensinar a fazer bons gráficos, mas sim livros que vão te ensinar a como fazer gráficos no R.

·         ggplot2: Elegant Graphics for Data Analysis;
·         Lattice: Multivariate Data Visualization with R;
·         R Graphics.

Livros de Estatística

Como disse no começo, essa lista é enorme. Existem livros específicos de séries temporais, de dados espaciais etc. Seguem quatro sugestões que abordam estatística geral, regressões, séries temporais e estatística bayesiana.

·         Discovering Statistics Using R (Ainda não li, mas falaram muito bem do Andy Field, parece ser um livro bastante didático de estatística usando o R);
·         An R Companion to Applied Regression ;
·         Introductory Time Series with R ;
·         Doing Bayesian Data Analysis: A tutorial with R, JAGS and Stan (Este livro é bastante didático, uma ótima itrodução para estatística Bayesiana);

Machine Learning

Também existem vários livros de machine learning usando o R. Eu recomendo fortemente usar o pacote caret e o livro do pacote é o Applied Predictive Modeling. Existem dois livros de teoria do Hastie e Tibshirani que estão disponíveis gratuitamente na internet e que podem ser bastante úteis: um livro mais didático de introdução ao assunto é  (An Introduction to Statistical Learning) e uma versão mais detalhada (The Elements o Statistical Learning).

·         Applied Predictive Modeling  (sobre o pacote caret – recomendo fortemente);
·         An introduction to Statistical Learning: with applications in R (um pouco menos de aplicações em R, mas mais didático, versão gratuita disponível na internet – também tem curso online);
·         The elements of statistical learning (não trata de R em si, complementa os livros acima).

Temas mais avançados

Algumas sugestões de temas interessantes.

·         Advanced R (para saber um pouco mais como o R funciona);
·         R packages (fazer pacotes no R);
·         Seamless R and C++ integration with Rcpp (integrar R com C++, não adiante ler sem saber um pouco de C++)
·         XML and Web Technologies for Data Sciences with R (integração do R com tecnologias web)
·         Dynamic Documents with R and knitr (criar documentos dinâmicos – como um paper ou um livro- diretamente do R)
·          Orientação a objetos S4 em R (não é um livro, mas é um material bacana para orientação a objetos S4).