Tesla and self driving cars


O tempo está corrido mas tenho que falar do Musk de novo. A Tesla acabou de anunciar que todos os seus carros a partir de agora virão equipados com hardware para condução automática via machine learning.

Anúncios

Detectando reviews falsos na Amazon


Agora que comecei a usar mais a Amazon no dia-a-dia (usava basicamente para livros e eletrônicos) percebi a quantidade assustadora de reviews falsos que existem por lá. Isso naturalmente levou a outra pergunta: que tal usar análise de dados para filtrar os reviews falsos dos verdadeiros?

Pois bem, como quase toda a idéia que temos, alguém já a implementou. Então se você ainda não conhece, vai aqui a dica do fakespot. Usando técnicas de processamento de linguagem natural e machine learning, o site tenta identificar quais e quantos reviews são realmente autênticos. O serviço poderia ser melhor executado, mas tem funcionado bem nos casos que testei.

Seminário – Ciência de Dados e Sociedade, dia 15 de Junho às 19h, no Auditório do Instituto de Ciência Política da UnB


Inscrições e mais informações aqui. Estaremos no seminário eu, Daniel Marcelino e Rommel Carvalho.

Previsões para o Impeachment


Agora que o processo foi aberto, acho que muitos vão querer brincar com diferentes cenários. Por enquanto conheço apenas duas ferramentas que possam satisfazer um pouco sua curiosidade:

1. O Polling Data do Neale, que tem uma seção para o impeachment (vá em Modelos/Big Data e depois em impeachment); e

Captura de Tela 2015-12-02 às 22.01.36

(se o site não funcionar agora, tente novamente mais tarde, o Polling Data está passando por problemas técnicos)

2. O “Vai Passar” do Estadão Dados (mas que não tem a opção de simular com 2/3 dos votos).

Captura de Tela 2015-12-02 às 22.01.57

PS: o que mais gostaria de ver agora seria uma análise com teoria dos jogos explicitando bem todos os jogadores, as jogadas permitidas e respectivos payoffs .

Let the simulations begin!

Inferência causal e Big Data: Sackler Big Data Colloquium


Uma série de palestras interessantes do Sackler Big Data Colloquium:

 

Hal Varian: Causal Inference, Econometrics, and Big Data

***

Leo Bottou: Causal Reasoning and Learning Systems

***

David Madigan: Honest Inference From Observational Database Studies

***

Susan Athey: Estimating Heterogeneous Treatment Effects Using Machine Learning in Observational Studies

Foda-se a nuance, entrevista com Alvin Roth, erro de medida no desemprego e Machine Learning no Airbnb.


Algumas leituras e vídeos interessantes

– Kieran Healy mandando um fuck nuance. (Abstract: Seriously, fuck it).

– Entrevista de Alvin Roth no Google:

– Sobre a acurácia das variáveis econômicas: quanto é o desemprego da China? Nessa linha, qual é a medida adequada para “desemprego”? Veja uma discussão interessante para o caso dos EUA no Econbrowser.

Como o Airbnb usa Machine Learning?