Links diversos: Discriminação de preços em passagens, vídeo Piketty na USP e replicação dos códigos dos artigos.


Seguem alguns links interessantes da semana:

- Vai comprar passagens? Então não busque somente no “site em português” da companhia aérea, mas também nas versões estrangeiras. Algumas vezes o preço pode ser mais barato, bem mais barato.  Para verificar se isso ocorre por aqui, simulei hoje uma passagem Brasília – Vitória para a virada do ano, tanto na versão em português quanto na versão em inglês do site da TAM. Resultado: no site em inglês a passagem está quase R$1.000,00 mais cara. Neste caso, o gringo que estiver no Brasil pode economizar bastante apenas mudando a linguagem da página, mas já houve relatos de o inverso acontecer (a passagem no site em inglês estar mais barata).

- Lembra que o Piketty estava pelo Brasil? Pois bem, para quem não conseguiu estar presente, agora o  vídeo do debate que ocorreu na USP, com André Lara Resende e Paulo Guedes, está disponível (via Prosa Econômica).

-  Desde 2005, o Quarterly Journal of Political Science solicita aos autores os dados e códigos necessários para a replicação de seus papers. Com isso, o periódico faz uma revisão bem básica: apenas roda o que foi enviado pelos autores - as is – e verifica se os resultados são os mesmos apresentados pelo artigo. Este processo simples tem valido a pena? Segundo Nicholas Eubank, sim:

Experience has shown the answer is an unambiguous “yes.” Of the 24 empirical papers subject to in-house replication review since September 2012, [1] only 4 packages required no modifications. Of the remaining 20 papers, 13 had code that would not execute without errors, 8 failed to include code for results that appeared in the paper, [2] and 7 failed to include installation directions for software dependencies. Most troubling, however, 13 (54 percent) had results in the paper that differed from those generated by the author’s own code. Some of these issues were relatively small — likely arising from rounding errors during transcription — but in other cases they involved incorrectly signed or mis-labeled regression coefficients, large errors in observation counts, and incorrect summary statistics. Frequently, these discrepancies required changes to full columns or tables of results. Moreover, Zachary Peskowitz, who served as the QJPS replication assistant from 2010 to 2012, reports similar levels of replication errors during his tenure as well. The extent of the issues — which occurred despite authors having been informed their packages would be subject to review — points to the necessity of this type of in-house interrogation of code prior to paper publication.

Fica a pergunta: quantos journals brasileiros fazem isso?

(via Dave Giles)

USP com a mão na massa!


Parece que Sérgio Almeida e Mauro Rodrigues, do Economistas X, estão com um paper bacana no forno: coletar os próprios dados não é tarefa fácil, confiram no post algumas das agruras pelas quais os dois passaram!

PS: sou partidário da idéia de que a coleta de dados interessantes vale um paper por si só. E, claro, que os dados sejam abertos ao público! 

 

 

Mapas de roubos em Brasília?


Recentemente conheci um site com uma iniciativa bem bacana chamado Onde Fui Roubado. Lá qualquer pessoa pode reportar um crime especificando local, hora, objetos roubados e inclusive fornecer um relato. Há mais de 16 mil registros para várias cidades do país, e resolvi fazer um webscraping para ver como são estes dados.

Especificamente para Brasília, infelizmente, existem apenas cerca de 200 registros. A maioria na Asa Sul, Asa Norte e Sudoeste, com mais de 100. A ideia aqui será montar um mapa de calor, ou de densidade, dos roubos no Plano Piloto.

Temos, entretanto, dois problemas que valem ser ressaltados: (i) a amostra é pequena; e, (ii) possivelmente viesada. Isto é, como o site ainda não parece ser muito conhecido, não necessariamente o público que está informando é representativo da população do local. Ainda assim, tendo em mente essas ressalvas, vamos brincar um pouco com a visualização dos dados!

Primeiro, vejamos um mapa com todos os casos – note que, quanto mais vermelho, maior a concentração de roubos reportados na região. A maior parte dos registros foram na Asa Sul e Asa Norte. Na Asa Norte, em especial, a região próxima à UnB tem destaque. Lembre que talvez isto seja decorrência, por exemplo, de pessoas mais jovens conhecerem o site e reportarem mais casos.

crimes_geral

 

Vamos dividir agora o mapa por horário do roubo, entre manhã, tarde, noite e madrugada. A maior parte dos roubos registrados ocorreu durante a noite, com focos na Asa Norte e início da Asa Sul.

hora

 

Vejamos, ainda, uma divisão por dias da semana. De maneira consistente com os mapas anteriores, aparece um foco nas sextas, na região próxima à UnB.

semana

Poderíamos fazer um mapa cruzando dias da semana e hora, mas temos poucos dados para isso. A ideia aqui é mostrar como podem ser poderosas essas visualizações! Se a Secretaria de Segurança Pública liberar os microdados dos BO’s (se alguém tiver estes dados, por favor, entre em contato), seria possível montar mapas bem acurados. E imagine cruzá-los com as informações de imóveis - poderíamos medir o impacto da criminalidade nos preços imobiliários.

Por fim, reforço a divulgação do Onde Fui Roubado, é uma iniciativa louvável!

***

A quem interessar, seguem os códigos para a construção dos mapas. Os dados podem ser baixados aqui.


library(ggmap)
library(dplyr)

### carrega dados
dados <- readRDS("roubo2.rds")

### Pega mapa de Brasília
q<-qmap("estadio mane garrincha, Brasilia", zoom=13, color="bw")

### transformando data em POSIXlt e extraindo hora

dados$hora <- as.POSIXlt(dados$data)$hour

### selecionando a base de dados do plano piloto, criando semanas e horários
bsb <- filter(na.omit(dados), cidade=="Brasília/DF",
lon > -47.95218, lon < -47.84232,
lat > -15.83679, lat < -15.73107)%.%
mutate(semana = weekdays(data),
hora = cut(hora,
breaks=c(-1,6,12,18,25),
labels=c("Madrugada", "Manhã", "Tarde", "Noite")))

### reordenando os dias da semana
bsb$semana <- factor(bsb$semana, levels = c("segunda-feira", "terça-feira",
"quarta-feira", "quinta-feira",
"sexta-feira", "sábado", "domingo"))

### estrutura básica do gráfico
map <- q + stat_density2d(
aes(x = lon, y = lat, fill = ..level.., alpha = ..level..),
size = 2, bins = 4, data = bsb,
geom = "polygon")

### mapa geral
map + scale_fill_gradient(low = "black", high = "red", guide=FALSE)+
scale_alpha(guide=FALSE)

### mapa por dia da semana
map+scale_fill_gradient(low = "black", high = "red", guide=FALSE)+
facet_wrap(~ semana)+scale_alpha(guide=FALSE)

### mapa por horário
map+scale_fill_gradient(low = "black", high = "red", guide=FALSE)+
facet_wrap(~ hora) + scale_alpha(guide=FALSE)

 

E se os economistas escrevessem os cartões de Natal?


Fim de ano e festas chegando, nada mais justo do que aproveitar para reciclar rever posts antigos.

Para o Natal, nada melhor do que repetir o post do ano passado, mas com uma atualização para não dizer que sou completamente preguiçoso.

*** Atualização para 2013 ***

- Entrevista com o “Scrooge” economist  Waldfogel (para saber quem é Waldfogel, leia o post abaixo);

- Como dito no post do ano passado (abaixo), nem todos os economistas são os estraga-prazeres das trocas de presentes natalinas. Na verdade, a maioria (54%) parece não ser.

- Seguindo o link anterior: e se os economistas escrevessem os cartões de Natal? Segue exemplo da grande sensibilidade sobre a alma humana que um economista pode ter.

natal

*** Post de 2012 ***

É fim de ano. Provavelmente, você foi convidado para participar de um amigo-oculto da sua empresa. Você, animado, comprou aquele vinho bacana… mas, voltou com uma vela de Natal para casa. É capaz, ainda, de a pessoa que voltou com o seu vinho não ser um apreciador da bebida e, caso pudesse, ter preferido ficar com a sua vela.

O mesmo pode acabar acontecendo, também, nas trocas de presentes de Natal em família. Será que aquela roupa que você comprou para seu sobrinho mais novo era, realmente, o melhor uso que ele faria do dinheiro? Muito difícil. Você terá sorte se ele não falar na sua frente (e na frente de todos) que preferia um jogo de PlayStation 3. Nem ele e nem você saem felizes.

Todos esses são exemplos de ineficiência. Os presentes, em geral, perdem muito valor para quem os recebeu. E é aí que o economista, geralmente estraga-prazeres, entra para estimar qual é a perda que os presentes das festas de fim-de-ano geram na economia.

Waldfogel, há cerca de 20 anos, em artigo intitulado “o peso-morto do Natal“, estimou esta ineficiência para os EUA, com base em uma amostra de estudantes de economia de Yale. Resultado: os presentes recebidos perdiam cerca de 10% a 30% do valor, podendo gerar um “desperdício” anual de 4 a 13 bilhões de dólares (isso a dólares de 1992!).

Mas, nem todos os economistas querem acabar com a magia do Natal. E aquele rabisco desenho que seu filho fez especialmente para você, com um “te amo papai!” ao final? O custo foi quase zero, mas o valor do presente é quase inestimável! Deste modo, os resultados de Waldfogel foram contestados por Solnick e Hemenway. Os autores alegaram que amostra utilizada era muito restritiva e, assim, não representativa. Com uma amostra mais abrangente, envolvendo entrevistas em trens e aeroportos, o resultado dos autores foi em direção bastante diversa: dar presentes aumenta, em média, em 214% o valor recebido!

List e Shogren julgaram que ambos os artigos tinham um problema metodológico. Tentaram, assim, melhorar os resultados com leilões em que os sujeitos indicariam a quanto estavam dispostos a vender seus presentes de Natal. O resultado também foi de um ganho, mas menor do que anterior, entre 121% a 135%.

Por fim, Ruffle e Tykocinski argumentaram que as principais divergências entre os estudos decorreram, não da amostra utilizada, mas da forma como a pergunta foi formulada. Enquanto um perguntou “quanto dinheiro o tornaria indiferente”, para uma platéia de economistas, o outro perguntou “quanto dinheiro o deixaria igualmente feliz”, pois temia que não-economistas pudessem ignorar o conceito de indiferença. Aparentemente, a mera introdução da palavra “feliz” tem um efeito enquadramento poderoso, fazendo com que as estimativas subam cerca de 50% quando comparadas com a pergunta anterior.

20121224-183054.jpg
Feliz Natal (e boa sorte)!

Livros de R e Python


Compartilharam comigo, agora passo em frente. Seguem dois links com alguns livros em pdf para programação em R e em Python.

Mais sobre Python: o Sargent publicou um livro online de modelagem e economia quantitativa com a linguagem.

Felicidade, Realidade e Expectativa


Vocês já devem ter visto as seguintes fórmulas para a felicidade: 1) Felicidade=Realidade/Expectativa e 2) Felicidade=Realidade-Expectativa.

Essas fórmulas foram amplamente divulgadas e fazem parte do discurso do dia-a-dia. Intuitivamente, elas parecem fazer sentido, pois, quanto maior a expectativa que você tem com relação a algo, e quanto mais esta expectativa se afasta da realidade, maiores a chances de você se decepcionar e ficar infeliz. Entretanto, estas fórmulas implicam mais do que isso e, aparentemente, elas foram aceitas de forma passiva e nunca colocadas à prova ou discutidas criticamente pela sociedade. Vejamos. Chamemos Felicidade de “F”, Realidade de “R” e Expectativa de “E”. Assim, nossas fórmulas seriam: 1) F = R/E e 2) F = R - E

Para verificar se elas fazem sentido, confrontemos com nossa experiência. Imagine que você seja muito pobre. Ganhar uma casa própria aumentaria em muito sua felicidade, certo? Por outro lado, se você fosse extremamente rico, uma casa a mais não afetaria em mesma magnitude sua felicidade. Se você concorda com este fato, as equações acima não estão adequadas, pois ambas são lineares em R. Isto é, elas ferem o princípio que acabamos de descrever de que, quanto mais riqueza você tem – quanto melhor sua realidade – menos felicidade a riqueza adicional te proporciona. A função número 2 também fere o mesmo princípio para as expectativas, pois implica que um aumento de expectativas tem sempre o mesmo impacto (negativo) sobre a felicidade.

A função 1 é um tanto peculiar em outros aspectos. Em primeiro lugar, note que para ela fazer sentido temos que ter E \in (0, \infty) e R \in (0, \infty) e isto nunca é explicitado nos memes do Facebook. Além de o ponto zero causar uma descontinuidade, veja que se permitirmos E negativo junto a um R positivo (ou vice-versa), isto feriria o senso-comum de que quanto pior a expectativa frente à realidade, mais feliz a pessoa é. Além disso, a derivada de 1) em relação a E é igual a \partial F/\partial E = -R/E^2 – isso significa que a desutilidade da expectativa depende da realidade. Mais especificamente, quanto melhor a realidade, pior o impacto de um aumento de expectativa. Suponha que você tinha uma expectativa de ganhar uma oferta de salário de R$1.000,00 e, por algum motivo, esta expectativa aumenta para R$2.000,00. Quanta tristeza este aumento de expectativa pode gerar? Se a realidade for uma proposta de R$500,00, nossa fórmula diz que a sua mudança de expectativa reduziu sua felicidade em 0.25. Já se a realidade for uma proposta de R$800,00, a equação diz que sua mudança de expectativa reduziu sua felicidade em maior magnitude, 0.4. Isto te parece plausível? Para mim, não.

Deste modo, essas equações de internet são falaciosas e você deveria parar de compartilhar os memes que as contém. Mas, reconheço, essa recomendação será inócua sem uma fórmula nova que substitua as que rejeitamos. Assim, proponho uma, conforme abaixo. Deixo para o leitor o escrutínio da sugestão.

F = Ln(R) - Ln(E), E \in (0, \infty), R \in (0, \infty)

E já vem com o mene pronto.

or85s

De antemão peço desculpas aos meus co-autores por ter perdido tempo nisso, mas as vezes a vontade de procrastinar fala mais alto.

Bicicletas aumentam em 30% a permanência de meninas na escola, na Índia.


Foi o que encontraram os pesquisadores Karthik Muralidharan e Nishith Prakash. A bicicleta afeta principalmente as meninas que vivem entre 5 a 10 Km da escola. Isto mostra: (i) como pequenas distâncias, isto é, pequenos custos, podem ter efeito substancial em algo tão importante no longo prazo como a educação; mas, também, que (ii) esses obstáculos podem ser, muitas vezes, resolvidos com medidas bastante simples.

Veja, abaixo, o vídeo dos pesquisadores:

Via Mankiw.