Está pesquisando apartamento para alugar em Brasília? Um pouco de web scraping, manipulação e visualização de dados com os valores (de oferta) dos aluguéis de 1.030 imóveis (Asa Sul, Asa Norte e Sudoeste) do site wimoveis pode ajudar a responder algumas perguntas interessantes.
A primeira delas: qual o bairro mais caro para se alugar, hoje, no plano piloto? Esta é uma pergunta que, veremos, depende do ponto de vista. Veja a tabela abaixo (versão ampliada aqui). M2 quer dizer metro quadrado e pm2 preço por metro quadrado.
Na média e mediana – em conformidade com a impressão pessoal de muitos – a Asa Sul é o bairro mais caro para se alugar dos três. Entretanto, note que isso ocorre porque há mais apartamentos maiores para aluguel na Asa Sul, e não porque o valor por metro quadrado é mais caro. Na verdade, o valor por metro quadrado, na média, é maior na Asa Norte e, na mediana, maior no Sudoeste.
Podemos agora decompor a tabela acima não somente por bairro, mas por bairro e número de quartos (versão ampliada aqui) . Na média, o bairro mais barato/caro para morar não é o mesmo a depender de quantos cômodos você quer no apartamento. E, uma curiosidade: na amostra, a média do tamanho dos apartamentos da Asa Norte, em todos os grupos de números de quartos, é menor do que a média do tamanho da Asa Sul.
Uma última forma de visualizar as diferenças de preços pode ser com um gráfico de densidade (versão ampliada aqui):
Veja que o pico do Sudoeste (em verde) é em valores mais altos do que na Asa Norte e na Asa Sul. Entretanto, a Asa Sul tem a “cauda” mais pesada em valores próximos a R$ 5.000.
Uma outra pergunta que podemos tentar responder é a seguinte: dos anúncios que temos hoje, na média, os preços daqueles atualizados em 2014 são maiores do que aqueles cuja última atualização foi feita em dezembro de 2013? Pelo quadro abaixo (versão ampliada aqui), infelizmente, sim, e por mais ou menos RS$100,00.
E como é a concentração da oferta dos anúncios por corretora? A distribuição de anúncios por imobiliária é homogênea?
Aparentemente, não. Veja o gráfico abaixo (versão ampliada aqui).
Enquanto algumas imobiliárias têm 30 a 40 apartamentos listados, muitas outras têm apenas 1 ou 5.
Isso quer dizer que os anúncios são concentrados? Não necessariamente. Note que apesar de a distribuição de anúncios não ser homogênea, a concorrência é bem grande, e usando como exemplo o índice de Herfindahl–Hirschman chegamos a um valor de 0.013, comumente considerado indicador de alta competitividade.
Há mais que poderíamos ver sobre aluguel. Mas deixemos para depois. No próximo (em algum próximo) post veremos os dados de valor de venda!
PS: iremos acompanhar regularmente esses preços. E não somente para Brasília. Uma área específica do blog será criada para isso.
Bom post. Existe algum plano de compartilhar o código do crawler no final?
CurtirCurtir
Existe sim, estou aprendendo a usar o GitHub para fazer isso. Neste meio tempo, você pode dar uma olhada no pacote XML do R. Abs
CurtirCurtir
Excelente!
O pessoal do http://www.bolhaimobiliaria.com vai acompanhar de perto estas análises.
Aliás, um estudo sobre a bolha imobiliária brasileira seria de grande valia para quem se aventura em um mercado com ZERO informação e ZERO transparência.
CurtirCurtir
Bacana, Pedro!
O site de vocês é bem interessante.
Abs
CurtirCurtir
Gostei muito da tua análise, mas senti falta de uma coisa.
Quando se compra preços, mesmo que seja em um período curto é comum deflacionar os preços para por compará-los no mesmo nível.
CurtirCurtir
Obrigado pelo comentário, Daniel.
Quando formos fazer comparações de preços de pesquisas feitas em tempos diferentes, podemos deflacionar.
Mas, note que, no caso, as comparações são de preços que estavam vigendo no mesmo dia, 29/01/2014. A comparação temporal não é de preços em datas diferentes, mas de data de inclusão do anúncio. Então não faria sentido deflacionar o preço, pois aquele é um preço que ainda valia em 29/01/2014.
Abs
CurtirCurtir
Muito bacana a análise, Cinelli.
Imagino que a amostra foi composta apenas por apartamentos não-mobiliados.
Como conclusão, você indicaria seguir o que indica a mediana, visto que a média é mais suscetível aos efeito dos outliers?
Abraço.
CurtirCurtir
Exato, os dados são de apartamentos não-mobiliados e a mediana nesse caso é mais robusta tanto a outliers reais quanto outliers por erros de preenchimento (que foram verificados antes da análise, mas sempre sobram alguns pois é impossível verificar todos os dados).
Abs!
CurtirCurtir
Pingback: Mapa de aluguel em Brasília (Plano Piloto) | Análise Real
excelente post !!
CurtirCurtir
Pingback: Retrospectiva: posts mais lidos de 2014 | Análise Real
Boa tarde Carlos,
Excelente iniciativa.
Também sou estudante de R e gostaria de saber como você fez para conseguir os dados? Web Scrapping do site do Wimoveis? Utiliza algum site específico para isso ou fez na mão (em R) mesmo? Poderia compartilhar mais informações (talvez o código se for possível).
De onde vocês são?
abraços,
Luciano.
CurtirCurtir