terça-feira, 21 de outubro de 2014

Como medir efeitos causais em séries temporais?

http://google-opensource.blogspot.com.br/2014/09/causalimpact-new-open-source-package.html

Séries temporais constituem a área da Estatística que se dedica a estudar fenômenos onde as respostas estão relacionadas através do tempo. Como exemplo, a temperatura de hoje está relacionada à temperatura de ontem e qualquer sistema meteorológico de sucesso deve incorporar essa dependência. Tempo é a dimensão mais óbvia e importante de dependência e empresta o nome a essa área da Estatística. Mas outras dimensões podem exibir o mesmo tipo de dependência. A temperatura e visibilidade da água do mar estão diretamente relacionadas à profundidade da medição e se a água estiver fria na superfície, existem chances altas dela também estar fria a 1 metro de profundidade. Assim, o mesmo tipo de dependência está presente aqui na dimensão da profundidade. 

Efeitos causais estão associados à presença de variáveis auxiliares no estudo de séries temporais. Uma série temporal importante é o nível de vendas de uma empresa. Esse nível é impactado por uma série de fatores associados à economia (taxa de juros, poder de compra, ...) e à empresa (preço, publicidade,...). Esses são os efeitos causais do título da postagem e a pergunta diz respeito a encontrar formas adequadas de quantifica-lo.  

Esse é um problema antigo para o qual já foram obtidos inúmeros avanços relevantes. Ele está sendo trazida aqui por conta de um software gratuito criado recentemente pela equipe de pesquisadores da Google que são dedicados especificamente a esse tema. A idéia adotada por essa equipe também não é nova: medir o efeito através do contraste de previsões feitas com e sem a presença desse efeito. A figura acima, extraída do material de divulgação do software, ilustra essa idéia ao comparar as previsões (pontuais e por intervalos) feitas com e sem a presença da variável causal.

Para fazer isso, a equipe do Google lança mão de modelos de espaço de estados, comuns na área de séries temporais, abordados sob a ótica Bayesiana. É particularmente relevante notar que a Google tem uma equipe de pesquisa muito forte na área de Estatística, com uma forte inclinação Bayesiana. Como se trata de uma das empresas protagonistas no cenário de inovações tecnológicas, é reconfortante saber da importância que a Estatística e a visão Bayesiana possuem. 

O artigo contendo a descrição técnica da proposta da Google pode ser obtido gratuitamente aqui. Ele pode ser incompreensível para o público leigo. Mas para o público treinado estatisticamente, ele é uma composição relativamente bem conhecida de metodologias de aproximação (MCMC), aplicadas à inferência Bayesiana em modelos de espaço de estados. 

http://google-opensource.blogspot.com.br/2014/09/causalimpact-new-open-source-package.html

Nenhum comentário:

Postar um comentário