terça-feira, 24 de fevereiro de 2015

Comparação de modelos e múltiplos cenários

http://kaiserassociates.com/

A postagem da semana passada tratou desse assunto sob a ótica Bayesiana. O interesse no tópico não é uma prerrogativa dessa abordagem. O assunto também desperta interesse entre frequentistas. Afinal, o mais comum em muitas situações é estar incerto sobre qual modelo utilizar. O tema se reveste de maior complexidade em função de se estar cada vez mais utilizando modelos com mais componentes. 

Vimos que, sob a ótica Bayesiana, tudo que se precisa é calcular as probabilidades a posteriori de cada modelo contemplado. Isso permite escolher nosso modelo preferido ou combinar diferentes modelos em um único supermodelo. Nada disso é facilmente obtido sob o prisma frequentista. Na realidade, embora conceitualmente possível, isso é raramente feito nessa abordagem. E muitas vezes, quando é feito, o é de maneira incorreta. Trataremos desse ponto a seguir.

Antes disso, vale a pena discutir como fazer uma tarefa mais simples, que é a escolha de um único modelos dentre os k modelos contemplados. Como vimos antes, basta fazer essa escolha baseado nas probabilidades a posteriori dos k modelos. Os dados entram nessas probabilidades através das suas respectivas verossimilhanças integradas. Sob o ponto de vista frequentista. essa abordagem não é possível. Usam-se então as verossimilhanças maximizadas, isto é, o maior valor possível das verossimilhanças maximizadas para cada modelo. 

Note que modelos mais completos tendem a ser favorecidos sob essa ótica pois são generalizações dos modelos mais simples e portanto, sua verossimilhança maximizada será necessariamente maior. Algumas vezes, adaptações para penalizar essa maior complexidade são introduzidas. As adaptações mais famosas geram os critérios AIC e BIC. Uma análise mais criteriosa sobre vantagens e desvantagens de maximizar com respeito a integrar a verossimilhança é mais técnica e será por ora omitida. 

Queria me concentrar agora sobre a questão da utilização de múltiplos modelos. Muitas vezes, não existe um claro vencedor entre os k modelos competidores. Um exemplo disso é a questão de previsão sob diferentes cenários, tão comum em áreas como Economia e Ciências Climáticas. Em alguns casos, trabalha-se com um único modelo mais são contemplados diferentes possibilidades para as condições futuras onde eles irão operar. Esse paradigma também pode ser visto sob o prisma de diferentes modelos. Cada modelo seria responsável pela geração de um dos cenários possíveis. 

No contexto econômico, pode se querer fazer previsões sob cenários otimistas, pessimistas e neutros sobre o comportamento futuro da economia. Estudos do aquecimento global se ocupam de prever a temperatura da Terra, sob cenários de muita poluição, pouca poluição ou poluição média. As previsões geradas por esses diferentes cenários são todas úteis mas não são igualmente prováveis. Achar que são é um erro muitas vezes cometidos por usuários de Estatística. Na ausência de uma regra que os informe sobre como combinar os diferentes cenários mas confrontados com a necessidade de compara-los, eles recorrem a previsões que dão pesos iguais a cenários que podem ser altamente desiguais probabilisticamente. 

A consequência dessa estratégia não pode ser boa. Cenários pouco prováveis mas possíveis recebem um peso desproporcionalmente grande e distorcem as decisões. A recessão pode ser um cenário possível mas pouco provável; dar a ela peso igual a cenários otimistas quando os indicadores apontam para crescimento da economia trará desanimo e previsões erradamente pessimistas. Similarmente, se um franco crescimento da economia é possível mas muito pouco provável, as previsões decorrentes da contemplação desse cenário como um dos possíveis e equiprovável será erroneamente otimista. 

Nenhum desses problemas acontece quando usamos esquemas que incorporem apropriadamente pesos aos diferentes modelos ou cenários. O ponto de vista Bayesiano fornece um mecanismo natural para essa incorporação e deve portanto ser pensado como um forte concorrente em situações onde diferentes modelos precisam ser simultaneamente contemplados.

Nenhum comentário:

Postar um comentário