terça-feira, 17 de fevereiro de 2015

BMA x BMC



Antes de tudo convem explicar o que significam as siglas BMA e BMC. Elas significam Bayesian Model Averaging (média ou mistura Bayesiana de modelos) e  Bayesian Model Choice (escolha Bayesiana de modelos). Os nomes são talvez um pouco pomposos mas o significado é simples. O sinal de x no título também se justifica pois são 2 caminhos que tipicamente se contrapõe.

O cenário onde esses conceitos são úteis é o da presença de mais de 1 modelo possível. Exemplos são:

  • M1 dado pelo modelo normal ou Gaussiano e M2 dado pelo modelo t-Student;
  • M1 dado pelo modelo de regressão contendo o efeito da covariável idade e M2 dado pelo modelo de regressão sem o efeito dessa covariável.
  • M1 dado por um cenário otimista para a economia, M2 por um cenário neutro e M3 dado por um cenário pessimista para a economia.
No caso geral, podemos pensar em k modelos possíveis M1 , M2 , ... , Mk. Se o modelo também é desconhecido, o paradigma Bayesiano impõe que seja feita inferência para ele através do teorema de Bayes, a partir de uma distribuição a priori para os k modelos possíveis. Na ausência de maiores informações sobre os diferentes modelos ou na necessidade de uma postura imparcial, equiprobabilidade pode ser assumida, tomando P(M1) = ... P(Mk) = 1/k.

Após combinar essa priori com a verossimilhança de cada um dos modelos, obtém-se via teorema de Bayes as probabilidades a posteriori P(M1 | Dados), P(M2 | Dados), ... , P(Mk | Dados). A abordagem BMC prossegue a partir daqui escolhendo um dos k modelos e fazendo toda a inferência subsequente (estimação de parâmetros, testes de hipóteses e previsão de futuras observações) baseada apenas no modelo escolhido, isto é, a inferência para um coeficiente de regressão β é toda baseada na distribuição a posteriori P( β | Dados , M* ), onde M* é o modelo escolhido. 

A vantagem dessa abordagem é a simplicidade; o problema volta ao padrão usual de um único modelo. A desvantagem é a subestimação da incerteza, que permeará todos os procedimentos de inferência. Essa é uma consequência inevitável de assumirmos ser verdade algo sobre o qual não temos certeza. 

A abordagem BMC procura preservar as incertezas que possuímos e respeita-las na análise estatística que faremos. Suponha novamente que temos interesse em fazer inferência sobre um coeficiente de regressão β e que esse coeficiente está presente em todos os modelos considerados. A inferência a ser feita é a prescrita pelo paradigma Bayesiano, isto é, baseada em P( β | Dados ). Essa distribuição é obtida a partir da média ponderada (ou mistura) das inferências em cada um dos modelos e os pesos são dados pela probabilidade a posteriori de cada modelo, isto é,

P( β | Dados ) =  w1 P ( β | Dados , M1 ) + w2 P ( β | Dados , M2 ) + ... + wk P ( β | Dados , Mk ) 

onde w1 = P(M1 | Dados), w= P(M2 | Dados), ... , w= P(Mk | Dados). A inferência agora incorpora toda a incerteza da análise e será tipicamente menos precisa que a inferência baseada em escolha do modelo. A figura acima ilustra esse ponto com uma mistura de 3 componentes com pesos ou probabilidades 50%, 30% e 20%, respectivamente. A linha em preto é a resultante da mistura das 3 posterioris com esses pesos e é claramente mais dispersa que todas elas. Isso não é necessariamente ruim; é preferível ser mais incerto quando não temos certeza do que ser erroneamente preciso.

Qual abordagem é melhor? Ambas tem seus seguidores e acho inútil tentarmos obter uma única resposta. Algumas vezes é mais razoável usar BMA e outras é mais razoável usar BMC. Modelagem é uma arte que implica em fazer escolhas. Se permitirmos que todas as componentes do nosso modelo forem incertas, provavelmente seremos muito dispersos e não conseguiremos concluir nada. Se por outro lado, forçarmos certezas em demasia sem as tê-las, seremos levianos. Precisamos usar parcimônia para dosar nosso conhecimento de forma adequada.

A questão de escolha de modelo está longe de ser uma prerrogativa Bayesiana. Esse problema também aflige frequentistas, de forma ainda mais grave. A próxima postagem ajudará a elucidar esse ponto.


Nenhum comentário:

Postar um comentário