terça-feira, 23 de abril de 2013

Como me tornei Bayesiano?


Essa é uma história pessoal mas que pode interessar a alguns. Todos tem suas histórias pessoais: algumas delas terão pontos em comum, outras não. Sempre tive interesse em Estatística desde a infância mas acabei rumando para uma graduação em Engenharia. Durante a graduação, cursei a disciplina genérica de Probabilidade e Estatística onde lembro apenas de ter aprendido algumas técnicas estatísticas, que não me atraíram para a área. Mas ainda nessa fase, soube da possibilidade de cursar disciplinas avulsas do mestrado no IMPA, com bolsa para isso. O desafio de fazer disciplinas de pós-graduação em uma instituição de prestígio e com bolsa atraíam muitos daqueles alunos perdidos em seus interesses, como eu.

Chegando lá, tive a felicidade de ser aluno da disciplina Estatística, ministrada pelo Prof. Barry James. Barry foi um dos expoentes de uma fase áurea da Estatística no IMPA, com um grupo de professores de excelente nível e ótima formação. Ele posteriormente voltou para os Estados Unidos, onde nasceu e, há muitos anos, é professor da Universidade de Minnesota, no campus de Duluth. Barry seguia os preceitos ditados por sua formação frequentista obtida durante seu doutoramento na Universidade de Berkeley, que era possivelmente o principal centro mundial dessa abordagem naquela época. 

Voltando à disciplina, tive um curso completo de inferência pelo ponto de vista frequentista. Mas Barry  sempre foi  meticuloso e atento a todos os detalhes. Ele deve ter achado que não podia passar o curso sem ao menos na última aula do curso falar sobre um ponto de vista alternativo: o paradigma Bayesiano, ao qual quase ninguém (muito menos ele) subscrevia. Ele fez uma série de contas que me pareceram complicadas e que entendi muito pouco mas exemplificou sua apresentação com a obtenção do estimador de uma proporção.

Ele relembrou que as estimativas que podem ser obtidas para uma proporção sob o ponto de vista frequentista são sempre 0 (no caso da observação resultar num fracasso) ou 1 (no caso de sucesso), quando dispomos de apenas 1 observação. Ai, ele resolveu fazer a conta da estimativa Bayesiana e mostrou que ela seria 1/3 (no caso de fracasso) ou 2/3 (no caso de sucesso). Isso me pareceu mais razoável e selou meu amor à primeira vista com a inferência Bayesiana. Acho que o Barry ficaria triste de saber que teve papel primordial nessa minha escolha na direção errada (para ele).

[Em termos técnicos o que aconteceu é que ele usou uma priori uniforme para representar ausência de informação prévia. A posteriori resultante tem média 1/3 ou 2/3, que ele tomou como a estimativa de Bayes. Na realidade, já está bem estabelecido que a forma correta de representar ausência de informação é através de uma distribuição Beta(1/2,1/2). Isso levaria a estimativas 1/4 e 3/4. O fato relevante é que ambas as contas dão resultados mais razoáveis pois raramente temos proporções 0 ou 1.]

A partir dai, resolvi investigar essa visão da Estatística e encontrei 2 ótimos interlocutores que forneceram munição para essa minha fome de conhecimento. Um deles for o Prof. Carlos Pereira (Carlinhos), colaborador do blog, que tinha acabado de voltar do doutorado nos Estados Unidos e trouxe muita animação para divulgar a formalização do ponto de vista Bayesiano. Essa visão quase filosófica mas com rigor matemático me encantou. O outro foi o Prof. Reinaldo Castro Souza, também recém egresso do seu doutorado na Inglaterra. Com um enfoque mais pragmático, ele me mostrou como poderia ser pavimentada a implementação do paradigma Bayesiano em uma série de problemas relevantes. Com esse suporte, escrevi aquela que deve ter sido a primeira (e única?) dissertação de mestrado Bayesiana daquela instituição, orientado pelo Prof. Oscar Bustos. A banca examinadora foi presidida pelo Oscar e seus outros membros foram Barry e Carlinhos.

A última pá de cal nesse meu processo de escolha foi dado durante o doutorado, pois escolhi fazê-lo em um departamento basicamente Bayesiano. Nesse momento, ficou cristalizada a minha opção preferencial, que venho exercendo profissionalmente até os dia de hoje. Nos últimos anos, com a experiência veio a compreensão de que é possível resolver bem os problemas sob ambos os pontos de vista. Mas a elegância da argumentação Bayesiana (a única fórmula necessária é o teorema de Bayes, enunciado no início dessa postagem), com o poderoso aliado da viabilidade computacional dos dias de hoje, continua falando mais alto para mim. 

3 comentários: