terça-feira, 18 de dezembro de 2012

Intuição estatistica

por André Gamerman

heavencanwaitcardsandgifts.blogspot.com.br



Pessoas em geral não tem boa intuição estatística. Pessoas tem boa intuição linguística e matemática, mas não estatística. Isso é uma verdade tanto para pessoas leigas no estudo da Estatística como também a pessoas que tiveram uma educação formal nas mais diversas técnicas de Estatística, incluindo professores de Estatística. Eu vou utilizar alguns exemplos simples para mostrar como isso é verdade.

Exemplo 1: O Barcelona vai jogar em casa, com o time completo, pela primeira rodada da Copa do Rei contra um time da terceira divisão do campeonato espanhol. As casas de apostas consideram que a probabilidade do Barcelona ganhar o jogo é maior que 99%. Considere 5 cenários e os ordene por ordem de probabilidade (sem pensar muito):

A) o Barcelona leva o primeiro gol;
B) o Barcelona ganha o jogo;
C) o Barcelona perde o jogo;
D) o Barcelona começa perdendo mas ganha o jogo;
E) o Barcelona empata o jogo;

É possível (provável) que a ordem escolhida por você tenha sido (em ordem do mais provável para o mais improvável): B, D, A, E e C.

Se você escolheu essa ordem, você não tem boa intuição estatística. Mas não se sinta mal, a maioria das pessoas comete o mesmo erro que você. Mais de 70% dos alunos do curso de pós graduação da renomada Stanford Business School, que tem educação formal em estatística, cometeram o mesmo erro em um estudo.

Voltando ao exemplo: a opção D está contida no universo de possibilidades da opção A, ou seja, a opção A é necessariamente mais provável que a opção D. Se o Barcelona leva o primeiro gol (começa perdendo) ele pode ganhar, perder ou empatar o jogo e todas essas hipóteses juntas são mais prováveis que apenas vitória do Barcelona.

Mesmo agora que você possivelmente já percebeu seu erro, algo dentro de você pode continuar achando a opção D mais provável. Afinal, sua intuição é de que é obvio que o Barcelona vai ganhar o jogo.

Exemplo 2: Uma pessoa (aleatória) resolve doar sangue. Um dos exames requeridos é o teste Elisa de HIV. A pessoa (que não faz parte do grupo de risco) recebe o resultado e ele é positivo. Desesperado, ela começa a buscar informações sobre HIV no Brasil e a eficácia do teste. Ela descobre que a proporção da população brasileira infectada pelo vírus HIV é de cerca de 0,5%.

Sobre o teste, ela descobre que o teste é 99,7% preciso, ou seja, quem estiver infectado terá resultado positivo em 99,7% das vezes. Além disso, o teste dará resultado negativo em 98,5% das vezes se ela não estiver infectada.

Qual é probabilidade dessa pessoa estar infectada com o vírus?

Possivelmente (caso nunca tenha visto exemplo similar antes) você pensou em um número alto, algo próximo a 90%. Afinal, o teste falha muito pouco. Porém, a probabilidade de ele estar infectado é, na verdade, 25%  O que você (possivelmente) não considerou, intuitivamente, foi a baixíssima prevalência da doença na população.

De maneira nenhuma deve-se ignorar a eficácia do teste e focar somente na prevalência. Caso esse paciente fosse de um grupo de risco cuja prevalência na população é de apenas 5% e o resultado desse positivo a probabilidade do paciente estar, de fato, infectado seria de 78%

Exemplo 3: João na infância era um garoto tímido e recluso, considerado anti-social. Sempre tirou notas muito boas, principalmente em Matemática, Química e Física. Preferia ir para a biblioteca a se relacionar com os colegas. Passava mais tempo pensando sozinho e isolado do que conversando com amigos.

O que é mais provável: que hoje João seja um professor universitário de Física ou que trabalhe no setor de serviços, lidando com pessoas o dia inteiro?

João se encaixa mais na descrição de um professor de Física do que na de uma pessoa que lida com o público. Logo, sua intuição é que é mais provável que ele seja um professor de Física. Entretanto, o número de professores de Física é muitíssimo menor que o número de pessoas trabalhando com serviços no Brasil.

Mais de metade da força de trabalho do Brasil trabalha com serviços contra alguns poucos milhares de professores universitários de Física. Por isso é muito mais provável que João trabalhe com serviços, ainda que possa ter o perfil de um professor de Física.

Esse exemplo é semelhante ao do teste de HIV, aonde a precisão do teste (estereótipo de João) parece mais importante que a prevalência da população contaminada (proporção de trabalhadores do setor) e acaba nos levando ao raciocínio equivocado.

2 comentários:

  1. Vamos falar do exemplo 1.

    Andre, faz sentido falar de probabilidades que nao sejam 1 ou 0 nesses eventos? Se voce acha que sim (como eu acho) voce nao eh um frequentista. Probabilidade nao eh um campo da fisica, mas um campo da logica. Estou correto?

    Abs e parabens pelo post.

    ResponderExcluir
  2. André, eu passei um bom tempo até entender o que me fazia ser bom em Matemática Superior e mediano, se tanto, em Probabilidade e Estatística: falta de intuição estatística, como você muito bem apontou. Depois que percebi que a Estatística exige um tipo diferente de raciocínio, e que não o tenho muito forte, fiquei menos infeliz. Abraços!!!

    ResponderExcluir