terça-feira, 14 de outubro de 2014

Pesquisas eleitorais - parte V

http://mcguiresl.wordpress.com/


Como já foi dito na postagem anterior sobre pesquisas eleitorais, populações de países como o Brasil estão longe de ser homogêneas. Esse fato deve ser reconhecido pela forma de tomar amostras para garantir que elas sejam representativas da população. O tratamento adequado do problema levando em conta todas as peculiaridades dos milhões de eleitores brasileiros seria proibitivo tecnicamente e o que se procura fazer são simplificações. A principal é estabelecer grupos, ou estratos numa linguagem mais técnica, dentro dos quais seja razoável supor homogeneidade entre os seus componentes. Fatores importantes no caso do Brasil incluem gênero, região, sexo, idade e classe sócio-econômica. 

A amostra portanto teria que ser formada de maneira a contemplar indivíduos em todos os extratos, garantindo igualdade de chances de seleção para cada indivíduo dentro de cada estrato. Isso constitui a base da amostra probabilística estratificada. A figura acima ilustra esse tipo de amostragem. Vejam que embora possível, torna-se complexo contemplar na amostra obtida todas as combinações possíveis dos diferentes níveis das categorias listadas acima. A solução pragmática mas sub-ótima que costuma ser utilizada é tomar a amostra de forma determinística, procurando respeitar as proporções devidas. Com isso, as cotas de cada categoria são pré-especificadas e a amostra é tomada de forma a reproduzir as proporções populacionais das categorias nas respectivas proporções dentro da amostra.

A dificuldade que surge é o cálculo das margens de erro. Afinal, perde-se a aleatoriedade em procedimentos determinísticos e torna-se impossível o cálculo das probabilidades, ilustrado na parte III dessa sequência de postagem para o caso de amostras probabilísticas. E esse cálculo é vital para conhecer as margens de erro do procedimento. A solução adotada é supor que as amostras obtidas por cotas determinísticas se comportam de forma idêntica às amostras obtidas pelos procedimentos de aleatorização. Ou seja, como as cotas são escolhidas de forma a reproduzir o procedimento de escolha aleatória, as mesmas fórmulas usadas lá para os cálculos probabilísticos são válidas aqui.

Note que os procedimentos ditos aleatórios comumente usados na prática não são aleatórios mas apenas baseados em mecanismos pseudo-aleatórios, conforme já dissemos aqui. Portanto, na essência, são tão determinísticos quanto a amostragem por cotas. A diferença importante é que já está bem estabelecido, a partir de inúmeros testes científicos, que mecanismos pseudo-aleatórios comumente usados tem comportamento similar ao de mecanismos aleatórios. A defesa da similaridade entre os 2 procedimentos é mais frágil e mais baseada no bom senso.

Assim, amostragem por cotas é questionável e tem sido fonte de acaloradas discussões entre os especialistas. Mas ela tem sua lógica. Seus defensores também apelam para o fato que a implementação real da amostragem aleatória estratificada está longe de ser fácil e as imperfeições geradas na prática também invalidariam o uso das fórmulas obtidas supondo que todas as hipóteses foram respeitadas.

No caso da aplicação dessas idéias pelos principais institutos de pesquisas de opinião no Brasil, acho que as informações por eles fornecidas são confiáveis e que as margens de erro são boas aproximações para as reais margens de erro. Também não podemos deixar de destacar a introdução nesta eleição da explicação pela mídia sobre o que significam as tais margens de 2 pontos percentuais. ficou explicitado que elas envolvem a comunicação de intervalos de confiança. Isso não é tarefa fácil, dada a dificuldade do conceito de intervalo de confiança. Mas a comunicação tem sido adequada e o saldo está sendo positivo.

Nenhum comentário:

Postar um comentário