terça-feira, 2 de abril de 2013

Falácia ecológica

www.construiredemain.com

Falácia ecológica é o nome atribuído aos problemas associados ao ato de interpretar como válidas a nível desagregado afirmações feitas a um nível mais agregado. Esse fenômeno é mais observado nas ciências sociais, onde o nome foi conferido. Não tem nada a ver com a ecologia mas pode ser associado a problemas nas áreas biológicas. Acredito que o nome tenha sido utilizado para fazer referência a grupos de indivíduos.

Voltando ao problema em si, porque não se deve desagregar afirmações agregadas? Ao invés de uma explicação técnica, prefiro tratar de outro problema similar onde efeito similar é observado de forma ainda mais dramática. Trata-se do paradoxo de Simpson, onde não apenas resultados desagregados não coincidem com os resultados agregados mas vão além, apresentando resultados opostos!

Uma forma bastante esclarecedora de visualizar o paradoxo de Simpson é dada no excelente livro Probability & Statistics, de Morris DeGroot e Mark Schervish. Vamos então ao exemplo numérico dado nesse livro.

Considere que os pacientes em um estudo médico fictício se distribuiram conforme a tabela abaixo
Todos os pacientes
Houve melhora
Não houve melhora
Percentagem melhora
Novo tratamento
20
20
50%
Tratamento padrão
24
16
60%
Olhando para a tabela acima, parece haver indícios que o novo tratamento não introduz vantagem com respeito ao tratamento padrão. 

Suponha agora que os mesmos dados são desagregados por sexo e fornecem as tabelas
Homens
Houve melhora
Não houve melhora
Percentagem melhora
Novo tratamento
1218
40%
Tratamento padrão
 3  7
30%

Mulheres
Houve melhora
Não houve melhora
Percentagem melhora
Novo tratamento
8 2
80%
Tratamento padrão
21 9
70%

Antes de interpretar o resultado dessas tabelas desagregadas, vale reforçar que elas foram construídas a partir da tabela agregada por sexo. Por exemplo, os 12 homens e as 8 mulheres que melhoraram com o novo tratamento perfazem o total de 20 pessoas que melhoraram com o novo tratamento. O mesmo vale para todas as outras células da tabela.

Agora, vamos às interpretações....Fica claro da tabela para os homens e da tabela para as mulheres que  o novo tratamento apresenta benefícios com respeito ao tratamento padrão. Como é possível então que o total de pacientes aponta na direção oposta que os resultados obtidos com os homens e com as mulheres?

Antes disso, vale notar alguns aspectos importantes dos dados acima. A proporção de homens que foram submetidos ao novo tratamento é muito maior que a a proporção dos que foram submetidos ao tratamento padrão. Com as mulheres acontece o oposto: a maior proporção está associada ao tratamento padrão. Mais importante é que embora ambos os sexos mostrem melhora maior com o novo tratamento, eles o fazem de forma muito diferente. As porcentagens de melhora com qualquer tratamento são muito menores para os homens do que para as mulheres. Isso mostra que o sexo tem um efeito mais importante nos resultados obtidos que o tipo de tratamento. 

Todos esses desbalanceamentos acabam fazendo com que estranhos resultados sejam obtidos ao agregar os dados dos 2 sexos. Mas o pior é que a comparação agregada ignorou o efeito mais importante, que é o do sexo. Essa sucessão de equívocos acabaram gerando o resultado que a princípio parece paradoxal mas que, numa análise mais detalhada, se mostra bastante plausível.

Um comentário: