terça-feira, 10 de dezembro de 2013

Hipóteses simples existem? ou Como comparar tratamentos adequadamente?

www.pioneer.com

Como já falado anteriormente aqui, esse tipo de hipótese é muito usado em testes de comparação de tratamentos, onde a hipótese mais comumente testada é a hipótese de igualdade de efeitos dos tratamentos. Note que o conceito de tratamento é geral e não está restrito à área médica. A idéia de hipótese simples não está restrita apenas à comparação de tratamentos. Ela pode ser usada para testar um dado valor do parâmetro ou uma dada distribuição para os dados. Um exemplo do 1o caso é o teste de capacidade de um adivinhador. Se ele não tiver nenhuma capacidade especial, a probabilidade de ele acertar o resultado do lançamento de uma moeda é 50% e seria essa a hipótese simples a ser testada.

O ponto que quero levantar aqui vale para qualquer espécie de hipótese simples mas para facilitar a discussão das idéias, vou contextualizá-lo em um teste de comparação de tratamentos. Nesses casos, a hipótese que costuma ser testada é de igualdade de efeitos. Normalmente, o efeito é medido através do nível de alguma substância e a hipótese é descrita em termos de igualdade das médias desses níveis. Isso é razoável? Uma diferença de 2% para mais ou para menos caracteriza uma mudança relevante? 

Em muitos casos, não. O mais razoável nesses casos seria considerar como hipótese de interesse não apenas a pura igualdade matemática mas uma zona de indiferença em torno dessa igualdade. Por exemplo, poderia se considerar que não há diferença entre os efeitos dos 2 tratamentos se as médias teóricas diferirem em menos de 2% Afinal, 2% de mudança não causa nenhuma mudança estrutural na grande maioria dos casos. Entretanto, raramente se considera uma região de indiferença ao invés de estrita igualdade. Por que? Nunca li uma resposta para essa pergunta mas acredito que os principais motivos são: maior facilidade de realizar o teste considerando apenas a hipótese de igualdade e dificuldade em determinar qual o valor da margem de indiferença entre os 2 tratamentos.

Vamos exemplificar essas idéias no contexto aplicado da figura acima. Deseja-se verificar se os 2 tratamentos (fungicida x fungicida combinado com inseticida) tem a mesma eficácia na produção de sorgo. As barras verticais do gráfico representam as médias observadas de produção de sorgo (em alqueires/acre) em 44 locais sob 2 os tratamentos, onde observa-se uma diferença de 1 alqueire/acre. Se as medições são gaussianas, o teste utilizado nesses casos é o teste t. Esse teste rejeita a hipótese de igualdade de médias se a diferença padronizada de médias nas amostras observadas for superior a um dado limiar.

Se o desvio-padrão amostral é 0,5 alqueires/acre, a diferença padronizada será de 2 = (1/0,5) unidades, correspondendo ao p-valor de 4,8% Esse achado provavelmente nos levaria a rejeitar a hipótese de igualdade (tomando como base um corte em 5%). Se a região de indiferença corresponder a 0,5 alqueires/acre para mais ou para menos, a mesma diferença de 2 unidades passaria a corresponder ao p-valor de 32% Esse achado é uma clara indicação de plausibilidade da hipótese e ela não seria rejeitada. Ou seja, ao ser considerada uma região de indiferença houve uma mudança radical nos resultados obtidos.

Não pense que esse problema está associado apenas à inferência frequentista. Procedimentos Bayesianos também são bastante suscetíveis a mudanças na especificação da hipótese de interesse. Isso abre toda uma nova discussão, igualmente interessante, de como devem ser realizados testes de hipóteses sob o ponto de vista Bayesiano e não existe um único procedimento universalmente aceito. Mas isso terá de ficar para uma outra postagem.

Nenhum comentário:

Postar um comentário