sexta-feira, 18 de agosto de 2017

Ainda sobre o cuidado com agregações... - parte II

www.globo.com

Esse assunto já foi tema de uma postagem aqui alguns anos atrás tratando de dados de futebol. Sua importância ficou evidenciada em outra postagem que revelou como conclusões podem ser invertidas quando agregamos os dados de forma equivocada. Esse assunto retorna agora devido a uma matéria publicada semana passada* no site globoesporte.com. A matéria diz respeito ao jogador peruano Guerrero do Flamengo (destacado na foto acima). Ela discute a relevância do jogador, que sofre contestação de algumas parcelas da torcida. O trecho da matéria que gostaria de destacar aqui diz:

"Com o peruano, o time disputou 34 jogos: 20 vitórias, nove empates e cinco derrotas, conquistando 67% dos pontos disputados. Nas 19 partidas em que o camisa 9 não atuou, a equipe totalizou oito vitórias, sete empates e quatro derrotas, com um aproveitamento de 54%."

A partir dai, a matéria conclui que Guerrero faz falta ao Flamengo. Vale destacar que a matéria tem autoria de um grupo de 7 pessoas, provavelmente jornalistas, que se intitula Espião Estatístico. Não sei se existe algum estatístico nessa equipe de profissionais mas entendo que a equipe recebeu esse nome em função da atividade exercida: levantamento e análise de dados. Acho que a operação de levantamento de dados foi bem sucedida mas tenho reservas sobre qualquer sumarização agregada. 

A agregação colocou no mesmo saco desse conta os resultados dos jogos do Flamengo nos 6 diferentes campeonatos que essa equipe se envolveu este ano. Chama especialmente a atenção a inclusão do jogos do Campeonato Carioca. É do conhecimento de todos que esse campeonato não serve como parâmetro de desempenho por envolver equipes muito fracas. Este ano, este campeonato ainda teve o agravante de ter uma fórmula de competição que era no mínimo pouco convencional. 

Pela fórmula que vigorou, os 2 turnos do campeonato  (chamados de Taça Rio e Taça Guanabara) tinham suas respectivas finais e seus campeões mas ser campeão não tinha quase nenhuma relevância esportiva para a disputa final do campeonato. Assim, mesmo os jogos entre os times mais fortes, onde efetivamente havia disputa, perderam seu valor e foram disputados muitas vezes por equipes repletas de jogadores reservas. Se retirarmos os jogos desse campeonato de nossa tabulação veremos que as proporções de pontos conquistados caem para 58% (11V, 7E e 5D) nos jogos com Guerrero e 49% (5V, 4E e 4D) nos jogos sem Guerrero. [Nesse campeonato, as proporções foram 88% com Guerrero e 67% sem ele.] Sem computar o campeonato carioca, ainda se mantém o melhor desempenho com a presença do centroavante mas com a diferença caindo de 13 pontos percentuais (=67-54) para 9 pontos percentuais (=58-49).

Claro que minhas escolhas também estão abertas a questionamentos: foi levado em conta se o jogo era como mandante ou visitante? devemos remover outros campeonatos menores? foi levado em conta se as equipes estavam com uma porcentagem alta de titulares nos jogos computados? etc. Isso apenas reforça o ponto que quero levantar: não se deve fazer uma agregação total e achar que ela apresenta a única verdade sobre o fenômeno estudado.

A bem da verdade, a reportagem apresenta outros dados para apoiar a sua tese sobre a dependência do Flamengo nesse jogador mas os únicos resultados baseados em desempenho são os que apresentei acima. Encerro essa pequena digressão agradecendo a André Vizzoni pelo levantamento dos dados desagregados aqui usados e desejando ao Guerrero pronta recuperação dos problemas musculares que aflijem esse craque e que ele possa estar de volta ajudando da melhor forma sua equipe nos campeonatos que ela ainda disputa.

* - essa matéria foi publicada antes da vitória do Flamengo sobre o Atlético Goianiense no sábado passado, sem a presença de Guerrero. Para facilitar a comparação com a matéria, me ative apenas aos dados lá analisados, sem computar esse jogo.

Nenhum comentário:

Postar um comentário