terça-feira, 31 de março de 2020

As estatísticas da Estatística no CNPq - parte III (epílogo?)


Foi divulgado no início deste mês o resultado final da alocação pelo CNPq das bolsas de pesquisa, após julgamento dos recursos impetrados. Vale relembrar da postagem anterior no assunto que:
  1. as percentagens de manutenção de bolsas dentro de cada área ficaram em torno de 80% para várias áreas afins à Estatistica;
  2. 2 a percentagem de manutenção de bolsas de Estatística tinha ficado em 10% com apenas 1 bolsa concedida de um total de 10 bolsas que a área possuía e que venceriam em fevereiro deste ano;
  3. não tivemos informação do total de pedidos que foram feitos por pesquisadores que não possuíam bolsa;
Ainda sobre o item 3 acima, temos conhecimento de ao menos um pesquisador que não possuía bolsa e não teve seu pedido de bolsa aprovado. Vale informar que se trata de pesquisador produtivo com contribuições relevantes em periódicos de alto nível. Ele estava fora do sistema CNPq por ter perdido o prazo de renovação de sua bolsa, que ele mantinha já há muitos anos e já estava no nível 1 pelo reconhecimento de qualidade de sua produção.

Todos os que não tiveram seu pedido aprovado que eu conheço entraram com recurso da decisão. O resultado que saiu agora foi incorporando a decisão quanto aos recursos impetrados. No caso da Estatística, 4 dos pesquisadores que entraram com recurso tiveram seu pedido aprovado e voltaram a ser incorporados ao sistema. Com isso, a taxa de manutenção de bolsas da Estatística subiu de 10% para 50%. Esse percentual indubitavelmente melhorou. Mas continuou muito abaixo dos percentuais das outras áreas.

Conseguimos apurar que
  1.  embora a área de Probabilidade e Estatística possua 2 membros do Comitê assessor do CNPq para a área (CA-MA), a reunião que decidiu sobre essas bolsas, fazendo as recomendações de aprovação/rejeição de todos os pedidos da área, não contou com a presença de nenhum deles;
  2. houve o estabelecimento de um novo critério para avaliar a produção científica dos pesquisadores solicitantes.  

Não há nada de errado com mudanças de critério mas é recomendável que se tome certos cuidados ao implementá-las. Por exemplo, o critério deveria emergir de uma decisão antecipadamente tomada, após ter sido sedimentada com algumas rodadas de discussão pelo menos entre todos os membros do comitê. Além disso, o critério adotado se baseou em preceitos mais caros aos matemáticos em termos de avaliação dos periódicos científicos onde a produção foi veiculada. 

Com isso, periódicos de elite da Estatística ficaram com avaliação abaixo da avaliação dos periódicos de elite da Matemática. Como efeito cascata dessa sistemática, todos os periódicos da Estatística sofreram uma desvalorização da sua importância relativamente aos periódicos de nível similar da Matemática. Tudo isso, torna compreensível e até provável que o resultado tivesse sido o que efetivamente foi obtido. Na realidade, trata-se de um corolário natural das decisões tomadas e de sua implementação. 

Também não ficou claro se o mesmo critério usado na análise dos recursos impetrados pelos pesquisadores da Estatística. Alguns acharam que a prevaleceu a quantidade de artigos publicados sobre a qualidade deles na escolha dos agraciados nos recursos impetrados. Torço para estar errado e ser desmentido na minha avaliação. Ela foi mais baseada em pedaços de informação coletadas no seio da comunidade do que por um esclarecimento oficial feito pelo CNPq.

De todo modo, é inegável que uma a reparação parcial feita no resultado final, após avaliação dos recursos. Mas mesmo assim, ficou uma preocupação bastante palpável na comunidade de Estatística quanto ao seu futuro com base no critério usado ou mesmo em outro que porventura possa surgir depois das reclamações vindas da comunidade estatística. Tanto quanto sabemos, não houve participação na comunidade na proposição deste critério nem em possíveis alterações no mesmo. Tanto quanto percebo, a comunidade não quer benefícios mas quer ser tratada de forma equânime com o tratamento dispensado às outras áreas. 

O resultado final, incluindo os recursos deferidos, pode ser visto aqui.

terça-feira, 24 de março de 2020

XV EBEB

Fonte: arquivo do Hedibert Lopes

Foi realizada de 09 a 11 de março a 15a edição do Encontro Brasileiro de Estatística Bayesiana, em Maresias, no litoral norte do estado de São Paulo. Apesar de ter sido realizado ainda no início da epidemia de Covid19 no Brasil, aludida na postagem anterior, ele não escapou dos seus efeitos pelo mundo afora. Vários participantes do país e conferencistas do exterior cancelaram suas participações na última hora. Somada à desistências ocorridas anteriormente, o aspecto científico do evento sofreu perdas de qualidade inevitáveis com respeito às últimas edições do evento.

O ambiente do evento, ocorrido em hotel à beira de belíssima praia, proporcionou um pano de fundo muito agradável que pontuou todo o evento. Isso facilitou o maior desprendimento dos e uma maior interação entre os participantes. Também concorreu para isso o carater notadamente esvaziado do evento. Comparado contra os usuais 100-150 participantes das últimas edições, o total de participantes desta edição não chegou nem à metade desse total histórico. A já tradicional foto dos participantes, reproduzida acima, comprova isso.

Assim, o evento não pode ser comparado a edições anteriores em termos de densidade científica por uma simples questão numérica, justificada pelas razões acima listadas. Por outro lado, isso foi compensado por várias apresentações interessantes que trouxeram informação útil para todos os participantes. Chamou a minha atenção que o nível da maioria das apresentações estava bem interessante. O evento teve poucas apresentações sobre variações óbvias ou imediatas de teoria já existente. Isso vale em todos os níveis; não só para as conferências mas para apresentações orais e em poster, que costumam ser feitas por jovens doutores ou alunos de pós-graduação e graduação.

Aliás, a manutenção de uma boa percentagem de jovens pesquisadores que marca as edições anteriores do EBEB foi uma grata surpresa. Melhor ainda foi vê-los falando de novidades que procuravam resolver problemas relevantes e não apenas divulgar trabalhos com contribuições de menor relevância. Uma inspeção nos títulos e resumos de todas as apresentações proporciona uma clara evidência desse movimento. Teremos de esperar para ver se esse padrão se manterá ou será ainda amplificado nas próximas edições do EBEB. Esperemos que sim!

O programa atualizado do XV EBEB pode ser obtido aqui

terça-feira, 17 de março de 2020

A estatística do Coronavirus

Fonte: Christina Animashaun/Vox (baseada em material do CDC)

Finalmente, o StatPop chegou ao assunto que domina as rodas sociais e profissionais das últimas semanae e assim continuará ainda por um bom tempo. Com a chegada definitiva do Coronavirus (Covid19) ao país, não tem como não falar desse assunto. As conversas tem tido muitos aspectos e mesmo no que tange à ciência também atinge várias áreas do saber. Como de costume, focaremos em aspectos matemáticos/estatísticos dessa doença que semana passada teve seu status elevado para pandemia.    

Aproveitaremos a oportunidade para tratar simultaneamente de 2 temas: a evolução da doença e a visualização de dados. Nesse contexto, destaco aqui 2 apresentações muito bem acabadas, com roupagem atual e contendo informação relevante e contextualizada. Acho que essas cumprem bem o papel de informar e de nos ensinar como apresentar dados e fórmulas de uma maneira inclusiva, por atrair mais que repelir os espectadores, especialmente os leigos. Com certeza, há muitas outras igualmente eloquentes e elucidativas mas essas foram as que cruzaram meu caminho no mundo da internet.

A primeira é denominada Crescimento Exponencial e Epidemia e pode ser visualizada aqui. Ela cumpre exatamente a missão de relacionar os conceitos matemáticos relevantes com a ilustração prática em termos da epidemia em questão no momento. A segunda tem uma formatação menos ambiciosa e é mais voltada para análises propriamente ditas dos dados. Tanto quanto pude perceber ela não tem nem um título propriamente dito e pode ser visualizada aqui. As análises feitas são mais descritivas e menos dependentes de teoria mas nem por isso são menos eficazes em passar a mensagem. No caso, a mensagem era muito mais de contextualizar a pandemia atual com outras que ocorreram na história recente da humanidade.

Ambas as apresentações são muito bem acabadas e ilustradas e até acompanhadas e trilha sonora. O mais importante de ambas as apresentações é a forma de aprestação gráfica não só dos gráficos das evoluções temporais como de gráficos de outras naturezas. A forma dinâmica como os gráficos e os textos nele contidos se ajustam a todo instante para o assunto que se deseja destacar é exemplar. Ela não é uma exclusividade dessas apresentações. Várias apresentações disponibilizadas diariamente na internet seguem esse mesmo padrão. Essa formatação representa uma nova forma de reportar dados, viabilizada pela tecnologia atual.

Outra mídia que vem recebendo muita visibilidade, possivelmente pela sua veiculação no New York Times é a figura animada acima, obtida aqui. Existe um dito popular que fala "um gráfico vale por mil palavras". Se isso é verdade, então podemos extrapolar para um gráfico animado valeria por um milhão de palavras. O texto que acompanha a figura também é elucidativo mas queria aqui enfatizar mais uma vez a força da animação ou do dinamismo na facilitação da passagem de informação. 

Em contraste com essas formas, apresento também um texto recente produzido por uma consultoria japonesa, que pode ser lido aqui. Esse texto, escrito ainda no formato usual (do StatPop, por exemplo), contem dados apresentados em algumas tabelas e alguns gráficos simples e estáticos. Ele é voltado para o estudo da hipótese que muitos tem levantado de ligação entre temperatura e incidência da doença. Até ai tudo bem. O texto pode ser útil mesmo sem ter uma roupagem menos atual mas deve principalmente ter conteúdo relevante.

No entanto, acho que existem algumas questões técnicas mal explicadas ou mal descritas ou ambas. O textos apresenta contagens de regiões do Japão e do planeta sem fazer a padronização pela respectivas contagens da população em risco ou ao menos da população total da região. Assim sendo, fica muito difícil fazer comparações entre populações tão distintas como as consideradas. Além disso, ele desconsidera a incerteza muito maior (proporcionalmente) associada à contagens de populações menores. Isso torna praticamente inútil muitas das comparações feitas no texto. Além disso, ele compara a evolução da doença utilizando apenas a janela de 3 a 8 de março, sem comparar com outras janelas. Esse cuidado foi tomado na 1a apresentação, permitindo verificar com muito mais embasamento que o crescimento exponencial é efetivamente uma boa descrição do estágio atual da doença no mundo.

Vale informar que já existe intensa atividade científica envolvendo estudo de casos, especialmente na cidade de Wuhan, onde começou a doença, na China e no resto do mundo. Um dos primeiros artigos publicados sobre o assunto apareceu no início do ano na prestigiosa revista científica Lancet. Esse artigo, que pode ser visualizado aqui, propõe um modelo relativamente elaborado, que depende de uma série de parâmetros, que são especificados ou estimados de forma relativamente arbitrária e o artigo não deixa claro qual o impacto nos resultados se eles estiverem mal especificados. Muito estudo ainda será feito nos próximos meses e anos sobre os dados sendo gerados ao longo do mundo nos diferentes países. 

Finalmente, esta postagem termina fazendo referência a uma das figuras mais enviadas pela internet nos últimos dias e talvez a mais relevante para caracterizar essa epidemia. Por isso, ela pode e deve ser repetida à exaustão e por isso serviu de abertura para esta postagem (uma das várias versões a partir de figuras similares divulgadas pelo CDC). A pandemia chegou aqui e irá atingir o Brasil de forma expressiva. Podemos e devemos tentar diminuir a taxa de infecção e com isso mitigar ou ao menos retardar seus efeitos. Um país com tantas deficiências em seu sistema hospitalar não pode se dar ao luxo de abrir mão de medidas profiláticas simples ao alcance de todos, como constante lavagem das mãos, evitar qualquer tipo de contato físico entre pessoas e confinamento. 

terça-feira, 10 de março de 2020

Candidatos aos prêmios da ABE


A Associação Brasileira de Estatística (ABE) realiza o Simpósio Nacional de Probabilidade e Estatística (SINAPE), sua maior reunião científica, a casa 2 anos. Entre as várias atividades do SINAPE estão os concursos de melhores trabalhos de Iniciação Científica (I.C.), de mestrado e de doutorado. A próxima edição do SINAPE ocorrerá em Gramado, RS, no 2o semestre deste ano. 

Esses concursos são decididos por bancas compostas majoritariamente por professores universitários, que, de preferência, não estejam diretamente envolvidos com nenhum dos candidatos. As bancas apontam inicialmente 5 finalistas por concurso, que são convidados para apresentar seus trabalhos no SINAPE antes de divulgar os vencedores de cada concurso. Acho essa formatação adequada pois contempla com alguma distinção vários candidatos e também dá experiência de apresentação de trabalho a muitos candidatos que estão fazendo sua estréia no cenário de congressos. 

As inscrições para esses concursos acadêmicos já se encerrou e a lista de candidatos traz uma fotografia de momento do estado da Estatística nas universidades do país. A lista de candidatos foi agregada por instituição de ensino na tabela abaixo.

Instituição
Doutorado
Mestrado
I.C.
ENCE


3
Farese


2
Fiocruz

1

ICMC/USP
2
1
1
IME/USP
2

1
Insper

1
1
UFBA

1
2
UFC

1
1
UFES
1


UFF


2
UFJF


1
UFMG
8
4

UFPE
1
3

UFPI


1
UFPR

1
1
UFRGS


1
UFRJ

2
2
UFRN

4

UFSCAR
1
1
1
UFSM


1
UNICAMP
6
3
1
Unifesp


1
Total
21
23
23

A lista apresenta um total de 22 instituições, numa boa demonstração da penetração e disseminação do trabalho de investigação científica nas mais diferentes partes do país. Deve ser ressaltado que essa maior capilaridade se deu de forma mais concentrada no nível mais básico, o de iniciação científica (I.C.), voltado para alunos de graduação. Com efeito, houve inscrições provenientes de  17 instituições para I.C., de 12 instituições para mestrado e de 7 instituições para doutorado.  

Um ponto que merece ser destacado é a dominância de UFMG e UNICAMP na lista de candidatos ao concurso no nível acadêmico mais elevado, o doutorado. Conhecendo um pouco dos trabalho de pesquisa sendo realizados nas diferentes instituições, esse resultado não é tão surpreendente. Ele reflete em parte a qualidade do trabalho de pesquisa sendo desenvolvido nessas instituições. Vale destacar que só recentemente a UFMG logrou pela 1a vez ter o vencedor do concursos de mestrado mas até agora nunca ganhou o concurso de doutorado. A UNICAMP já ganhou algumas vezes ambos os concursos de pós-graduação.

Esse ponto também surpreende um pouco pois esses programas de pós-graduação são mais recentes que os programas da USP (o mais antigo) e UFRJ. A USP apresentou 2 candidatos mas a UFRJ não apresentou nenhum. Essa ausência de candidatos preocupa mas deve ser considerado que essa instituição tradicionalmente recebe menos alunos que as outras. 

Também chama atenção que 3 das 5 instituições que não tiveram candidatos para o concurso de I.C. tiveram um boa participação nas contagens de candidatos de pós-graduação. Sabemos que boa parte dos alunos de programas de pós-graduação de qualquer dessas instituições são provenientes dos cursos de graduação da mesma instituição. Assim, esse resultado é de uma certa forma surpreendente. Mas sugere que talvez essas instituições estejam deslocando esforços para a pós-graduação de forma mais concentrada. 

Assim, temos aqui um quadro indireto de informação sobre os programas de pós-graduação do país bem como das graduações. Vamos agora esperar pelas decisões das bancas examinadoras para tecer mais comentários sobre os concursos em uma possível postagem futura.


terça-feira, 3 de março de 2020

Substancial apoio à pesquisa no Reino Unido


Algumas postagens recentes repercutiram dificuldades da Estatística nacional com respeito ao apoio à pesquisa na área. É sempre interessante contextualizar esse assunto com as experiências vividas em outros países. Cumpre ressaltar desde o início que as diferenças entre países devem ser sempre consideradas para melhor contextualização em qualquer comparação. 

Dito isso, acaba de ser divulgado no final do mês passado o plano que estará sendo implementado para apoiar desenvolvimento científico e tecnológico no Reino Unido para as Ciências Matemáticas. Esse plano tem várias vertentes mas alguns pontos chamaram a atenção. Em um marcante contraste com a realidade nacional, o valor do aporte de recursos é da ordem de 300 milhões de libras (cerca de 1,8 bilhões de reais) para os próximos 5 anos. Esse valor representou um aumento substancial com relação ao aporte anterior, da ordem de metade do aporte atual.  O segundo ponto é que o anuncio da liberação de recursos foi feito pelo próprio primeiro ministro britânico, numa clara demonstração da importância dada a esse tipo de iniciativa pelo governo daquele país. O terceiro ponto foi que o apoio foi implementado através EPSCR, equivalente britânico do nosso CNPq, para as Engenharias e Ciências Exatas. Finalmente, chama a atenção a forma que a RSS (a associação britânica de Estatística) postou esse anúncio, numa efusiva comemoração pelos recursos esperados. 

Tudo isso forma um contraponto significativo com o que estamos vendo no nosso país no momento, em particular com respeito ao apoio à pesquisa em Estatística. Vale destacar que os recursos foram alocados pelo EPSCR para as Ciências Matemáticas. Mesmo assim, esse anúncio foi muito comemorado pela comunidade estatística britânica pois esse aporte claramente contemplará de forma substancial essa área. É interessante apontar que Estatística e Matemática não pertencem ao mesmo comitê de avaliação no EPSRC, diferente da realidade naconal, mas isso não impede uma série de inciativas conjuntas entre essas áreas. Como exemplos desse tipo de iniciativas conjuntas temos o Instituto Isaac Newton de Cambridge, citado no anúncio feito pela EPSRC, e o Instituto Alan Turing, já mencionado aqui.

O apoio é bastante abrangente e inclui bolsas de estudos para doutorado e para pesquisadores em geral, apoio a pesquisa incluindo pesquisas multi-centro e apoio a participação de eventos em vários institutos voltados para esse fim que já existem no Reino Unido, como o Instituto Issac Newton supra-citado e o Centro Internacional para Ciências Matemáticas, de Edimburgo.

É claro que os orçamentos do Reino Unido e do Brasil não podem ser comparados. Também não dá para comparar a envergadura do desenvolvimento científico do Reino Unido com a do Brasil. Mas por isso mesmo vale a pena refletir sobre essa iniciativa, não necessariamente para ela ser replicada no Brasil. Pelo menos não em termos da magnitude dos recursos alocados à Ciência nos 2 países. Ela é um exemplo de como áreas distintas podem crescer de forma integrada. Existe espaço tanto para iniciativa isoladas quanto para iniciativas conjuntas, basta saber identificar adequadamente as instâncias. 

terça-feira, 18 de fevereiro de 2020

As estatísticas da Estatística no CNPq - parte II


Há algumas semanas, publiquei uma postagem sobre o assunto do título. Naquela postahgem, foi alertado que os dados lá reportados ainda não eram definitivos pois muitos bolsistas contemplados ainda não tinham assinado compromisso de aceitação da bolsa concedida. Passadas algumas semanas e estando mais próximo do prazo final para essa confirmação, vale a pena revisitar os dados para verificar se o padrão apresentado lá atrás se manteve.

Novamente com o auxílio da Profa Glaura Franco, foi revisado o levantamento da postagem anterior. Relembrando, a postagem apresentava uma (suposta, naquela ocasião) discrepância entre a proporção de bolsas de pesquisa preservadas na área de Probabilidade e Estatística em 2020 com relação às correspondentes taxas de preservação de bolsas de áreas próximas no mesmo período. Os dados atualizados estão reportados na tabela abaixo


             Tabela 1. Dados relativos à alocação de bolsas de pesquisa para 2020 (revisado)
Área do conhecimento
Percentagem de preservação
Percentagem de bolsas renovadas
Percentagem de bolsistas novos
Matemática
86%
55%
31%
Computação
82%
64%
18%
Engenharia de Produção
106%
71%
35%
Probabilidade e Estatística
29%
29%
0%


Agora, a diferença entre as taxas de bolsas preservadas na área de Probabilidade e Estatística e as das outras áreas citadas ficou ainda maior. Um aspecto de menor importância que também pode ser observado da Tabela 1 foi o discreto aumento do número de bolsas da Engenharia de Produção. Como isso pode ser conseguido em um cenário restritivo do ponto de vista orçamentário?

Uma análise mais detalhada das alocações de bolsas concedidas talvez possa ajudar. Antes, vale explicar que as bolsas estão essencialmente alocadas nos níveis 1 e 2 e o custo para o CNPq de uma bolsa nível 2 é em torno de metade do custo da bolsa de nível 1. O aumento no número de bolsas da Engenharia de Produção se deveu ao aumento de bolsas de nível 2, menos onerosas. O número de bolsas de nível 1 efetivamente foi reduzido. Assim, o gasto total com bolsas dessa área permaneceu nos mesmos patamares. O cenário na Matemática foi diferente: houve um aumento expressivo (34%) nas bolsas de nível 1, mais onerosas, acoplado a uma ainda mais expressiva redução (56%) nas bolsas de nível 2.  

Cumpre reforçar que essas alocações são escolhas autônomas dos comitês decisores e não há nada de errado com elas. Apenas nos cabe apontar que cada decisão tem uma consequência diferente e não há uma única receita ótima. 

Mas o dado que mais chama atenção na Tabela 1 é a proporção marcadamente menor de bolsas da área de Probabilidade e Estatística em relação às outras. Para isso, contribuiu a redução de 100% das bolsas nível 2, parcialmente devida à promoção de alguns bolsistas para o nível 1. Essa discrepância é ainda maior quando se considera apenas a Estatística, que teve apenas 1 de suas 10 bolsas preservadas, numa taxa de preservação de apenas 10%. Com essa taxa de preservação, não surpreende que a área não teve a entrada de nenhum novo bolsista. 

Esse quadro não é novidade para a comunidade da Estatística. No final de 2018, foi divulgado o resultado de uma chamada do CNPq para o Edital Universal, onde são concedidos recursos para utilização genérica de apoio a projetos de pesquisa. Dentre os 71 projetos contemplados pelo CA-MA, comitê de avaliação das área de Matemática e Probabilidade/Estatística, apenas 1 foi de Estatística. Esse resultado ligou o alerta em parte da comunidade mas pouco foi feito a respeito naquela ocasião, talvez por achar que se tratava de evento fortuito e meramente casual. O resultado recente parece indicar a presença de uma tendência. 

Além disso, uma pesquisadora da Estatística fez um pedido de bolsa de pesquisa recentemente, logo após publicar resultados de sua pesquisa em um dos periódicos de elite da área. [Esse fato é raro na Estatística brasileira apesar da produção em periódicos em bom nível ter aumentado.] Ao invés de ter seu pedido aprovado por esse comitê com elogios pelo seu feito, seu pedido foi rejeitado. Pedidos de outros pesquisadores que, embora meritórios, não possuíam indícios similares de excelência foram privilegiados. Esse tipo de decisão desestimula a busca pela relevância da produção científica, especialmente entre os jovens pesquisadores. Um amigo, pesquisador de prestígio, me disse certa vez que projetos de pesquisa deveriam sempre "mirar a lua". 

Em resumo, algumas decisões que o CNPq vem ultimamente tomando para a área de Estatística preocupam aqueles que almejam o efetivo crescimento da Estatística no país. Acredito que esse crescimento seja o desejo de todos que querem ver os recursos alocados para a Ciência e Tecnologia sendo usados da forma mais efetiva possível em todas as áreas da Ciência nacional. A figura que abre esta postagem reflete o sentimento que vem tomando muitos pesquisadores de Estatística do país neste momento. Só nos resta esperar que esse movimento represente apenas um deslize e as medidas necessárias para que essa tendência possa ser revertida sejam tomadas. 

terça-feira, 11 de fevereiro de 2020

Aspectos estatísticos da tragédia no Ninho


Sábado passado (08/02/2020) foi completado um ano da tragédia no Ninho do Urubu, apelido do Centro de Treinamento (CT) do Flamengo, que vitimou 10 jovens adolescentes. A tragédia foi causada por um incêndio em instalações provisórias, que alojavam parte dos jogadores da base do Flamengo. Essa tragédia teve dezenas de feridos em menor gravidade (tanto fisicamente quanto mentalmente), 3 feridos com maior gravidade que passaram por longo período de internação hospitalar e o pior acontecimento foi a morte de 10 candidatos a jogadores da próxima década. 

Conforme dito pelo então recém-empossado presidente Rodolfo Landim, essa foi a maior tragédia em todos os mais de 120 anos de história de vida desse clube. Imediatamente, o clube colocou à disposição das famílias apoio emergencial na forma de aconselhamento psicológico, traslado dos familiares das vítimas para um hotel perto do CT e um ajuda pecuniária a título de indenização provisória, agora aumentada pela justiça. 

Após passado o período imediato ao acidente, iniciou-se uma etapa de negociação para a reparação financeira das famílias. É bom repetir que nada repõe a perda de um ente querido e essas famílias irão conviver o resto de suas vidas com essa falta, que dói muito e nunca se apagará. Entretanto, uma das formas que a sociedade busca compensar essa lacuna é através de compensações monetárias, destinadas a reparar as perdas financeiras presentes e futuras.

É sobre esse particular aspecto que gostaria de me debruçar: quanto vale uma vida? A decisão que a justiça brasileira terá de tomar é o valor financeiro da vida de um potencial futuro atleta. Existem pelo menos 2 componentes nessa avaliação: o aspecto moral e o aspecto profissional. Não tenho idéia de como pode ser feito o cálculo de uma compensação moral pela perda de um ente querido. E não pretendo entrar nesse mérito.

O que sim pode-se discutir aqui é o valor de uma compensação financeira pelo que a família deixará de auferir pela perda de um ente querido em termos do que ele poderia prover ao longo de sua vida profissional caso não tivesse sido acometido por essa fatalidade. Um cálculo apressado poderia ser baseado no que um jogador de nível de seleção poderia receber ao longo de sua vida profissional. tomando por base os maiores salários do país, poderia se tomar como base um salário mensal de R$1.000.000,00 (hum milhão de reais) ao longo de 15 anos, que é a duração estimada da carreira de um jogador de futebol. Isso perfaria um total de cerca de 200 milhões de reais.

Um levantamento da CBF divulgado em 2016 mostra que 82,4% dos jogadores de futebol do país ganham menos que R$1.000,00 por mes, 13,7% ganham entre R$1.000,00 e R$5.000,00 e 3% ganham entre R$5.000,00 e R$50.000,00 e menos de 1% ganha acima de R$50.000,00. Assim, teremos que o salário mensal médio de um jogador no Brasil é de cerca de R$3.000,00. Um cálculo mais realista levaria em conta que boa parte dos jogadores de base não se torna profissional do futebol e enquanto profissional regular receberia esses R$3.000,00 ao mês durante 40 anos de vida profissional, perfazendo um total de cerca de 1,5 milhões de reais. Qual dos 2 valores indenizatórios o juiz responsável por esse processo cível deveria arbitrar? Parece razoável supor que o valor mais adequado estaria entre esses 2 valores, mas esse espaço de variação é gigantesco.

A solução vem mais uma vez através do uso correto de probabilidades no contexto de tomada de decisão. Os 2 cenários apresentados acima são apenas algumas das possibilidades disponíveis. O que a teoria da decisão preconiza é que o valor que deveria ser arbitrado pelo justiça seja uma média de todos os valores possíveis. Mas essa média não pode nem deve ser uma simples média aritmética. Ela deve levar em conta as chances relativas de cada cenário contemplado.

Fazendo isso, fica claro que o peso na conta associado a um super-craque deveria ser tão diminuto quanto as chances de um jogador qualquer de uma escolinha de futebol se tornar um Neymar. Essa chance é extremamente baixa. O levantamento acima citado mostra que apenas 0,4% dos jogadores de futebol profissionais do país ganham salários mensais acima de R$100.000,00. Outros levantamentos mostram que uma pequena percentagem de jogadores de escolinhas de futebol se tornam jogadores profissionais. Ou seja, as chances de um deles se tornar um milionário do esporte são extremamente baixas.

Tudo isso aponta para valores médios na ordem de 1 a 2 milhões de reais, considerando também cenários ainda mais pessimistas que o descrito acima mas possíveis dentro da realidade nacional. Existem estudos que dão sustentação a visões mais pessimistas da situação do futebol no país. Acredita-se que a oferta de acordo feita pelo clube esteja em valores próximos desta ordem de grandeza. As famílias tem todo o direito de lutar na justiça por valores maiores. Afinal, cada família estará falando do seu filho querido, cuja perda lhes é tão sofrida. Caberá à justiça brasileira decidir em caso de ausência de acordo, mas a base que ela deve usar segue na linha do que foi ainda que resumidamente descrito acima. 

Se a conta é tão desfavorável assim, porque tantos clubes mantem uma dispendiosa e complexa estrutura de captação de recursos humanos? Porque cada jogador promissor que eles revelam e vendem para o exterior sustenta a manutenção das centenas de candidatos que, em sua maioria, não serão bem sucedidos mas que podem conter jóias como Reinier, Lucas Paquetá e Vinicius Jr, vendidos recentemente pelo próprio Flamengo por algumas dezenas de milhões de reais.

Gostaria de concluir reforçando que não se falou aqui de colocar preço na vida de um ser humano. O que se procurou abordar foi como deve ser feito o exercício de projetar os ganhos financeiros de um futuro jogador de futebol, considerando todos os possíveis cenários de futuro e compatibilizando eles da forma mais adequada e justa possível. 

terça-feira, 4 de fevereiro de 2020

Resultado do ENEM não é 100% confiável

Fonte: André Coelho/ Folhapress

A afirmação do título foi feita por funcionários do INEP, órgão pertencente ao Ministério da Educação (MEC), responsável, entre outras tarefas, pela administração do ENEM. Quem diz isso é a Folha de São Paulo (FSP), em uma matéria assinada por Paulo Saldaña e publicada no dia 29 de janeiro deste ano.

Esse assunto é uma ótima fonte de vários debates que tem tudo a ver com o espírito do StatPop. Para começo de conversa, vale esclarecer que as notas do ENEM são baseadas na aplicação da Teoria de Resposta ao Ítem (TRI) aos resultados de provas de múltipla escolha do ENEM, assunto já tratado e explicado aqui. O que não foi dito lá, pois não era o foco daquela postagem, é que a análise do TRI estima as proficiências, que compõe a nota do ENEM após uma renormalização. A palavra estima não foi sublinhada por acaso: qualquer processo de estimação envolve erro. Esse erro pode e deve ser mensurado mas raramente é fornecido nas milhares de utilizações da TRI ao redor do mundo e as apenas estimativas obtidas são reportadas, dando a errônea impressão que representam um valor exato. Existe um acordo tácito em torno da utilização desse estimador pontual como se fosse o reflexo da verdade sem questionamentos, que seriam infindáveis.

Não tenho dúvida que qualquer técnico do INEP sabe disso mas esse ponto precisa ser lembrado para entender o questionamento do momento. Ocorre que foi descoberto um subconjunto de cerca de 6.000 alunos cujos resultados da prova estavam errados (foram corrigidos com uma lista errada de respostas certas). Esse fato deu origem a uma série de questionamentos até jurídicos e que chegaram ao Superior Tribunal de Justiça. Houve suspensão da divulgação dos resultados e discussões sobre o que fazer com esses alunos. No final, as notas deles foram corrigidas e os resultados foram divulgados.

A ligação disso com a TRI, segundo a matéria foi a forma como foram calculados as características das questões do ENEM que não haviam sido pre-testadas. Nesse caso, as próprias provas do ENEM fizeram a estimação dessas características e das notas dos candidatos. Isso não tem nada de errado do ponto de vista técnico. Para tanto, foi selecionada uma amostra grande (100.000 candidatos) para fazer a estimação das características dos ítens.

Note que trata-se de um tamanho bastante alto, garantindo uma estimação bastante precisa. Entretanto, alguns dos 6.000 candidatos "problemáticos" entraram na amostra (cerca de 100, segundo a FSP). Obviamente não se deve fazer nenhum procedimento estatístico com dados reconhecidamente errados e o correto seria refazer as contas sem os resultados desses candidatos. É nesse contexto que se insere o questionamento dos técnicos do INEP, aludido do título da matéria.

Entretanto, havia uma premência de tempo não trivial. Esses resultados precisavam ser divulgados bem antes do início das aulas para fazer a alocação dos alunos nos diferentes cursos de graduação em todo o país. Refazer todas as contas sem esses poucos alunos e recalcular as notas demandaria um tempo que o INEP não parecia dispor. Lembre-se que estamos falando de cerca de 4 milhões de candidatos.

Felizmente, os erros gerados por esse procedimento inadequado são desprezíveis. Estamos falando de 100 indivíduos em uma amostra de 100.000 alunos. Trata-se de uma percentagem desprezível da ordem de 0,1%, ou seja, afetando apenas a 4a casa decimal! Como nem todos os itens foram calibrados, o peso de um possível ajuste na nota final seria ainda menor. Considerando os vários outros erros já aludidos acima, o efeito é muito pequeno, mesmo em carreiras mais concorridas onde a colocação é decidida nos últimos algarismos significativos. 

Enfim, acho a preocupação dos técnicos procedente. Entretanto, neste texto foram mencionadas várias fontes de incerteza presentes (mas não aparentes) no cálculo das notas do ENEM, incluindo arredondamentos das notas. Assim, acredito que o efeito dessa possível fonte de imperfeição nas notas de algum aluno sejam desprezíveis, se é que existam, como assegurou o próprio Prof. Dalton Andrade, consultor do INEP e um dos responsáveis pela introdução da TRI nos cálculos do ENEM. Assim, os candidatos que participaram dessa edição do ENEM podem ficar tranquilos: o ENEM segue tão confiável quanto sempre foi!