terça-feira, 22 de outubro de 2019

Probabilidade Bayesiana para bebês

Fonte: Arquivo pessoal

A foto acima é da capa de um livro cujo título Bayesian Probability for babies me chamou a atenção. O livro foi escrito pelo canadense Chris Ferrie, que possui uma prolífica carreira profissional como pesquisador e também como pai de 4 lindas crianças. Talvez essa tenha sido a maior motivação para sua abundante produção de livros para crianças, apresentando uma introdução simples para os diferentes temas científicos tratados. Ele obteve doutorado em Matemática Aplicada trabalha na área similar de Física Quantica em seu emprego acadêmico em Sydney, Austrália.  Mais informações sobre o autor podem seu obtidos aqui.

A mais correta tradução do título seria Probabilidade Bayesiana para bebês, o que envolve uma expressão não muito comum. Eu pelo menos nunca tinha visto antes a expressão probabilidade Bayesiana, mas acredito que o autor tenha preferido usa-la em detrimento de outras mais comuns como Inferência Bayesiana ou Estatística Bayesiana por torna-la mais acessível às crianças. Afinal, probabilidade é um conceito muito mais coloquial que estatística ou inferência e portanto mais acessível a quem está começando a conhecer o mundo.

O que é o livro faz não é nenhuma novidade na literatura infantil. Ele procura apresentar seu conteúdo de forma lúdica, com poucas páginas, muitas figuras e pouco texto em cada página. Ele começa falando sobre teoria de conjuntos, espaço amostral e cálculo elementar de probabilidades. O contexto que o autor escolhe para fazer isso é o de biscoitos com gotinhas de chocolate. Ele inicia fazendo aplicações de probabilidade condicional e de cálculo de probabilidades via teorema de Bayes. Após fazer isso, ele dá um passo extra e estende as idéias para distribuição a priori e a posteriori. Ele apresenta essas distribuições de forma ilustrada.

O livro é apresentado como apropriado para crianças a partir de 2 anos. Efetivamente,  minha amostra de tamanho 1 tem essa idade e demonstrou interesse no livro. Acho até que algo passa para ela ao folhear o livro. Mas efetivamente a elaboração das idéias me parece muito além do que alcança o raciocínio de uma criança dessa idade. Mas a apropriada escolha das figuras elucidativas usadas no livro parece fazer efeito até para essa tenra idade. Obviamente, a completa compreensão das idéias só será atingida muitos anos depois. Mas entendo o livro como um documento disponível para revisitas a cada tantos meses, cada vez com maior compreensão do seu conteúdo. 

Engana-se quem, como eu, achava que o autor criou e desenvolveu um novo filão da literatura de divulgação científica. Uma busca revela que se trata de uma área bastante desenvolvida da literatura científica, bem como outras áreas fazendo tratamentos voltados para públicos especializados. Acho que existe um mercado bastante atraente para autores em um mundo cada vez mais vibrante em informação e com crescente demanda por conhecimento para um cada vez mais competitivo mercado de trabalho. 

Pode se discutir quando se deve iniciar a formação profissional de um indivíduo. Mas me parece que introduzir conhecimento, sempre com parcimônia e respeitando os limites dos leitores, não pode fazer mal. Muito pelo contrário! 

terça-feira, 1 de outubro de 2019

Pedido de concessão de Doutor Honoris Causa ao Prof. Adrain Smith


por Basilio B. Pereira e Dani Gamerman

Este documento trata da justificativa e motivação para concessão do título de Doutor Honoris Causa pela UFRJ a um dos mais proeminentes matemáticos, estatísticos e administradores científicos mundiais.

O documento apresenta inicialmente comentários sobre a contribuição de Sir Adrian para a Ciência. Em seguida, descreve sua importância para a pesquisa científica no mundo, no Brasil e em particular na UFRJ. Em seguida, anexamos o curriculum vitae de  Sir Adrian Frederick Melhuish Smith e apresentamos vários outros documentos atestando a relevância da trajetória científica do Prof. Adrian Smith e a abrangente visão de Ciência do mesmo.

Introdução

The mediocre teacher tells
The good teacher explains
The superior teacher demonstrates
The great teacher inspires.

Esse documento procura justificar o estabelecimento de uma vinculação formal do Prof. Sir Adrian F. M. Smith à Universidade Federal do Rio de Janeiro. O Professor Adrian Smith é uma das maiores personalidades científicas da Estatística da atualidade. Ele foi protagonista na revolução que foi operada na Estatística na virada do século pela introdução de ferramentas computacionais. Antes dessa revolução, a Estatística já sabia da necessidade de técnicas computacionais mas não as tinha ou não as conhecia. Adrian percebeu desde cedo essa necessidade e encontrou várias alternativas. Muitas delas levaram a bons resultados mas se mostraram de difícil implementação. Então na última década do século passado, ele publicou um artigo seminal que descortinou uma nova possibilidade: MCMC ou Monte Carlo via cadeias de Markov. MCMC permitiu que toda atividade, que estava represada, pudesse se concretizar por completo. Essa técnica é útil para toda a Estatística mas provou ser particularmente adequada para utilização e viabilização da abordagem Bayesiana. A Estatística mudou a partir desse momento, mas Sir Adrian não parou por aí.

Com a sensação de fechamento de um ciclo, ele passou a se dedicar cada vez mais à administração científica e galgou passos ainda mais altos na estrutura acadêmica britânica. Ele foi reitor de importantes universidades, estabeleceu diretrizes para ensino da matemática no Reino Unido e assumiu cargos equivalentes ao de ministro da Ciência. Todos esses pontos serão detalhados nas seções seguintes deste documento mas vale antecipar que essa atuação o levou a uma das maiores honrarias do Reino Unido: o título de Sir. Gostaríamos de concluir esta introdução, falando um pouco da relação do Professor conosco e com a UFRJ.

Um de nós (BBP) conheceu Sir Adrian ainda em 1972, quando assistiu diversas palestras do mesmo e acaloradas discussões que ele (e os outros dois promissores estatísticos, também alunos do Professor Lindley) promoviam com os palestrantes dos Fridays Seminars (seminários das sextas) da Universidade de Londres. Esses seminários conjuntos dos departamentos de Estatística das universidades londrinas se iniciaram nos anos 1930. BPP tambem assistiu nestes seminários um minicurso de Sir Adrian e do Professor Lindley sobre o importante livro de Bruno de Finneti (com discussão de Cox, Welch, e Birnbaun). Esse livro propôs uma fundamentação teórica alternativa da abordagem Bayesiana para a inferência estatística. Isso foi muito importante para o subsequente avanço dessa abordagem. Mais tarde em 1980, BBP promoveu a visita de Sir Adrian por 3 meses ao Instituto de Matematica da UFRJ onde também participou em 1980 do Simpósio Nacional de Probabilidade e Estatística, o mais importante encontro científico de Estatística do país naquele momento. Suas notas de aula para esse curso (Smith, 1980) estão armazenadas na biblioteca do IM/UFRJ e contém vestigios de algumas das idéias que anos mais tarde se tornaram tão importantes.

O outro de nós (DG) conheceu Sir Adrian quando se dirigiu ao doutorado no Reino Unido em 1983, anos mais tarde em 1987, quando defendeu sua tese de doutorado, teve o privilégio de contar com a presença de Sir Adrian na sua banca de avaliação. Logo a seguir, houve a revolução do MCMC com Adrian no seu centro e seu departamento no Imperial College de Londres como um dos principais locais do seu desenvolvimento. DG escolheu esse local para fazer seu pós-doutoramento em 1994 e conhecer de perto e das mãos de seus principais desenvolvedores. Essa visita foi um ponto de inflexão na carreira de DG. Além de vários trabalhos científicos, DG se envolveu na difusão dessa técnica, através de minicursos e palestras aqui no país. Livros didáticos surgiram como consequência desse envolvimento, inicialmente em português e posteriormente também em inglês. Junto com outros docentes da Estatística da UFRJ, a Estatística Bayesiana passou a ser mais difundida no Brasil e a UFRJ foi (e continua sendo) um dos polos mais importantes dessa difusão científica. A partir daí, Sir Adrian enveredou para um caminho que o levou a ter uma agenda muito congestionada, dificultando seus deslocamentos. Mesmo assim, ele ainda visitou a UFRJ em mais um par de ocasiões. Sendo assim, acreditamos que temos presente aqui as condições para a concessão ao Professor Sir Adrian F. M. Smith do título de Doutor Honoris Causa da UFRJ. As seções seguintes procurarão detalhar os atributos acadêmicos e profissionais de Sir Adrian.

Sir Adrian, o cientista

A influência de Sir Adrian para a ciência pode ser medida não só pelo seu curriculum, a ser detalhado nas seções seguintes, mas também pelas honrarias recebidas. Em particular, ele se tornou membro (fellow) da Royal Society. Essa é a prestigiosa academia de ciência do Reino Unido e apenas os mais exemplares cientistas são aceitos como membros. Dentre os estatísticos, o número de membro da Royal Society não passou de uma dezena. Sir Adrian também foi presidente de uma das mais antigas e importantes associações de estatísticos, a Royal Statistical Society, que congrega os estatísticos vinculados ao Reino Unido.

Sir Adrian também foi chefe do departamento de Matemática do Imperial College, Reitor do Queen Mary College (uma das escolas que compõe a Universidade de Londres), foi Reitor da Universidade de Londres, foi Diretor do Departamento de Business, Innovation and Skills (órgão governamental que fornece subsidios e distribui recursos da ordem de bilhões de libras para toda a área de Ciência e Tecnologia do Reino Unido), e vice-diretor do UK Statistics Authority (instituição voltada para controle e supervisão do bom uso da Estatística pelo governo). Atualmente é diretor do recém-criado Instituto Alan Turing (criado para agregar o setor produtivo e a academia na busca de soluções inovadoras para problemas envolvendo grandes massas de dados).

Como resultado de todo esse envolvimento institucional para o avanço da Estatística e da Ciência como um todo, o Professor Adrian Smith foi honrado com a concessão do título de Sir pela monarquia britânica. Esse honraria resume o justo reconhecimento de toda uma carreira voltada para o avanço da Ciência nas mais diferentes formas em que esse objetivo possa ser alcançado, partindo da produção científica de conhecimento inovador e chegando à administração dessa geração e passagem de conhecimento.

Outra contribuição muito importante de Sir Adrian para o avanço da Estatística Bayesiana foi a organização dos encontros de Valencia. Adrian esteve nesse projeto desde a 1a edição em 1979. A equipe organizadora inicial contou com ele, seu orientador e um dos seus ex-colegas do doutorado. Esses encontro passaram a ser realizados a cada 4 anos e foram o ponto focal para estabelecimento de
padrões, definição de metas e discussões gerais sobre a área. Isso foi possível por um bom tempo porque naquele momento a quantidade de pesquisadores ativos na área não passava de uma centena. Com o tempo, esse número foi aumentando com o sucesso da Estatística Bayesiana graças aos avanços trazidos pelos pesquisadores da época e repercutidos e ecoados nesses míticos encontros. Em seu final, após mais de 10 edições, já havia sido criada a sociedade internacional de estatísticos Bayesianos e esses eventos passaram a ser organizados por essa associação, já com várias centenas de
participantes. Mas a liga que esses encontros de Valencia deu a essa geração de pesquisadores marcou época.

Ainda no cargo de Reitor do Queen Mary, Sir Adrian chefiou uma investigação no estado do Ensino Médio na área de Matemática no Reino Unido. Sempre inquieto, ele levantou vários pontos e preparou um dossiê que suscitou muita discussão acalorada na época sobre as mudanças inovadoras que ele introduziu. Nessa oportunidade, ele pode exercitar toda sua capacidade de negociação política pois foi sujeito a várias críticas contundentes vindas do alto escalão do governo e se manteve firme nas suas posições.

Sir Adrian, o professor e orientador

O professor Adrian sempre foi um excelente professor, sempre explicando os conceitos aos seus alunos com paciência e objetividade. Ele consegue transmitir conhecimentos sem prejuízo da profundidade que o assunto exige com o mínimo de palavras.  Ele é a quintessência da concisão britânica. Além disso, o faz sempre com bom humor e utilizando elementos lúdicos para facilitar a compreensão pelos interlocutores, sejam eles alunos de graduação em uma sala de aula ou renomados participantes dos congressos mais importantes da área.

Toda essa energia não poderia ficar contida apenas em salas de aula ou de auditórios de conferências. Ele foi generoso o suficiente para passar o seu conhecimento em escala mais individualizada a dezenas de orientados de doutorado e de pós-doutorado (entre os quais um de nós (DG) teve o privilégio de ser incluído).

Uma busca na internet na sua genealogia acadêmica forneceu a lista de 42 orientados de doutorado. A grande maioria desses nomes se tornou pesquisador de prestígio no cenário internacional da Estatística e áreas afins. A título de ilustração, gostaríamos de destacar apenas 2 nomes: David Spiegelhalter e Mike West. O primeiro é um pesquisador de muito prestígio pela sua divulgação da Estatística e o segundo construiu uma sólida carreira à frente do Departamento de Estatística da Universidade de Duke, nos Estados Unidos.

A relevância do Professor Spiegelhalter para o avanço da Ciência teve início quando ele esteve à frente do projeto BUGS. Esse projeto construiu uma plataforma para análises de dados sob a abordagem Bayesiana usando a metodologia MCMC. Conforme dissemos na seção 2, essa metodologia revolucionou a Estatística no final do século passado graças ao trabalho do Prof. Adrian Smith. Faltava ainda adaptá-la aos diferentes modelos usados e aplicá-la aos conjuntos de dados. O projeto BUGS cuidou de fazer isso para uma gama muito abrangente de situações e viabilizou o uso da metodologia Bayesiana a todos usuários ávidos em usá-la mas que não conseguiam fazê-lo por falta de treinamento matemática. Isso acabou após o BUGS e uma pequena revolução teve início com psicólogos, médicos, engenheiros, geólogos, meteorologistas e outros profissionais com conhecimento básicos de Estatística podendo fazer análises de seus dados. Após esse avanço aplicado, o Prof. Spiegelhalter se dedicou à divulgação da Estatística para a sociedade em geral. Seu trabalho adquiriu muita proeminência na sociedade britânica e acabou por lhe render também a honraria de Sir, em um reconhecimento institucional do valor de sua contribuição.

O departamento de Estatística de Duke foi basicamente criado após a chegada do Prof. West e foi sua grande marca institucional. Como pesquisador, ele deixou sua marca em centenas de artigos, muitos deles publicados em periódicos de elite e abridor de novos caminhos para a Estatística em áreas como Séries Temporais, Modelagem Hierárquica e Estatística Não-Paramétrica. Com sua capacidade organizadora e científica, o Prof. West atraiu excelentes pesquisadores para o departamento, que se tornou desde então uma referência mundial no avanço da inferência Bayesiana. Não surpreende que ele tenha herdado de Sir Adrian também a capacidade de orientação. Ele formou dezenas de de orientados (entre os quais um de nós (DG) e outros 4 brasileiros), chegando até mesmo a superar quantitativamente o seu mestre e orientador.

Assim, Sir Adrian sempre teve grande generosidade em sala de aula e também na questão científica formando excelentes alunos e pesquisadores, com grandes contribuições para a Estatística e áreas afins.

Sir Adrian, o pesquisador

Genius is one percent inspiration and ninety-nine percent pespiration. (Thomas Edison)

The life of an individual is the product of GENIUS the acronym for the combined effect of Genetics, Education, Nurture, Iniciative, Upbringing and Serendipity. (C. R. Rao)

Adrian Smith começou sua carreira científica com o pé direito. Seu orientador Dennis Lindley foi responsável por boa parte da fundamentação teórica dos avanços da Estatística Bayesiana em meados do século passado. O tema que ele tomou para a tese de Sir Adrian no início das anos 1970 foi modelagem hierárquica. Essa é uma área imprescindível para qualquer análise de dados nos dias de hoje com um mínimo de estruturação, como é bastante comum atualmente. Mas naquele momento, ainda estava iniciando e a contribuição da tese de Sir Adrian foi de jogar luz sobre como usá-la e obter resultados com ela. O artigo principal de sua tese é até hoje um dos artigos mais citados de Estatística.

Ele prosseguiu na linha de construção de modelos e obtenção de mecanismos capazes de avalia-los tanto na sua produção científica quanto nas suas orientações. Mas progressivamente ele foi percebendo que isso não teria muito futuro fora das fronteiras da Estatística pela dificuldade no processamento de dados para análises de dados reais. Assim, com o passar do tempo ele foi dedicando mais e mais esforço de sua investigação na obtenção de técnicas aproximadoras de boa qualidade para gerar resultados confiáveis para os usuários da Estatística Bayesiana.

Nessa direção, ele transitou por adaptação de técnicas de quadratura, aprimoramento de algoritmos de buscas de máximos de funções, e de técnicas de simulação via Monte Carlo. Uma das áreas mais em voga hoje é Monte Carlo sequencial, cuja origem pode ser identificada com o trabalho que Sir Adrian desenvolveu em uma das suas orientações de doutorado em meados dos anos 1980. Mas sem dúvida, seu grande achado ainda estava por vir através do MCMC, técnicas de Monte Carlo usando cadeias de Markov. Essas técnicas já existiam há décadas e até eram usadas em nichos específicos de Estatística, como reconstrução de sinais. Mas foi apenas após um artigo escrito por Sir Adrian falando das suas boas propriedades que o mundo virou seus olhos para essa técnica e não a largou mais até os dias de hoje, 3 décadas após. E esse avanço devemos diretamente a Sir Adrian!

Vários artigos importantes foram escritos por ele a partir daí nesse tema para robustificar a metodologia que ele tinha identificado. Esse furor científico tornou ele um dos 10 estatísticos mais citados do mundo na virada do século.

Vale destacar que o afinco necessário à produção de todo esse conhecimento metodológico não o impediu de se envolver diretamente em alguns dos problemas das áreas da Ciência usuárias da Estatística. Um das grandes áreas de sua maior atuação foi sem dúvida a Medicina e áreas afins. Títulos de seus artigos contendo expressões como kidney transplant, bioequivalence studies, radioimmunoassay, perinatal mortality e pharmacokinetic modelling abundam, num atestado eloquente de seu envolvimento aplicado.

Mas a mente de Sir Adrian já tinha mudado de foco. Ele achou que já tinha atingido o ápice, seu grande objetivo como pesquisador de Estatística de viabilizar a análise de dados sob a ótica Bayesiana a todos os seus usuários não-estatísticos. Sua mente precisava de maiores desafios, que necessariamente deveriam estar fora dos limites de um pesquisador em sua área específica, a Estatística.

A partir daí ele se envolveu mais e mais com a administração científica conforme descrevemos nas seções anteriores.

Curriculum Vitae de Sir Adrian

The man who wakes up and finds himself famous hasn't been asleep.

Sir Adrian é co-autor de 3 livros, entre os quais a referência Bayesian Theory, um clássico da fundamentação teórica da Estatística Bayesiana. É o livro-texto de cursos de Pós-graduação em várias  universidades, incluindo a UFRJ, onde é usado na disciplina mais importante do Doutorado em Estatística.

Sir Adrian também co-editou 13 livros, entre os quais os 9 livros que serviram de Anais dos lendários encontros de Valencia. Esses livros, além de seu importante conteúdo científico, são um relato da história da Estatística Bayesiana. Eles contem os textos de todos as conferências convidados mas também as discussões que eles ensejaram durante o encontro, fornecendo um rico levantamento das reflexões sobre os temas sendo propostos no momento.

Ele também publicou 139 artigos científicos em periódicos de Estatística e áreas afins ao longo de 3 décadas de produção científica. 28 desses artigos foram publicados em um dos 4 periódicos de elite da Estatística, em um atestado indiscutível da altíssima relevância de sua contribuição científica para o avanço da Estatística. A sua contribuição mais relevante foi sem duvida o artigo de 1990 intitulado Sampling-based approaches to calculating marginal densities, em co-autoria com Alan Gelfand. Nesse artigo, ele compara o MCMC (vide seção 2 deste documento) com outras técnicas de aproximação e mostra a eficiência dessa técnica. Mais importante que isso, esse artigo mudou a Estatística ao mostrar que a técnica não só era boa como era de uso geral e indiscriminado, conhecimento que não era disseminado na comunidade estatística. A partir daí, resultados antes represados pela ausência de ferramental para obtê-los, puderam ser explicitados e a Estatística Bayesiana explodiu como meio de obtenção de resultados de análises estatísticas.

A Estatística Bayesiana, até então considerada interessante porém inviável, se mostrou uma forma potente e abrangente para ser usada para todos os analistas de dados nos seus mais diversos problemas e análises de dados.

Suas principais área de atuação não se restringiram aos estudos sobre MCMC. Ele teve grande influência em modelos hierárquicos Bayesianos, escolha de modelos, modelagem robusta, estatística não-paramétrica, técnicas de classificação, amostragem Monte Caro e filtro de partículas.

Tudo isso pode ser comprovado na lista completa de artigos, livros e traduções de Sir Adrian. Essa lista foi extraída de Damien et al (2013), um livro editado por ex-orientados de Sir Adrian e feito em homenagem a ele. Todos os capítulos desse livro escritos por pesquisadores influenciados por Sir Adrian, entre os quais um de nós (DG).

Ainda no tema de disseminação, Sir Adrian também teve papel importante como tradutor para o ingês do livro: Theory of Probability, do italiano Bruno De Finetti. Esse livro fornece uma forma alternativa de justificar o uso da abordagem Bayesiana para a Estatística e essa tradução permitiu a disseminação dessa defesa do método para toda a comunidade científica internacional.

Entrevistas de Sir Adrian

Every man is entusiastic at times. One man has enthusiasm for fifty minutes, another for fifth days, but it is a man who has it for fifty years who makes a success of life.

Algumas entrevistas de Sir Adrian  podem ser vistas em:





Considerações finais

Esperamos que esse resumido arrazoado tenha dado a correta dimensão da proeminência científica do Professor Sir Adrian Smith não só para a Estatística como para a Ciência como um todo.

Trata-se de um profissional com uma carreira que varreu todos os campos da Ciência desde a produção científica e sua disseminação para a sociedade, passando por cargos acadêmicos de mais alta importância e contribuição para associações e instituições científicas e chegando até a militância na política com vistas a um melhor aproveitamento dos recursos gerados pela Ciência.

Na nossa opinião, a Universidade Federal do Rio de Janeiro só tem a ganhar, e muito, em ter seu nome associado a uma personalidade de tamanha estatura no seu quadro de Doutores Honoris Causa.

Referências

Paul Damien, Petros Dellaportas, Nicholas G. Polson, and David A. Stephens (eds.) (2013). Bayesian Theory and Applications. Oxford University Press.

A. F. M. Smith (1980) BAYESIAN LINEAR MODELS COURSE AND TALKS ON CURRENT RESEARCH. Notas de Aula do IM/UFRJ. Disponível na Biblioteca de Pós-Graduação do IM/UFRJ

terça-feira, 17 de setembro de 2019

Adrian Smith é Doutor Honoris Causa da UFRJ


Em sessão realizada na última 5a feira, 12 de setembro de 2019, o Conselho Universitário da UFRJ aprovou a concessão do título de Doutor Honoris Causa da UFRJ ao Professor Sir Adrian F. M. Smith. Para chegar até o Conselho Universitário, o pedido feito pelo professor Basílio de Bragança Pereira e por mim passou pela aprovação do Departamento de Métodos Estatísticos, pela Congregação do Instituto de Matemática e pelo Conselho do Centro de Ciências Matemáticas e da Natureza, todos órgãos da UFRJ. Além disso, o pedido foi apoiado pela Congregação da Faculdade de Medicina e pela direção do Instituto do Coração Edson Saad, também órgãos da UFRJ. 

Vale destacar que em todas essas instâncias, a aprovação do pedido se deu de forma unânime. Essa rara combinação só atesta a importância da trajetória do professor Adrian. Esse ponto foi destacado na sessão do Conselho Universitário, onde alguns conselheiros pontuaram a satisfação em formalizar essa conexão com pesquisador de renome mundial de tamanha envergadura.

Títulos de Doutor Honoris Causa são outorgados por instituições acadêmicas. Segundo a Wikipedia,  Doutor Honoris Causa "é uma locução gramatical latina (em português: "por causa de honra") usada em títulos honoríficos, não comercial, concedidos por universidades a pessoas eminentes, que não necessariamente sejam portadoras de uma graduação acadêmica (ou diploma), mas que destacaram-se em determinada área (artes, ciências, filosofia, letras, promoção da paz, de causas humanitárias etc.), por sua virtude, mérito ou serviços que transcendam famílias, pessoas ou instituições. Isto é, atingiu um alto nível de reconhecimento profissional e de feitos significativos, a ponto de ser considerado grau honorário de doutor.

Com efeito, a lista de doutores Honoris Causa da UFRJ inclui expoentes da ciência mundial como Albert Sabin (inventor da vacina contra a poliomielite), Alexander Fleming (inventor da penicilina), Claude Cohen-Tannoudji (prêmio Nobel de Física, registrado na foto acima), Konrad Bloch (prêmio Nobel de Química), e Selman Waksman (prêmio Nobel de Medicina). Mas também tem olhar eclético, contemplando artistas como Augusto Boal, Candido Portinari, Carlos Drummond de Andrade, Gabriel Garcia Marques, Heitor Villa Lobos, Mstislav Rostropovich, Oscar Niemeyer e Ziraldo e políticos e outros homens públicos como Charles de Gaulle, Desmond Tutu, Getulio Vargas, John Kennedy, Lula e Willy Brandt. Como se pode inferir da pequena amostra acima, a lista é extensa e pode ser vista aqui.

Na Estatística, a UFRJ teve apenas a concessão ao Professor Sir David R. Cox, em maio de 2000. A entrega do título foi relaizada em 28 de julho de 2000, tendo o Professor Basílio de Bragança Pereira como proponente e orador. Curiosamente, o Professor Smith ocupou o posto de Professor Titular do Imperial College de Londres que havia sido deixado vago pela aposentadoria do Professor Cox.

Estamos agora aguardando a realização da cerimônia de outorga para os próximos meses e ela será oportunamente divulgada aqui. Trata-se de momento importante para a Estatística da UFRJ e também a nível nacional pelo registro formal de uma conexão com pesquisador de tão alta relevância. 


terça-feira, 30 de julho de 2019

Minimíssil aleatório

Fonte: SporTV

Uma característica marcante da cultura brasileira é sua criatividade, abastecida pela espontaneidade do nosso povo. Ela desponta de diferentes formas e o esporte, por despertar maiores emoções e envolver toda a gama de estratos socioeconômicos, é um terreno fértil para manifestações do gênero. O futebol em particular produz algumas das mais marcantes, pelo seu alto alcance dentro da sociedade brasileira. É bem verdade que a globalização vem produzindo uma diminuição desses tipos de acontecimento mas vez por outra eles seguem ocorrendo. Alguns exemplos podem ser vistos aqui.

São famosas as frases de jogadores de futebol como Dario, carinhosamente conhecido como Dadá Maravilha pelos seus admiradores: "Não existe gol feio; feio é não fazer gol" ou "Não venha com a problemática que eu dou a solucionática" são alguns exemplos, ou de dirigentes como o lendário presidente do  Corinthians Vicente Matheus: "Comigo ou sem migo o Corinthians será campeão", "Minha gestação foi a melhor que o Corinthians já teve" ou "Haja o que hajar, o Corinthians vai ser campeão".

A globalização e a competitividade a nível internacional vem aplacando e domesticando essa fonte, apesar da origem predominantemente humilde da maioria de nossos atletas e futebolistas. Mas alguns poucos remanescentes dessa veia literária teimam em permanecer produtivos entre nós. Um dos melhores exemplos da atualidade é o jogador Marinho, atualmente jogando pelo Santos. O anúncio de sua contratação pelo Santos em seu twitter explorou essa faceta do jogador. Marinho é tão habilidoso em seu ofício quanto em seu domínio da língua portuguesa.

No caso específico do Marinho, tão chamativo quanto o efeito de suas frases é a inocência que as motiva. Nas férias deste último verão, ele deixou que fosse gravada em video uma brincadeira em que ele pedia para ser contratado pelo Flamengo, embora ainda tivesse contrato em vigência com o Grêmio. Isso lhe causou aborrecimentos, especialmente junto a torcedores do clube que defendia na época. Outras vezes, ele reconheceu não saber questões óbvias a respeito do esporte que pratica.

Mas o que isso tudo tem a ver com o StatPop e a Estatística? No fim de semana retrasada, Marinho estava no banco de reservas em um jogo e entrou em campo no meio do 2o tempo. Com poucos minutos em campo, ele marcou um belo gol com um potente chute de fora da área. Esse gol acabou determinando a vitória do seu time, colocando-o com a pontuação de líder da competição. Perguntado após o jogo sobre o bonito gol, ele não teve dúvidas e sacramentou logo no início da entrevista:  "Oxi, aí foi um minimíssil aleatório. Esse é diferente, né?", deixando claras suas simpatia, singeleza e bahianidade. (A foto acima é do momento em que o jogador desferia sua emblemática frase.)

Essa entrevista povoou o noticiário esportivo da semana passada e ficou tão reconhecida quanto o importante gol que garantiu a vitória de seu time. A presença de uma palavra tão cara à Estatística em um contexto onde a Estatística apenas começa a aparecer merece nosso destaque. Não dá para dizer o que uma personagem tão folclórica queria dizer com sua expressão mas talvez ele quisesse apenas registrar a efemeridade do feito alcançado. Afinal, esse particular chute conteve vários aspectos que poucas vezes são encontrados, tais como a surpresa do momento de seu arremate, a força empregada no mesmo e o destino junto a uma das traves. Tudo isso dificultou muito a defesa do goleiro e impediu a intervenção dos adversários na sua tentativa de bloqueá-lo. Mas foi a improvável conjunção de todos esses fatores que deve ter levado Marinho a atribuir a adjetivação aleatório ao seu feito.
   
E a expressão de Marinho parece ter adquirido sobre-vida. ele ontem foi filmado andando em uma motocicleta elétrica. Ele estava nos arredores do centro de treinamento e trajava o uniforme de treino da equipe. O evento em si não tem a menor relevância e só virou notícia devido ao seu personagem. Ele ganhou relevância após o gol e o nome a ele dado pelo seu autor. A maior prova disso foi o nome escolhido como título da reportagem: rolê aleatório!

Num momento em que a Estatística ainda é tão pouco compreendida ou mesmo conhecida pela sociedade em geral, Marinho presta sua contribuição para uma mudança nesse quadro, com o bom humor que o caracteriza. A Estatística agradece e deveria dizer algo do tipo: Obrigado, Marinho! e siga desferindo mais desses seus mísseis que tão bem fazem ao esporte e cultura nacionais. 

terça-feira, 23 de julho de 2019

Relato do IMPS 2019

Fonte: arquivo pessoal


Conforme prometido na última postagem, tratarei de fazer um relato de minhas impressões sobre o recém-encerrado encontro de 2019 da Psychometric Society. Devo começar dizendo que foi uma grata surpresa para mim ver a quantidade mas principalmente a diversidade de temas apresentados e tópicos cobertos. Quando conversei com o atual presidente da Psychometric Society, mencionei esse ponto a ele. Ele me informou que isso não foi um mero acaso mas um esforço consciente da sociedade na direção de temas mais variados que estão se relacionando com a Psicometria ou que possam a ela ser relacionados.

De qualquer modo, a imensa maioria dos participantes era composta de pesquisadores e profissionais vinculados às áreas sociais e humanas, notadamente Psicologia e Educação. Havia estatísticos tambpem mas eram claramente minoria na composição do evento.

Evidentemente, a maioria das apresentações versavam sobre os problemas usuais de psicometria, que se concentram em grande parte em modelos de teoria de resposta ao ítem e de equações estruturais. Entretanto, encontrei vários trabalhos interessantes em outras direções envolvendo temas atuais, como inferência aproximada para modelos incalculáveis e outros usos de técnicas de aprendizado de máquinas e redes neurais (profundas ou não). Tomei contato com vários usos interessantes de modelagem não-paramétrica para promover extensões de modelos usuais em diversas direções.

A palestra de abertura foi proferia por um psicometrista vinculado a um departamento de Psicologia (retratado na foto acima). O tema central da palestra foi a utilização de muitos modelos em inferência Bayesiana e o palestrante fez uma enfática defesa da abordagem conhecida como model averaging em oposição à model choice. Na 1a opção, faz-se inferência considerando todos os modelos contemplados, ponderados por suas respectivas probabilidades (a posteriori). Na 2a opção, utiliza-se algum critério (máxima probabilidade a posteriori, AIC, BIC, DIC, etc) para escolher um único modelo e fazer toda a inferência baseada neste modelo.

Um ponto que me chamou a atenção foi o estilo de algumas das apresentações, claramente com mais ênfase na forma (lúdica) da apresentação do que em seu conteúdo. Pareceu-me ser uma tendência mais associada à Ciência dos Dados, talvez por conta da vastidão de técnicas disponíveis e talvez menos no desenvolvimento propriamente dito dessas técnicas. As palestras mais técnicas que assisti claramente se inseriam em um estilo de apresentação mais convencional, com o qual estou mais acostumado. A palestra de abertura ficou em um formato híbrido, como a foto acima ilustra.

O evento teve cerca de 400 participantes representando 33 países. Houve apresentações para todos os gostos. Afora as conferências, que eram destacadas com no máximo 2 por horário, o grosso da programação consistiu de sessões paralelas de apresentações orais (6 a 8 sessões por horário) e em formato de poster. Assim, havia um cardápio bem variado com muitas pitadas de novidades tanto teóricas quanto de outras disciplinas bem como apresentações específicas de tópicos usuais de psicometria. quem queria ficar dentro do seu nicho, teve o que assistir e quem queria ver novidades também teve. O evento correu no Centro de Extensão da PUC do Chile, em um prédio histórico com um enorme claustro central, devidamente coberto para facilitar a climatização do ambiente. Esse enorme espaço livre foi muito bem aproveitado para os coffee breaks e os almoços, onde a organização forneceu saladas e sanduiches. Isso fomentou a possibilidade de mais interação entre os participantes.Eu mesmo me beneficiei com interessantes e proveitosas trocas de informação. 

Esses encontros ocorrem anualmente, em revezamento de continentes e o próximo já está agendado para os Estados Unidos. Se você tem interesse pelos avanços da área, faço uma forte recomendação para participar.

terça-feira, 16 de julho de 2019

IMPS 2019


A Psicometria é a área da Ciência que cuida da análise de dados provenientes de fenômenos das Ciências Humanas e Sociais. Análises de dados inevitavelmente envolvem a incorporação de incerteza e consequentemente a Estatística é uma componente muito forte de análises psicométricas. essa área tomou um impulso muito grande na 1a metade do século passado. Personagem fundamental desse avanço, Thurstone foi o criador de escalas de inteligência baseadas em análises fatoriais. Outro contribuinte muito importante para o avanço da área foi Frederick Lord, com seu trabalho de caracterização da Teoria de Resposta ao Ítem, já aludida aqui antes. 

Thurtstone fundou a Psychometric Society (sociedade internacional de psicometria) em 1935 e criou a Psychometrika, o periódico que até hoje é o principal meio de divulgação científica da área. Essa sociedade cresceu muito ao longo do tempo e vem realizando encontros anuais há um bom tempo. Ocorrerá ao longo desta semana a edição 2019 do International Meeting of the Psychometric Society (IMPS). Esse evento ocorrerá em Santiago do Chile e ocupará toda a semana.

Eu tenho trabalhos realizados na área, especialmente em Teoria de Resposta ao Ítem (TRI), que foram até apresentados em edições anteriores do IMPS mas por colaboradores. Além disso, fui criador, junto com Caio Azevedo, dos Congressos Brasileiros em TRI. Mas nunca tinha participado de alguma edição do IMPS. Essa lacuna estará sendo preenchida amanhã, quando darei minha conferência no evento.

Essa participação será paradoxal de uma certa forma, pois apresentará um estudo do efeito da poluição na saúde, já tratado aqui. (Curiosamente, a foto que ilustra a postagem sobre poluição foi tomada em um inverno de Santiago.)  Entretanto, o trabalho que irei apresentar é um exemplo de modelagem de dados através de estruturas latentes. Esse é justamente o enfoque principal da Psicometria: extração de fatores latentes para caracterizar traços latentes como inteligência ou nível de ansiedade em estudos psicológicos ou proficiência em estudos educacionais.

Apesar da diferença na área de aplicação da técnica estatística, ele é basicamente um conjunto de procedimentos eminentemente estatísticos. O foco da palestra será evidenciar as similaridades entre as aplicações, que levam ao uso de ferramentas similares. Claro que também explicarei as dissimilaridades, que caracterizam o efeito da poluição na saúde. Várias outras palestras do evento tratam de modelos similares tratando de relação entre variáveis a nível latente. Esse modelos são conhecidos como modelagem de equações estruturais (ou structural equation modeling).

Espero que a palestra seja compreendida assim pela platéia e seja uma contribuição útil para os participantes. Pretendo fazer um relato do evento em uma postagem futura.



terça-feira, 9 de julho de 2019

Novos cursos de Estatística com Ciência de Dados


O tema Ciência de Dados tem sido recorrente aqui no StatPop, sendo a última postagem no tema no início do ano. Desde então aconteceram eventos importantes nesse campo. Acho que estamos em um momento oportuno para voltar a falar sobre o tema. A diferença é que agora vamos nos concentrar em como o Brasil está reagindo a essa novidade na esfera acadêmica. Nesse particular, a única postagem que tenho lembrança foi a de uma breve menção em postagem feita há cerca de um ano.

Desde então juá temos registradas uma série de iniciativas a nível de pós-graduação recém criadas ou já existentes em diversas regiões do país. (A figura acima foi tirada da página inicial de uma dessas inciativas.) A maioria desses cursos me parecem ser a nível de especialização com duração de 1 a 2 anos. Essas inciativas são muito boas e tem refletido o carater interdisciplinar dessa área que vem surgindo, com efetiva participação de estatísticos, especialistas em computação e até matemáticos aplicados.

A pergunta que fica é: e a nível de graduação, como estão reagindo nossas instituições de ensino superior? Parece-me que vários cursos de graduação pelo país vem revisando suas grades curriculares para incluir mais elementos característicos dessa nova área. Os momentos mais impactados pela revisão costumam ser as disciplinas de Estatística Computacional, Modelos de Regressão e Análise Multivariada mas algumas disciplinas eletivas tem sido oferecidas. Esses movimentos tem sido realizados em maior ou menor grau em várias graduações de Estatística espalhadas pelo país, sinalizando uma salutar atualização do currículo oferecido aos alunos de graduação em Estatística.

O resultado será uma formação mais sintonizada com o que o mercado de trabalho está demandando das universidades. Certamente, os alunos que escolheram a carreira de Estatística sairão com uma formação mais atual. Mas com o que isso contribui com a crescente massa de alunos terminando o ensino médio e ansiosos por embarcar nessa nova, promissora e lucrativa carreira que se inicia? Minha impressão é que ajuda muito pouco pois, além de pouco conhecida, a carreira de Estatística não tem sido claramente conectada à Ciência dos Dados. Pelo contrário, parece-me que a Computação tem sido percebida mais próxima a ela que a Estatística.

Recentemente, fomos brindados com a ótima notícia de abertura de uma graduação já para início em 2020 na Universidade de São Paulo, no campus de São Carlos. Essa mudança me parece ir mais além do que foi descrito no parágrafo anterior. Além de uma atualização na grade curricular, essa proposta explicita no nome do curso uma inequívoca vinculação da já conhecida Estatística com a sua prima-irmã recém-chegada ao mundo Ciência dos Dados. Os alunos que ficavam sem resposta adequada no que diz respeito à Estatística. A inciativa da USP procura deixar clara a existência dessa vinculação.

Esse mesmo grupo de São Carlos não parou por ai. Já está em gestação a criação, junto com a Computação, de um curso de graduação em Ciência dos Dados. Nesse curso, volta a ficar oculta no nome a ligação Estatística-Ciência dos Dados mas só no nome. O curso terá uma forte componente estatística e, mais importante, trará os jovens que só se sentiram atraídos pela novidade mas que tem interesse pela base tecnológica ao mundo da Estatística.

Acho que essa duas inciativas descritas acima cumprem o mesmo papel de propiciar aos novos alunos opções que supram de forma adequada a necessidade de formação apropriada para fazer análises de dados (com ou sem maiúsculas no nome). Isso garante a merecida relevância da Estatística no cenário cada vem mais competitivo da formação universitária com vários cursos sendo criados para atrair e dar boa formação aos bons alunos.

Essa iniciativa vai dar certo e atrais mais bons alunos para a Estatística? Ainda é muito cedo para dizer mas tudo indica que sim. De todo modo, sou bastante simpático a esse tipo de movimento mais radical que vise dar a maior visibilidade possível à área em um momento tão delicado para o seu desenvolvimento. Estou na torcida para que dê certo. A Estatística merece!

terça-feira, 25 de junho de 2019

VI COBAL


Ocorreu na semana passada a 6a edição do Congresso Bayesiano da América Latina (COBAL). O evento foi organizado e aconteceu no campus central da PUC do Peru, em Lima. Esta edição contou com 137 participantes que, segundo informado, foi um recorde no número de participantes. O evento contou com 7 conferências, 3 minicursos, 11 sessões convidadas com 3 apresentadores em cada uma delas, 10 sessões de apresentações orais (com 3 a 4 apresentações por sessão) e 2 sessões posters (com 36 apresentações registradas). Contando apenas 1 apresentação por participante já dá um total de cerca de 115 participantes ativos.

A organização do evento seguiu diretrizes já adotadas na 5a edição do COBAL e todas as apresentações foram proferidas em português ou espanhol. Nenhuma apresentação pode ser feita em inglês mas todos os apresentadores dominavam bem ao menos uma das duas línguas. Apesar de um certo estranhamento inicial, todos mais acostumados com a língua semi-oficial da Estatística, o inglês. Aos poucos foi havendo uma adaptação de apresentadores e platéia e considero que esse esquema foi relativamente satisfatório para todos. Tivemos até brasileiros se aventurando no espanhol, língua da grande maioria dos participantes.

Essa restrição às línguas do evento pela organização teve influência direta na escolha dos conferencistas e outros apresentadores. Isso esteve muito longe de ser um problema e a qualidade dos apresentadores escolhidos foi de muito boa qualidade e antenada com a fronteira do conhecimento de Estatística no cenário mundial em diferentes temas. Vale ressaltar que todos esses apresentadores não eram apenas de países de línguas português e espanhol mas todos eram originários da América Latina. Infelizmente, fui o único conferencista afiliado a uma instituição latino-americana; todos os outros estão baseados em instituições de Estados Unidos e Europa. Mas foi muito bom saber que é possível realizar um evento de ótimo nível científico contando apenas com latino-americanos.

Conferência de encerramento do COBAL6 (Fonte: Flávio Gonçalves)

O evento também aproveitou a ausência de uma conferencista para realizar uma assembléia aberta a todos os participantes no espaço liberado na agenda. Essa assembléia teve como objetivo principal a formalização do processo de organização das próximas edições do COBAL. Depois de uma rápida discussão sobre a melhor forma de fazer isso, foi decidido cair uma sessão da ISBA voltada especificamente para a América Latina. Com isso, os COBALs poderiam formalmente passar a ser organizados por esse braço da ISBA, que é associação internacional voltada para a Estatística Bayesiana. Foi falado sobre a importância de estender o alcance da Estatística Bayesiana para todos os países da América Latina mas a formalização dessa sessão ainda será feita. 

As apresentações trataram de temas bastante variados com muita ênfase em análises de grandes massas de dados (big data), sendo boa parte deles provenientes de dados genéticos. Muitas das análises envolveram a identificação e formação de clusters (ou conglomerados) para identificação de padrões. Diferentes estratégias de aproximação para viabilizar a computação e processamento das massas de dados também foram apresentadas. Diferentes métodos para analisar dados sociológicos, com as inerentes dificuldades a certas definições dessa área, também forma apresentados. Outra área contemplada foi amostragem para lidar com diferentes formas de imputação de dados faltantes sob diferentes contextos. 

Vale destacar as ótimas instalações da PUC-Peru em um campus moderno, bonito, bem equipado e funcional. Como exemplo, podemos falar da mesa "infinita" que servia para os usuários do café no subsolo da biblioteca e do Ágora, interessante espaço de convivência (vide foto abaixo) do prédio de Ciências Sociais, onde ocorreu a maioria das atividades do encontro. A existência de vários cafés e restaurantes dentro do campus tornou muito agradável a estadia ao longo de todo o dia no congresso.

Ágora, prédio de Ciências Sociais (arquivo pessoal)

O saldo final do evento foi bastante positivo com um grupo de pesquisadores experientes apresentando visões abrangentes de algumas áreas, tendo por outro lado, um grupo de jovens pesquisadores apresentando contribuições de excelentes nível e densidade. Houve muita discussão de fundamentos e muita discussão de análise de dados, com boa participação de todos. Isso nos traz esperanças de manter (ou quem sabe até aumentar) o bom nível da produção científica em Estatística Bayesiana na América Latina.

terça-feira, 18 de junho de 2019

Estatística e consequências não-intencionais*

Karen Kafadar (Fonte: ASA)

por Karen Kafadar, presidente da American Statistical Association

Muitos anos atrás, Allan Wilks falou sobre as experiências que ele e Richard Becker e John Chambers (co-desenvolvedores de S, o progenitor de S-Plus e R) encontraram entre os usuários. Um de seus comentários permaneceu comigo todos esses anos. Ele ficou surpreso com as maneiras como o S estava sendo usado, formas que eles nunca imaginaram. “Por exemplo, uma pessoa ligou para dizer que S era incrivelmente lento. Tudo o que ele queria era uma matriz de identidade e levava meia hora. Fiquei intrigado; o comando diag (1000) leva uma fração de segundo. Acontece que ele estava criando a matriz com loops for: para (i em 1: 1000) {para (j em 1: 1000) {if (i == j) então A [i, j] = 1 else A [ i, j] = 0}}. Nunca nos ocorreu que as pessoas usariam nosso pacote dessa maneira”.

Recentemente, em reuniões de capítulos, conferências e outros eventos, tive a sorte de conhecer muitos dos nossos membros, muitos dos quais se sentem desconfortáveis ​​com os efeitos das opiniões divergentes sobre os p-valores expressos no suplemento de março de 2019 da The American Statistician (TAS). Os editores convidados - Ronald Wasserstein, Allen Schirm e Nicole Lazar - apresentaram a Declaração da ASA sobre p-valores ​​(2016) ao afirmar o óbvio: “Sejamos claros. Nada na declaração da ASA é novo. ”De fato, os seis princípios são bem conhecidos pelos estatísticos. Os editores convidados continuaram: “Esperávamos que uma declaração da maior associação profissional de estatísticos do mundo abrisse uma nova discussão e chamasse uma atenção renovada e vigorosa para mudar a prática da ciência com relação ao uso da inferência estatística”.

Os autores do suplemento de março de 2019 da TAS ofereceram mudanças. No entanto, como os editores notaram, “as vozes dos 43 artigos desta edição não cantam como uma só. … Para nós, estes são todos os sons de inferência estatística no século 21, os sons de um mundo aprendendo a se aventurar além de p <0,05”.

Um debate saudável sobre abordagens estatísticas pode levar a melhores métodos. Mas, assim como Wilks e seus colegas descobriram, conseqüências não intencionais podem ter surgido: não-estatísticos (o alvo da questão) podem estar confusos sobre o que fazer. Pior, “ao se libertar dos vínculos de significância estatística” como os editores sugerem e vários autores insistem, os pesquisadores podem ler o chamado para “abandonar a significância estatística” como “abandonar completamente os métodos estatísticos”.

Concordamos com a esperança dos editores de que “as estatísticas em ciência e política se tornem mais significativas do que nunca”. Desde que este recente suplemento da TAS apareceu, seus editores convidados estiveram ocupados viajando pelo país e respondendo a telefonemas para discutir e esclarecer os problemas com p-valores com o termo “significância estatística” e com “alternativas aos p-valores”.

Mas podemos precisar de mais. Como exatamente os pesquisadores deveriam implementar esse “novo conceito” de pensamento estatístico? Sem perguntas específicas, perguntas como “Por que se livrar de p-valores é tão difícil?” podem levar alguns de nossos colegas cientistas a ouvir a mensagem como “Abandonar p-valores”… apesar da declaração dos editores convidados: “Nós não estamos recomendando que o cálculo e o uso de valores-p contínuos sejam descontinuados”.

Brad Efron disse uma vez: "Aqueles que ignoram a estatística estão condenados a reinventá-la." Em seu comentário ("Não é culpa do p-valor") após a Declaração ASA de 2016 sobre p-valores, Yoav Benjamini escreveu: Declaração do Conselho sobre os p-valores pode ser lida como desencorajando o uso de p-valores porque eles podem ser mal utilizados, enquanto as outras abordagens oferecidas podem ser mal utilizadas da mesma maneira. ”De fato, p-valores (e todos os métodos estatísticos em geral) podem ser mal utilizados. (Assim podem carros e computadores e telefones celulares e álcool. Até mesmo palavras em inglês são mal utilizadas!) Mas bani-las não impedirá o mau uso; os analistas simplesmente encontrarão outras maneiras de documentar um ponto - talvez melhores maneiras, mas talvez menos confiáveis. E, como escreve Benjamini, os p-valores resistiram ao teste do tempo em parte porque oferecem “uma primeira linha de defesa contra serem enganados pela aleatoriedade, separando o sinal do ruído, porque os modelos requeridos são mais simples do que qualquer outra ferramenta estatística”- especialmente agora que o bootstrap de Efron se tornou uma ferramenta familiar em todos os ramos da ciência para caracterizar a incerteza nas estimativas estatísticas.

Conceitualmente, razões de verossimilhança (LRs) e modelos Bayes hierárquicos e distribuições de probabilidade (nas quais os modelos LR e Bayesiano são baseados) são adições úteis aos p-valores. Mas eles também têm incerteza. Além disso, tente explicar esses conceitos estatísticos para não-estatísticos. (Eu tentei. E todos nós também quando trabalhamos com cientistas não-quantitativos. O bootstrap é muito mais fácil de explicar.) Nosso desafio continua sendo explicar efetivamente esses conceitos para não-estatisticos.

No suplemento de março de 2019 da TAS, Ronald Fricker e seus colegas analisaram 31 artigos publicados em uma edição de 2016 da Basic & Applied Social Psychology (BASP) um ano após seus editores proibirem o uso de estatísticas inferenciais. “Encontramos várias instâncias de autores exagerando as conclusões além do que os dados suportariam se a significância estatística tivesse sido considerada. Os leitores seriam em grande parte incapazes de reconhecer isso porque as informações necessárias para fazê-lo não estavam prontamente disponíveis. ”Eles concluem:“ Em nossa opinião, as práticas que observamos nos artigos publicados na BASP pós-proibição não ajudarão a resolver este problema [inferência adequada]; na verdade, acreditamos que eles vão piorar. ”Fricker et al. também relembram as recomendações da Força Tarefa sobre Inferência Estatística da American Psychological Association (1999), que incluiu Donald Rubin, Frederick Mosteller e John Tukey: “Alguns esperavam que esta força-tarefa votasse para recomendar uma proibição definitiva do uso de testes de significância em revistas de psicologia. Embora isso possa eliminar alguns abusos, o comitê achou que havia contra-exemplos suficientes ... para justificar a tolerância”. 

Onde a mudança para um mundo além de p < 0,05 nos leva? Será que “as estatísticas em ciência e política se tornarão mais significativas do que nunca”, como os autores do TAS propõem? Ou levará a mais confusão, estudos menos interpretáveis ​​e mais associações reivindicadas como importantes, mas talvez não mais do que se esperaria de ter calculado milhares de coeficientes de correlação de Pearson? Se outras revistas citam publicações revisadas por pares em periódicos da ASA como justificativa para revisar suas políticas editoriais para banir valores de p, o núcleo de nossa profissão será ameaçado, e podemos não ver “estatísticas em ciência e política se tornando mais significativas do que nunca".

É reconfortante que “a Nature não está tentando mudar a forma como considera a avaliação estatística dos artigos neste momento”, mas essa linha está enterrada em seu editorial de 20 de março, intitulado “É hora de falar sobre o descarte da significância estatística”. Qual sentença acima será mais memorável? Podemos esperar para ver se outros periódicos seguem o exemplo da BASP e depois responder. Mas então voltamos ao modo "reativo" versus "proativo" (veja a coluna de fevereiro), que, antes de tudo, é como chegamos aqui.

De fato, o ASA tem a responsabilidade profissional de garantir que a boa ciência seja conduzida - e a inferência estatística é uma parte essencial da boa ciência. Dada a confusão na comunidade científica (à qual o suplemento do TAS 2019 revisado por especialistas da ASA pode ter contribuído de forma não intencional), não podemos nos dar ao luxo de relaxar. Afinal de contas, foi isso que nos colocou no caminho do "abuso de p-valores". (Veja a coluna de abril.) 

Em um manuscrito não publicado que ele gentilmente compartilhou comigo enquanto eu preparava essa coluna, Stephen Stigler sugere “Uma nova solução para a 'crise' no teste de significância: Leia Fisher!” Citando o clássico de Fisher, Planejamento de experimentos:
Para afirmar que um fenômeno natural é experimentalmente demonstrável, precisamos, não de um registro isolado, mas de um método confiável de procedimento. Em relação ao teste de significância, podemos dizer que um fenômeno é experimentalmente demonstrável quando sabemos como conduzir um experimento que raramente falha em nos dar um resultado estatisticamente significativo”.
Stigler conclui: “É claro que Fisher não teria considerado um limite diferente, mesmo um tão pequeno quanto 0,005, como uma solução para um problema. Também está claro que Fisher era um fervoroso defensor da ciência reproduzível”. E isso - reprodutibilidade - é o real coração do problema. (Veja o relatório recentemente divulgado pela Academia Nacional de Ciências, Reprodutibilidade e Replicação na Ciência.) Como disse Benjamini: "Não é culpa do p-valor”. 

Tukey escreveu anos atrás sobre os métodos bayesianos: “É relativamente claro que descartar técnicas Bayesianas seria um erro real; tentar usá-los em todos os lugares, no entanto, seria, a meu juízo, um erro consideravelmente maior. ”No contexto atual, talvez ele tenha dito: “É relativamente claro que confiar ou dispensar resultados baseados em um único p-valor seria um verdadeiro erro; descartar inteiramente os p-valores, no entanto, seria, em minha opinião, um erro consideravelmente maior”.

Devemos assumir a responsabilidade pela situação em que nos encontramos hoje (e nas últimas décadas) para assegurar que nossa metodologia estatística bem pesquisada e teoricamente sólida não seja abusada nem descartada categoricamente. Congratulo-me com suas sugestões de como podemos comunicar a importância da inferência estatística e a interpretação adequada dos p-valores para nossos parceiros cientistas e editores de revistas científicas de forma que eles entendam, apreciem e possam usar com confiança e conforto - antes de mudar políticas e abandonar completamente as estatísticas. Por favor, me envie suas ideias!

* artigo publicado em 1 de junho no boletim da American Statistical Association (ASA) .

terça-feira, 11 de junho de 2019

Ainda sobre os cortes no Censo de 2020...

Fonte: IBGE

A discussão sobre os cortes no orçamento do Censo 2020, a ser realizado pelo IBGE continuam gerando discussão. Essa discussão foi amplificada por alguns acontecimentos recentes. O mais importante foi o pedido de exoneração de 5 gestores do IBGE de seus respectivos cargo de liderança, entre diretores e gerentes. Todos são funcionários de carreira do IBGE, permanecerão na instituição mas sem cargos de comando e se exoneraram em um curto intervalo de tempo durante a semana passada. Vale lembrar que intempéries no censo não são uma novidade na nossa história; por conta de restrições orçamentárias do governo, o censo de 1990 só ocorreu em 1991.

A principal queixa de todos esses dirigentes e de boa parte do corpo de funcionários da instituição é a falta de discussão com a presidência do IBGE a respeito das reformulações necessárias para atingir a redução do orçamento para a realização do Censo ano que vem. A nova presidente do IBGE assumiu o cargo em fevereiro deste ano e não fazia parte do quadro de funcionários da instituição. Apesar de relativamente jovem, ela ostenta em seu curriculo uma boa formação acadêmica e uma razoável experiência em manuseio de dados públicos. Baseado na sua avaliação, a redução no orçamento não apresenta prejuízo à realização do Censo.

Os censos nacionais são realizados tipicamente com um questionário curto para toda a população, de forma a garantir seu carater de Censo, acoplado a um questionário mais extenso para uma pequena parcela da população, atualmente em torno de 10% da população. Embora ainda não tenha ficado claro o tamanho do corte, a idéia da instituição parece ser a de reduzir o número de perguntas do questionário longo e assim precisar de menos entrevistadores. Alguns ex-presidentes já se manifestaram publicamente sobre o corte. Minha impressão é que a maioria deles se posicionou contra mas há exceções, que apontam para a otimização dos recursos através da complementação da informação com resultados de várias outras pesquisas que o IBGE realiza. Isso aponta apenas uma possibilidade dentre as várias que aventei em postagem recente.

Uma questão que me parece relevante é a quantidade de treinamento e testagem que são necessários para a realização desse tipo de modificação em procedimentos que já foram de uma certa forma introjetados na memória da instituição. Isso é uma pergunta para os técnicos do IBGE. Uma resposta detalhada pode ser vista aqui. Acredito que essa não seria a primeira modificação nos padrões adotados no Censo.

O que me parece mais relevante aqui para nós é alguma espécie de quantificação das perdas que estão em jogo. Muito pouco tem sido dito a esse respeito e a discussão parece estar concentrada em retórica expositiva, o que dificulta um pouco a sua correta avaliação pela sociedade. É claro que qualquer diminuição no orçamento implicará em perdas e eu acho que está claro que o país sofre uma crise fiscal de grandes proporções. Esses dois fatos estão a meu ver em direta oposição. 

A decisão sobre alocação de recursos é uma prerrogativa da sociedade ou de seus representantes. Mas ela ficaria muito facilitada se fosse contextualizada em termos quantitativos. As manifestações que vi parecem centrar na importância que o Censo tem para a sociedade a ser recenseada, o que não me parece estar sendo questionado por ninguém. Um exemplo preparado por um experiente estatístico do IBGE pode ser lida aqui ou vista aqui. Essas apresentações poderiam se beneficiar com mais estudos sobre que perdas ocorrerão com a diminuição de perguntas e/ou com a diminuição do tamanho da amostra. Mas a quantificação dessas perdas ainda carece de mais divulgação para a sociedade. 

Essa discussão ainda terá vários outros desdobramentos e o cotexto político em que ela se desenrola está longe de ser tranquilo. O valor numérico dos cortes é bastante eloquente e esperamos que se procure esclarecer o que se perde em cada opção, de forma quantitativa. Quem ganha é a sociedade

terça-feira, 4 de junho de 2019

Para onde caminha a Estatística?

https://www.statslife.org.uk/newsletter/2019/conference-bulletin-30-5-19.html

Apesar do título abrangente, esta postagem é motivada por (e uma reflexão sobre) um assunto bem específico. Todos anos a Sociedade de Estatística britânica (RSS) realiza seu encontro anual para troca de informação e divulgação de novidades. Um dos aspectos mais importantes de um encontro científico é a sua lista de conferencistas convidados. Essa lista revela o tom que a organização pretende dar ao evento. E a relevância dessa lista é aumentada pela proeminância da RSS no cenário internacional. Junto com a sociedade de Estatística americana (ASA), são indubitavelmente as duas associações nacionais mais importantes, como já falamos aqui.

[Vale destacar que a ASA também realiza encontros anuais com os mesmos objetivos da RSS. Entretanto, a quantidade de associados da RSS é muito menor que a da ASA, refletindo as respectivas quantidades de profissionais e pesquisadores de Estatística nos 2 países. Como consequência, o encontro anual da ASA também é muito maior que o encontro anual da RSS. Isso faz com que seja muito mais difícil analisar as tendências gerais de eventos da ASA. Daí a nossa preferência nesta postagem pela mensagem do encontro da RSS.]

A lista de conferencistas do encontro da RSS de 2019, que acontecerá no início de setembro em Belfast apresenta 8 nomes. Desses 8 nomes, apenas 2 conferencistas ostentam aquele perfil tradicional de pesquisadores produtivos de Estatística. Outros 2 conferencistas são estatísticos que estão envolvidos com atuação em órgãos governamentais britânicos. Mas o maior contingente de conferencistas é de profissionais dedicados à comunicação e divulgação de dados, com perfil de jornalistas.

Essa preocupação com a forma de lidar de forma adequada com a crescente massa de informação disponível nos dias de hoje e a profusão em larga escala das chamadas fake news. O site da instituição de afiliação de um dos conferencistas enfatiza exatamente este último ponto, quado diz "sorting fact from fiction" (separando fato de ficção, em português).

Outro ponto que me chamou a atenção foi o direcionamento do evento a estatísticos e cientistas de dados. Em tempos passados não havia esse foco por se tratar de um evento obviamente voltado para estatísticos. O surgimento de Ciência de Dados parece ter trazido a preocupação de contar com profissionais e pesquisadores dessa nova área.

É oportuno pontuar que essas novidades não estão restritas à organização e à divulgação do evento. Uma inspeção ao programa do congressos nos outros trabalhos que estarão sendo apresentados mostra uma correspondência da sociedade britânica com o que dele espera ou imagina a diretoria da RSS. Vários das sessões de comunicações estão voltadas para comunicação de resultados e para ciência de dados. Obviamente também estarão presentes sessões de comunicações sobre tópicos mais tradicionais, como estatística médica, estatística para meio ambiente, teoria estatística, estatísticas oficiais, estatística para a industria e finanças.

A página do evento pode ser vista aqui.

A programação completa pode ser vista aqui.

terça-feira, 28 de maio de 2019

Gráficos dinâmicos

Fonte: Wawamustats

Grupos que participo em redes sociais tem me enviado videos de toda natureza, como acredito que aconteça com a maioria de nós. Acontece que recentemente recebi videos que considerei tão interessantes que acho que merecem uma postagem. Na realidade, esses videos se auto-denominam gráficos dinâmicos, o que me parece um nome mais moderno e apropriado. 

O que esse gráficos dinâmicos exibem é tão somente a evolução de gráficos de barras ao longo do tempo. Mas a forma como isso é feita também é interessante. A cada instante de tempo, um certo número de barras é apresentada, sempre ordenadas do maior para o menor. Isso faz com que se possa observar as diferentes mudanças na ordenação a cada instante de tempo, com os cruzamentos das barras. Como cada barra tem sua própria cor, é possível acompanhar as constantes mudanças. 

Além desses gráficos de barra dinâmicos, existem outras configurações possíveis, como retângulos mas acredito que as barras são a melhor forma de fazer comparações. Elas podem ser melhoradas, com a inclusão do valor do índice sendo medido, a inclusão da bandeira do país sendo representado, etc.

Um grupo particularmente prolífico na geração desses gráficos dinâmico se denomina WawamuStats. Você pode visitar os gráficos gerados pelo grupo no YouTube, onde também é possível fazer doações e adquirir status especial na visualização. Alguns exemplos do WawamuStats incluem o gráfico acima onde se pode acompanhar a ascensão e quada dos países em termos de produção (e riqueza) ao longo dos anos. É particularmente interessante ver a recente proeminência da China a partir da virada do século.

Um grupo de jovens bioinformatas seguiu caminho similar ao criar o CSBL.com. Lá são disponibilizadas inúmeras fontes de informação de Biologia Computacional. Esse grupo contem vários latinoamericanos e brasileiros e trata de todo tipo de divulgação científica, a partir de artigos.  Eles divulgam também material didático e congressos na área. Eles também produzem gráficos dinâmicos como os da Wawamu. 

Achei muito interessante o gráfico dinâmico que eles prepararam do número de artigos científicos associados às diferentes doenças. Particularmente interessante é observar a ascenção meteórica dos artigos sobre AIDS que começam a aparecer a partir de 1985, chegando a atingir o topo da lista em 1990, quando o tema de infecção por HIV começa a aparecer e supera AIDS cerca de 5 anos após e a partir daí AIDS despenca e chega a sair do gráfico. 

Eles lembram um pouco o Google Trends, que tem o propósito similar de falar sobre relevância de temas a partir de alguma forma de aparição. No caso do exemplo do CSBL, a relevância de uma doença era representada pela incidência de artigos sobre ela. No caso do Google Trends, a relevância de um tema é uma medida da incidência de menções sobre ele. 

Mas a grande vantagem dos gráficos descritos nos parágrafos anteriores com respeito aos exibidos pelo Google Trends é o seu aspecto dinâmico. Isso é fundamental para capturar as tendências temporais que eles apresentam em comparação com eventos similares, sejam eles a riqueza de um país no 1o exemplo ou importância de uma doença no 2o exemplo.

Recomendo a visita a esses gráficos e seus respectivos sítios na internet.

terça-feira, 21 de maio de 2019

Prêmio Mahalanobis




https://en.wikipedia.org/wiki/Prasanta_Chandra_Mahalanobis

O prêmio Mahalanobis é um prêmio concedido pelo International Statistical Institute (ISI) a cada 2 anos para um estatístico de um país sub-desenvolvido que tenha trazido contribuições importantes para o avanço da Estatística. Para nossa alegria, acaba de ser anunciado que o premiado deste ano será o chileno Reinaldo Arellano-Valle. Antes de falar sobre meu colega Reinaldo, é oportuno falar um pouco sobre quem foi Mahalanobis.

Prasanta Chandra Mahalanobis é um estatístico indiano que ficou muito conhecido pela definição de uma distância entre distribuições, que ele propos em 1936. Essa medida é muito utilizada para classificação de dados multivariados. Apesar da quase centenária, essa medida ainda é muito usada e serve pelo menos como base para alocação de observações de múltiplas medições em grupos ou conglomerados. 

Mas para a Estatística indiana, tão importante quanto essa distância foi a influência política que Mahalanobis tinha. Graças à sua desenvoltura junto a políticos, ele conseguiu viabilizar a criação do Indian Statistical Institute (coincidentemente, com a mesma sigla ISI) no início dos anos 1930, junto com um promissor grupo de estatísticos indianos, interessados no avanço científico da área. Esse instituto desempenhou um papel fundamental para o avanço da Estatística na Índia. Ele forneceu o ambiente e os recursos necessários para que esse grupo desenvolvesse suas pesquisas e pudesse formar novas gerações de jovens estatísticos nos anos seguintes, colocando a Estatística em um patamar muito acima do usual no quadro das áreas da ciência.

Assim, Mahalanobis personificou em sua trajetória um misto de habilidades que constitui o máximo que se pode esperar de um pesquisador: excelência na sua produção científica e comprometimento na administração da ciência. Some-se a isso o fato dele ter desenvolvido essas atividades no cenário mais adverso de um país com escassos recursos. Assim, ele parece ser um nome apropriado para ser emprestado ao prêmio criado para homenagear estatísticos de países ainda em desenvolvimento.

O professor Reinaldo teve sua formação completada com o doutorado aqui no Brasil no final do século passado. Seu trabalho de tese foi em distribuições elíticas, onde ele cuidadosamente elencou propriedades e resultados teóricos. Sua pesquisa prosseguiu na mesma linha mas subiu de patamar. Ele foi progressivamente acumulando contribuições relevantes no estudo de distribuições elíticas e suas extensões para acomodar assimetrias. Além disso, ele foi agregando trabalhos de formação de alunos de pós-graduação e aumentando sua lista de colaboradores internacionais. 

Essa dedicação ao ensino e à pesquisa de mais de três décadas acabou sendo reconhecida e premiada pela ISI. A lista completa de premiados em edições anteriores pode ser vista aqui. Vale destacar que, apesar da difícil competição com outros centros do 3o mundo com mais tradição em Estatística, a America Latina vem despontando com destaque, tendo sido contemplada em 4 das 9 edições até agora.

O anúncio do ISI  para o Prêmio concedido pode ser vista aqui com apresentação da justificativa da escolha do premiado em função de sua extensa lista de contribuições para o avanço da Estatística. 

terça-feira, 14 de maio de 2019

Estão desmoralizando a teoria das probabilidades

https://oglobo.globo.com/esportes/lucas-moura-heroi-tottenham-vai-final-da-champions-com-virada-historica-sobre-ajax-23650939

A frase acima foi escrita no tom admitidamente informal do WhatsApp por um amigo estatístico que, assim como eu, aprecia o futebol. Ela foi escrita logo após o término das partidas semifinais da Liga dos Campeões da Europa. A frase não é desprovida de sentido, como explicaremos a seguir. Mas antes, é importante entender o contexto.

Senão vejamos: no 1o jogo da 1a semifinal, o Barcelona venceu o Liverpool por 3 x 0 jogando em Barcelona e no 1o jogo da 2a semifinal, o Ajax venceu do Tottenham por apenas 1 x 0 mas jogando no estádio do Tottenham. Para que os perdedores dos 1os jogos se classificassem, era preciso que o Liverpool ganhasse a 2a e decisiva partida por 4 x 0 e que o Tottenham vencesse a 2a e decisiva partida por 2 gols de diferença ou por 2 x 1, 3 x 2, ... no estádio do Ajax. Essas eram tarefas improváveis por motivos diferentes.

No caso do Liverpool, a maior improbabilidade se devia à alta diferença no placar contra um time poderoso, recheado de excelentes jogadores e acostumado a decisões dessa natureza. No caso do Tottenham, a maior improbabilidade era devida ao local do jogo. Times costumam ter melhor desempenho quando jogam em seus estádios. Se o Tottenham perdeu jogando em seu estádio, a lógica indicaria uma maior chance de perder quando jogasse no estádio do adversário.

Mas não foi isso que se viu. O Liverpool conseguiu seu improvável placar de 4 x 0 em seu estádio e o Tottenham conseguiu seu igualmente improvável placar de 3 x 2 jogando no estádio de seu adversário. No caso da disputa Ajax x Tottenham, a situação foi ainda mais dramática: o 2o jogo, foi para o intervalo com placar de Ajax 2 x 0 Tottenham, reforçando a crença explicitada no parágrafo anterior. Será que a teoria das probabilidades ou seus usuários foram desmoralizados?  

Quem ataca, leva

Antes da explicação, é importante uma contextualização. O futebol começou na virada do século passado e tinha uma formação quase amadora, visando essencialmente o objetivo principal do esporte: fazer gols. Assim placares elásticos, como 6 x 5 ou 8 x 2, eram muito comuns. Lá pelo meio do século passado, esse padrão foi mudando, com as equipes começando a privilegiar aspectos defensivos. Como consequência, os placares ficaram mais econômicos (1 x 0 , 2 x 1, ...). Nesse contexto, ter habilidade apenas deixou de ser decisivo. Afinal, um jogador habilidoso poderia se livrar de 1 ou 2 marcadores, o que era suficiente nos primórdios do esporte, mas fatalmente pararia num 3o ou 4o marcador, inexistentes no início do esporte. Os esquemas táticos de organização dos times passou a ter uma relevância inédita até então.

Esse padrão se manteve com raríssimas exceções ao longo do século passado. Mas neste século as coisas parecem ter começado a mudar. O padrão de bom atacante hoje deve ser aquele que alia sua habilidade a uma capacidade de encontrar soluções mesmo cercado de 3 ou 4 adversários. Assim, foram criados super-atletas treinados para resolver situações em cenários de jogo muito adversos. Esse jogadores são muito valiosos e tendem a se concentrar nos times de maior poder aquisitivo, como as equipes semifinalistas acima mencionadas.

Paralelamente a isso, placares elásticos começaram a aparecer com alguma frequência e em partidas importantes. Dois exemplos emblemáticos vem imediatamente à mente: a derrota do Brasil por 7 x 1 para a Alemanha em plena semifinal de Copa do Mundo em 2014 (já tratada aqui) e a vitória do Barcelona sobre o Paris Saint Germain por 6 x 1 nas oitavas de final da edição de 2017 da mesma Liga dos Campeões.    

Acho que os pontos descritos nos dois parágrafos acima estão correlacionados. Equipes mais abonadas tem jogadores mais preparados para fazer performances excepcionais. Eles vem sendo treinados para isso. E quando chegam os momentos decisivos, eles estão prontos para atuar.

E agora vem o argumento que para mim foi decisivo em ambos os confrontos e que persiste dos primórdios do futebol até os dias de hoje: quem ataca, leva! Isso quer dizer que a vontade de vencer é um componente fundamental para conseguir superar desafios importantes. Isso vale não só para o futebol mas para vários outros esportes e também para vários outros aspectos da nossa vida.

Foi isso que Liverpool e Tottenham fizeram. Apesar de inferiorizados tecnicamente com relação a seus respectivos adversários, eles não se intimidaram com os cenários adversos que estavam enfrentando e foram "para cima" dos adversários, como se diz no jargão do futebol. Claro que isso não se aplica a qualquer time em qualquer confronto. Se você partir para o ataque sem fazê-lo de forma estruturada e sustentada, fatalmente receberá contra-ataques perigosos e se arriscará a levar um gol, pondo tudo a perder. 

E isso quase aconteceu com o Tottenham. Precisando partir para o ataque em busca dos 3 gols que lhe faltavam (o jogo foi para o intervalo com placar Ajax 2 x 0 Tottenham) tendo apenas os 45 minutos de um tempo de futebol, chegou a receber uma bola na trave aos 46 minutos do 2o tempo mas encontrou seu 3o e decisivo gol no último minuto da prorrogação de 5 minutos dados pelo juiz.

Como foi que times inferiores ou inferiorizados partiram para o ataque contra times superiores? E como lograram êxito? A resposta à 1a pergunta está contida na própria pergunta. Os times que estavam em vantagem procuraram garantir a vantagem que possuíam e evitar correr riscos. Com isso, quase que instintivamente adotaram uma postura mais defensiva, atraíndo seus adversários em direção à sua meta. Isso responde à 2a pergunta. Quem ataca tem mais chance de fazer gol que quem defende. E os gols decisivos de ambos os confrontos foram conseguidos já no final da partida. Assim, esses times não precisaram defender a vantagem recém-conquistada por muito tempo.   

[A disputa de uma das vaga no judo para as Olimpíadas de 2004 no judô entre Flavio Canto e Thiago Camilo ilustra esse ponto. Aproximava-se do final da 3a e decisiva luta entre eles. Flavio tinha vantagem na pontuação e conservadoramente se resguardava para não ser atacado. Faltando 9 segundos para o fim da luta, ele recebeu punição por falta de combatividade e a vantagem passou para Thiago. Nesse momento, Flavio partiu para o ataque por ser a única opção que lhe restou e Thiago passou a se agarrar à vantagem que acabara de obter. Faltando míseros 3 segundos, sofreu punição por falta de combatividade e acabou sendo eliminado. Na entrevista do Flavio após a luta, ele disse que se estivesse no lugar do Thiago teria feito o mesmo, correndo o risco de ser eliminado. O timing para essas ações fortuitas é fundamental e o acaso desempenha um papel preponderante nesses casos.] 

Como saber quando esse fenômeno acontecerá de novo? Essa é a pergunta sobre a qual os especialistas em avaliação de partidas de futebol precisarão se debruçar a partir de agora. Não dá mais para usar apenas a lógica da improbabilidade do resultado para alicerçar avaliações de probabilidade de partidas de futebol. Especialmente se envolverem jogos importantes, onde existe tanto em jogo, e com equipes qualificadas com altíssimo poder de fogo, como foram os casos recentes aqui tratados. Nesses cenários extremos, tudo pode acontecer e isso precisará ser levado mais em conta daqui para a frente.