terça-feira, 25 de janeiro de 2022

Dê ao público as ferramentas para acreditar nos cientistas

Fonte: Anita Makri

Ainda em função da discussão feita na postagem da semana passada, reproduzo abaixo o texto publicado há 5 anos no dia 19/01/2017 na prestigiosa revista Nature, uma das mais importantes na Ciência. Vou reproduzi-lo fielmente em portugues sem que eu necessariamente concorde com o seu conteudo mas como objeto de reflexão para todos preocupados com a melhor comunicação possivel da Ciência para com seu publico-alvo: a sociedade e como evidência do crescente papel da incerteza no cenário científico atual. 

Então, vamos ao texto Dê ao público as ferramentas para acreditar nos cientistas

por Anita Makri

O que é verdade? Como a encontramos e ela ainda tem peso no debate público? Dados os recentes acontecimentos políticos, estas são questões importantes e urgentes. Mas das duas áreas em que trabalho que se preocupam com a verdade – ciência e jornalismo – apenas a última se engajou seriamente e buscou respostas. Os cientistas precisam recuperar o atraso, ou correm o risco de uma maior marginalização em uma sociedade que está cada vez mais pesando as evidências e tomando decisões sem elas.

Enquanto os jornalistas debatem fatos e falsidades, seu próprio papel e possíveis formas de reagir, os cientistas parecem se ver como vítimas do, e não como atores ativos no, novo cenário político. A maioria dos debates se concentra em como a nova ordem política ameaça o conhecimento científico e o financiamento da pesquisa, ou minimiza a política de mudanças climáticas.

Todos são importantes, mas o que muitos ignoram é como a ciência está perdendo sua relevância como fonte de verdade. Para recuperar essa relevância, cientistas, comunicadores, instituições e financiadores devem trabalhar para mudar a forma como a ciência socialmente relevante é apresentada ao público. Não se trata de um melhor treinamento de mídia para pesquisadores. Exige um repensar sobre o tipo de ciência que queremos comunicar à sociedade mais ampla. Esta mensagem pode soar familiar, mas o novo foco na pós-verdade mostra que agora existe um perigo tangível que deve ser abordado.

Grande parte da ciência que o público conhece e admira transmite uma sensação de admiração e diversão sobre o mundo, ou responde a grandes questões existenciais. Está na popularização da física através dos programas de televisão do físico Brian Cox e em artigos sobre novos fósseis e comportamento animal peculiar nos sites dos jornais. É uma ciência vendável e familiar: enraizada em testes de hipóteses, experimentos e descobertas.

Embora essa ciência tenha seu lugar, ela deixa o público (para não falar dos formuladores de políticas) com uma visão diferente e ultrapassada daquela dos cientistas sobre o que constitui ciência. As pessoas esperam que a ciência ofereça conclusões qualificadas que correspondam ao modelo determinístico. Quando há informações incompletas, conhecimentos imperfeitos ou conselhos mutáveis ​​– tudo parte integrante da ciência – sua autoridade parece estar minada. Vemos isso no debate público sobre alimentação e saúde: primeiro, a gordura era ruim e agora é o açúcar. Uma conclusão popular dessa mudança de base científica é que os especialistas não sabem do que estão falando.

Mas as questões que as pessoas enfrentam em suas vidas geralmente dependem da ciência incremental, do tipo que acumula evidências sobre sistemas complexos com inúmeras variáveis ​​e parâmetros sociais difusos. Ela alimenta políticas e decisões sobre como lidar com a poluição ambiental, segurança de vacinas, infecções emergentes, riscos de drogas, escolhas alimentares ou os impactos das mudanças climáticas.

“Os cientistas devem trabalhar para mudar a forma como a ciência socialmente relevante é apresentada ao público. ”

Esse tipo de ciência socialmente relevante e discussão da incerteza aparece na mídia, mas é mais típico de artigos que discutem a política e as controvérsias em torno dela, talvez sob o rótulo de meio ambiente ou saúde. Não se trata de manipular ou persuadir o público a aceitar decisões, mas sim fornecer-lhes as ferramentas com as quais entender as evidências, colocar as incertezas em perspectiva e julgar por si mesmos qual a contribuição da informação científica para a verdade. Sem essa capacidade, emoções e crenças que cedem a falsas certezas tornam-se mais críveis.

É mais difícil falar sobre ciência que é inconclusiva, ambivalente, incremental e até política – requer uma mudança de pensamento e traz riscos. Se não for comunicada com cuidado, a ideia de que os cientistas às vezes 'não sabem' pode abrir a porta para aqueles que querem contestar as evidências.

Ainda assim, se o público estiver mais bem equipado para navegar nessa ciência, isso restauraria a confiança e melhoraria a compreensão de diferentes vereditos e talvez ajudaria as pessoas a ver algumas das notícias falsas que circulam sobre assuntos científicos. Levantar a tampa dessas realidades sobre a ciência socialmente relevante é principalmente mudar o conteúdo e o enquadramento do que está sendo comunicado. E poderia ser incentivado visando vários pontos de contato entre a ciência e o público. Programas de engajamento público de instituições de pesquisa, educacionais ou culturais são uma opção óbvia. Ligações mais estreitas entre educadores, comunicadores e cientistas também podem fortalecer a forma como a ciência socialmente relevante é representada em artigos e currículos. Tendências mais amplas não estão incentivando esse tipo de história científica. Portanto, o impulso precisará vir primeiro da ciência. Por exemplo, as academias de ciências poderiam oferecer mais bolsas para apoiar um jornalismo mais sofisticado.

Os cientistas podem influenciar o que está sendo apresentado articulando como esse tipo de ciência funciona quando conversam com jornalistas ou quando aconselham sobre projetos políticos e de comunicação. É difícil de fazer, porque desafia a posição da ciência como um guia singular para a tomada de decisões e porque envolve admitir não ter todas as respostas o tempo todo, mantendo um senso de autoridade. Mas feita com cuidado, a transparência ajudará mais do que prejudicará. Ajudará a restaurar a confiança e esclarecerá o papel da ciência como guia.

Os debates atuais sobre a verdade estão longe de ser triviais. Mais cientistas e comunicadores da ciência precisam se envolver, atualizar práticas e se reposicionar de uma forma que acompanhe os tempos e mostre que a ciência importa – enquanto ainda importa.

Referência completa: Makri, A. (2022). Give the public the tools to trust scientists. Nature 541, 261 (2017). https://doi.org/10.1038/541261a


terça-feira, 18 de janeiro de 2022

Não olhe para cima

https://www.netflix.com/br/title/81252357

A postagem desta semana é sobre o filme que foi a sensação do período de festas de fim de ano, ao menos aqui no Brasil entre meus círculos de contato. O filme Não Olhe para Cima (Don't Look Up, na versão original) trata de uma série de questões bastante gerais como ética, destino da humanidade e relacionamento humano. Mas o aspecto que gostaria de focar aqui é o próprio objetivo deste blog: popularização da Ciência.

Sem estragar (o atual dar spoiler sobre) o fim do filme para quem não o viu, basta para nossa postagem falar sobre a parte inicial do filme. Ele começa com uma aluna de doutorado da Universidade de Michigan fazendo uma descoberta. Após confirmar seus cálculos com seu orientador, eles se asseguram que a descoberta é sobre a iminente colisão de um cometa com a face da Terra. E as especificidades do problema indicavam que essa colisão significaria o fim da humanidade. 

A partir dai, o filme segue o roteiro esperado de comunicar esse resultado catastrófico para o resto da sociedade (americana, no caso). Os pesquisadores conseguem acessar rapidamente um diretor da NASA, que logo entende os achados dos pesquisadores e esse grupo de 3 pesquisadores passam a procurar formas de comunicar à sociedade e às autoridades sobre a gravidade dos seus descobertas. Essa é a parte que nos interessa.

Eles são convidados a encontrar com a presidente dos Estados Unidos e seu estafe para apresentar seus resultados. Antes disso, são obrigados a tomar um chá de cadeira de mais de 24hs na ante-sala do famoso Salão Oval (escritório da presidência americana dentro da Casa Branca) porque a presidente estava envolvida com "assuntos mais importantes que o fim da humanidade". Ao entrar, eles encontram uma certa dificuldade para explicar os seus achados pois os pesquisadores resolvem embasar sua apresentação oral dos fatos a partir dos modelos matemáticos que os sustentam. A presidente e seu staff desvalorizam a argumentação basicamente por não a entenderem. E esse ponto é importante: a apresentação da teoria que sustenta a sua mensagem serviu apenas para afastar os ouvintes e diminuir a importância do achado para eles. Levou muito tempo para que eles pudessem consertar o estrago e conseguissem passar a mensagem do caos iminente. Mesmo assim, a mensagem não chegou aos interlocutores com a devida importância.

Outra passagem importante do filme se dá quando eles os pesquisadores conseguem ser incluidos em um programa de variedades que trata com igual leveza temas sérios ou banais. Essa leveza a frente de um problema tão grave tirou a paciência dos pesquisadores e levou-os, especialmente a doutoranda, a perder a compostura e se descontrolar perante as câmeras. Assim, o esforço de comunicação de resultados para a sociedade acabou sendo novamente desperdiçado pela incapacidade dos pesquisadores de vencer a barreira de comunicação com os apresentadores do programa. 

É bem verdade que a tarefa deles se deu em condições adversas. Eles não estavam em congresso científico, onde a argumentação lógica adotada na Ciência é a linguagem comum. Muito pelo contrário! No episódio do Salão Oval, a interlocução era com políticos. Em um momento da conversa, a presidente chega a perguntar 

- Ok, ouvi vocês. Quanto isso vai me custar. O que vocês vieram pedir? 

Ou seja, a compreensão do público de políticos foi toda contaminada pela barganha com a qual eles estão acostumados.  Algo similar acontece no programa de variedades quando, após ouvir sobre a tragédia que estava sendo anunciada, o âncora do programa retruca que eles agem assim porque até noticias ruins são trazidas de forma suave, por conta do tom do programa. 

É claro que tudo no filme é uma sátira e promove uma gigante amplificação da dificuldade de compreensão das pessoas sobre o que a Ciência informa. Na minha psssagem preferida, depois de todos esses dissabores o diretor da NASA se despede do pesquisador, quando ele estava embarcando no trem de volta para casa, dizendo em tom de orientação: 

- Você está só contando uma história. Mantenha-a simples. Sem Matemática. 

Ao que o pesquisador responde em total desolação:

- Mas é tudo Matemática!

Todas as citações acima foram recuperadas a partir de postagens que elencam algumas das melhores falas do filme. Recomendo que visitem essas e outras postagens pois existem outras falas interessantes mas cujas análises não cabiam aqui no espaço desta postagem. Em uma dessas falas, a presidente reclama de ser apresentada a ela uma probabilidade de 100%, ao que os pesquisadores retrucam com o valor mais preciso de 99,78% 

Esses diálogos me lembram de uma entrevista que dei para um meio de comunicação sobre a Teoria de Resposta ao Item, usada para gerar as notas do ENEM, alguns bons anos atrás. A forma como essa nota é calculada se baseia na proficiência estimada do aluno. Essa conta é altamente não-linear, que depende inclusive do padrão de resposta de cada particular aluno. Esse assunto já foi objeto de algumas postagens aqui no StatPop. Mas como explicar isso para um jornalista? 

Eu fiz o meu melhor para explicar isso ao jornalista com o mínimo de Matemática, embora tudo fosse, de fato, apenas Matemática. Ai, ele me perguntou se a nota era uma ponderação dos acertos de cada questão. Obviamente, isso levaria quem assessasse essa entrevista a achar que a nota era dada por uma média ponderada das notas dos ítens, sendo cada um deles com seu respectivo peso. Eu queria evitar essa mensagem por estar errada. Depois de tentar explicar a mesma conta feita pela TRI de umas 3 ou 4 maneiras diferentes e o jornalista insistir na ponderação, eu confesso que capitulei. Terminei por concordar com ele que se tratava de uma ponderação....

Enfim, o filme suscita vividamente o debate das formas de comunicação da Ciência com a sociedade e nos faz refletir, entre inúmeros outros assuntos, de como isso poderia ser aprimorado. Recomendo!  


terça-feira, 11 de janeiro de 2022

Os números por trás da vacinação infantil contra a COVID19

 

Fonte: Andrew Medichini/AP

A postagem desta semana volta ao tema da vacinação contra a COVID19. Até o momento, o Brasil adquiriu uma taxa de cobertura vacinal igual ou até mesmo superior à de alguns paises desenvolvidos. Isso só foi possivel graças à enorme capilaridade do sistema de vacinação implantado no país. Entretanto, essa taxa ainda se mostrou insuficiente para atingir a chamada imunidade de rebanho e conter o avanço da pandemia, especialmente com o surgimento de novas variantes como a Ômicron. 

Países ao redor do mundo se depararam com essa situação e tomaram o aumento da cobertura para outras parcelas da população como estratégia de mitigação dos efeitos adversos. Paralelamente, começaram a haver experimentos científicos ao redor do mundo para verificar a viabilidade da utilização da imunização para crianças entre 5 e 11 anos. Esses estudos mostraram que a estratégia era benéfica e iniciaram suas campanhas de vacinação em massa para crianças nessa faixa etária. O renomado Center for Disease Control (CDC) dos Estados Unidos foi bastante enfático ao recomendar sem hesitação que todos indivíduos acima de 5 anos sejam vacinados. A foto acima foi tomada na campanha realizada na Itália.

Obviamente, todos os cuidados foram tomados especialmente no que diz respeito aos possíveis aspectos adversos da vacina, os chamados efeitos colaterais. Foi detectado que a vacina da Pfizer se servia bem a esses propósitos (com dosagem inferior à adotada para adultos). No caso específico de miocardite, um dos principais efeitos colaterais da vacina, foi verificado que entre os mais de 7 milhões de vacinas aplicadas a crianças, apenas 8 relataram a presença de miocardite, todas com sintomas moderados e nenhuma delas indo a óbito. Essa conta leva a uma taxa de cerca de 1 caso (não letal) a cada 1 milhão de crianças. 

Esse número pode ser comparado com a mortalidade de crianças com 5 a 11 anos aqui no Brasil. De acordo com nota técnica do CONASS (Conselho Nacional de Secretarias de Saude), já houve 301 mortes por COVID19 para essa faixa etária. O número parece baixo e até vem sendo usado para justificar a não adoção da imunização para essa faixa etária. Obviamente, esse número é enorme para as 301 famílias enlutadas.

Entretanto, temos cerca de 20,5 milhões de brasileiros nessa faixa etária. Ao fazer as contas, verificamos que a taxa de mortalidade é de 14,6 mortes para cada 1 milhão de crianças. Essa taxa é muito superior à taxa de ocorrência dos efeitos colaterais mais preocupantes com a vacina

Assim a escolha é adotar uma medida que tem risco de adoecimento (e não morte!) de 1 a cada 1 milhão ou manter o estado atual de 14,6 mortes a cada 1 milhão? A resposta me parece óbvia.

Então, porque está havendo reação adversa ao uso imediato da vacina no Brasil para crianças entre 5-11 anos? Não sei explicitar os motivos mas o que vejo em alguns sites é um uso deliberado de informação de maneira parcial, a ponto de negar o que o próprio detentor da informação preconiza (ao ponto de dizerem que essa vacina não é uma vacina). Além disso, os que se posicionam contra a adoção da vacina entendem que seria preciso esperar vários anos para que pudesse ser estabelecida a relevância da adoção dessa vacina.

O próprio caso da vacinação mundial de adultos é a maior evidência contra esse argumento. A drástica redução nos casos e, principalmente, nas mortes experimentadas ao redor do mundo após a introdução da imunização deveriam ser prova mais do que eloquente do acerto dessas medidas. Num entendimento mais geral, a Ciência não se baseia em achados eventuais. Ela define critérios claros necessários para certificação de uma prática em qualquer que seja a área do saber. No caso específico da Medicina, a humanidade já acumulou séculos de experiência para lidar com as avaliações de risco inerentes a qualquer prática de intervenção em seres humanos. Já existe um robusto arsenal de ferramentas que indicam os melhores caminhos a serem adotados. [Os poucos números que apresentei acima são apenas um exemplo, para o caso de COVID19 em crianças.]

É claro que se quisessemos poderiamos colocar uma lupa apenas nos aspectos negativos de uma medida que não nos agrade e ignorar os aspectos positivos. Essa é uma opção de vida. No meu caso, prefiro acreditar na Ciência e na sua capacidade de acumular coerentemente conhecimento. Só isso irá permitir uma ponderada avaliação dos riscos associados a cada medida e de adotar sempre aquela de menor risco. É isso que o CDC dos Estados Unidos, a ANVISA do Brasil e outros órgãos reguladores da saude em todo o mundo vem fazendo.


terça-feira, 4 de janeiro de 2022

Projeto CovidLP 2021

Fonte: www.routledge.com/Building-a-Platform-for-Data-Driven-Pandemic-Prediction-From-Data-Modelling/Gamerman-Prates-Paiva-Mayrink/p/book/9780367709976

Antes de escrever qualquer frase, gostaria de desejar um Feliz ano de 2022 para todos os apoiadores/leitores do StatPop. 

Estou há mais de 1 ano sem postar e 2 anos sem retornar ao regime usual do StatPop de postagens semanais. O primeiro pedido que devo fazer é o de desculpas àqueles que se acostumaram a ler essas postagens das 3as feiras. Como todos estão cientes, a humanidade sofreu mudanças drásticas devido à pandemia de COVID-19. Várias pessoas tiveram modificações profundas nos seus hábitos tanto pessoais quanto profissionais e o StatPop não ficou imune.

Por motivos profissionais, me envolvi em inúmeros projetos interessantes e com forte impacto para a sociedade, em consonância com o compromisso deste blog. Mas o fato é que eles acabaram desviando o foco do StatPop. Um desses projetos é um outro blog de popularização da Estatística, desenvolvido pelo International Statistical Institute. Fui convidado para ser contribuinte com textos eventuais, como já havia informado aqui, sendo o ultimo publicado em fevereiro de 2021. Outro projeto fascinante é o de utilização de metodologia estatística que recentemente desenvolvemos para entender aspectos da história de ocupação da Amazônia pelo homem, desde antes da sua "colonização". Pretendo tratar desses assuntos interessantes em postagens futuras.

Mas o maior responsável pelo afastamento do StatPop foi sem dúvida o Projeto CovidLP.  Esse projeto já superou e muito as expectativas originais, quando da sua criação e segue crescendo. Ele contou em 2020 com uma extraordinária equipe de colaboradores voluntários, basicamente alunos de pós-graduação da UFMG. Em 2021, a equipe diversificou para incluir também alunos de outras instituições (UFRJ) e alunos de graduação.

Até agora, o projeto já gerou um site com informações sobre ele, um aplicativo contendo as previsões de casos e óbitos, o software PandemicLP contendo os códigos necessários para usuários reproduzirem nossas análises em seus conjuntos de dados e, mais recentemente, o livro Building a Platform for Data-Driven Pandemic Prediction: From Data Modelling to Visualisation - The CovidLP Project, publicado pela Chapman & Hall. A capa do livro é a imagem do início desta postagem

Com 382 páginas e 105 figuras ou diagramas, o livro foi publicado em setembro do ano passado, com um sumário de toda a informação gerada no projeto tanto em termos de metodologia estatística quanto em termos que avanço computacional com vistas à disponibilização de dados e de previsões. Todo esse trabalho foi realizado sobre a base gerada pela equipe de 2020, que permaneceu até início de 2021.

O projeto trabalha com uma equipe renovada de voluntários desde maio de 2021. Desde então, parte do tempo foi consumida para treinar a nova equipe para entender em que situação se encontrava o projeto e o que já havia sido atingido. Só assim foi possível habilita-los a encarar os desafios do projeto. Essa equipe também teve um desempenho exemplar e ao final do ano já podiam ser vislumbradas algumas novas funcionalidades. O projeto deverá em breve incorpora-las em breve após realizar testagem mais abrangente sobre elas. 

As mais importantes novidades serão o uso de distribuições amostrais mais flexíveis para os dados, com uma mais apropriada atribuição de incerteza nas previsões, e a recuperação da história do projeto, com a disponibilização da sequencia de previsões que o projeto gerou para cada pais/estado em um formato dinâmico. Além disso, haverá aumento de funcionalidades e do número de opções do PandemicLP. O StatPop irá repercutir esses novos avanços à medida que eles sejam alcançados.

Mais geralmente, pretendemos voltar a manter este blog ativo, com alguma periodicidade. Retomar a periodicidade semanal seria o ideal mas isso talvez seja pedir muito agora. Uma das leis da natureza é que os filhos eventualmente saem de casa/ninho e dependem progressivamente menos da tutela paterna para progredir de forma mais autonoma e viverem suas vidas. 

Isso vale também para os projetos, como o CovidLP, que funcionam como "filhos", oriundos da profissão de cada um. Esse projeto já adquiriu maturidade e o estágio atual do CovidLP já permite aos seus membros maior autonomia. Com isso, facilita ao direcionamento de parte da nossa atenção para outros projetos de disseminação da ciência que nos são igualmente caros, como o StatPop. Essa é intenção para 2022.

 

terça-feira, 8 de dezembro de 2020

Breve relato sobre a Cerimônia para o Prof Adrian Smith

A postagem da ultima semana informou sobre a Cerimônia de outorga do Título de Doutor Honoris Causa da UFRJ ao Professor Sir Adrian Smith. Essa cerimônia aconteceu na última sexta feira, 04 de dezembro de 2020, como anunciado. Ela foi inserida dentro do Colóquio comemorativo dos 50 anos do Programa de Pós-Graduação em Cardiologia da UFRJ, onde Adrian foi um dos conferencistas convidados, junto com Professor Sir David Cox.

Em assim sendo, a cerimônia de outorga fugiu um pouco do seu padrão usual com togas vestidas pelos membros da mesa e pelo homenageado e por longos discursos proferidos pelas autoridades. Afinal, a cerimônia e a palestra do homenageado deveriam respeitar o tempo de 1 hora dado aos palestrantes e ter seu início (ao menos perto de) a hora prevista. Felizmente, essa parte funcionou bem e a cerimônia começou com poucos minutos de atraso e terminou antes do seu horário limite estipulado.

A cerimônia foi apresentada pelo Prof. Mauro Paes Leme, Diretor do Instituto do Coração (ICES) da UFRJ e foi presidida pela Reitora da UFRJ, profa. Denise Pires de Carvalho. A Reitora iniciou os trabalhos após receber a palavra do Prof. Mauro e foi apresentando os participantes, que incluíam o Diretor do Instituto de Matemática (IM), representado pelo seu vice-Diretor Prof. Glauco Valle, o Prof. Mauro representado o ICES e o Diretor da Faculdade de Medicina (FM). Essas unidades foram destacadas por terem sido a formuladora do pedido inicial de concessão do título (no caso do IM)  ou apoiadoras do pedido (no caso da FM e do ICES).

A seguir foi passada a palavra para que eu e o Prof. Basilio apresentassemos o agraciado da cerimônia para o público presente. Essa variação com relação à norma vigente nesse tipo de outorga é justificável. A idéia da concessão do título partiu do prof. Basílio e foi preparada por mim em conjunto com ele. Mas foi inicialmente apresentada ao IM, por ser a unidade da UFRJ onde está localizada a área de Estatística.

Em minha fala procurei destacar as conquistas realizadas pelo professor Adrian Smith e optei por fazê-lo em 2 blocos. No 1o bloco, foram destacadas suas contribuições científicas no sentido de tornar a inferência Bayesiana viável do ponto de vista prático, culminando com seu esforço científico para tornar o MCMC uma ferramental de alta aplicabilidade. No 2o bloco, foram destacadas suas várias posições de destaque com ênfase para a Reitoria do Queen Mary College e da Universidade de Londres, sua função como funcionário responsável pela alocação de toda a verba governamental para Ciência e Tecnologia no Reino Unido, seu cargo atual no inovador Instituto Alan Turing, terminando com seu cargo assumido na semana passada de presidente da prestigiosa Royal Society. Essa fala foi pontuada por alguns detalhes pessoais do meu contato com o homenageado. Confesso ter sido tomado pela emoção do momento e acredito que isso não influenciou positivamente a fluência com que desfilei meus argumentos. 



A seguir, a apresentação do homenageado foi prosseguida pelo 2o apresentador, em uma pequena quebra de protocolo, pois em geral há apenas 1 apresentador. O prof. Basilio também destacou aspectos da carreira do Prof. Smith mas focou mais em questões pessoais sobre como o conheceu na década de 70, do convite que fez para ele visitar a UFRJ na década de 80 e alguns dos outros contatos de Adrian com o Brasil. Essa apresentação foi tratada com esmero, como pode ser visto não só pela preparação prévia do texto (algo que eu deveria também ter feito) mas principalmente pelas suas medalhas acadêmicas, merecidas e orgulhosamente ostentadas por ele.  




Após seu discurso, a palavra voltou para a Reitora que fez um belo discurso. Apesar de ser de outra área, médica por formação e biofísica como pesquisadora, ela demonstrou bastante conhecimento do mundo da Ciência e das possibilidades que as suas novidades poderão propiciar para a área da Saude, chegando a mencionar sua esperança nas contribuições de Inteligência Artificial. Ela também leu um trecho de artigo na Science publicado há um século durante a pandemia de gripe espanhola e chamou nossa atenção para a similaridade com a situação atual da humanidade. 


Após o término da sua fala, o professor Adrian que até então não havia se manifestado expressou rapidamente sua gratidão, capturada no momento que a imagem abaixo foi obtida, e esboçou um gesto de agradecimento. Não ficou claro o que o protocolo previa mas a palavra retornou para o mestre de cerimônia que passou a palavra para o Sir Adrian e teve início a apresentação que o Adrian tinha gravado antecipadamente com divulgação do trabalho que está sendo realizado no instituto que ele dirige. 


Fiquei sentindo falta de um pronunciamento do agraciado mas após a exibição do video ele já não estava mais presente na sala. De todo modo, acho que foi uma cerimônia importante para a UFRJ e para toda a Ciência, incluindo ai a Estatística, brasileira.

O link para a programação completa do workshop da Cardiologia está aqui.  

A cerimônia de outorga do título inicia em torno de 3 horas e 9 minutos e se encerra em torno de 2 horas e 50 minutos. Para os apreciadores da Estatística, a 1a hora contem uma palestra de Professor Sir David Cox e a 2a hora contem uma palestra do professor Fabio Cozman da USP. 

terça-feira, 1 de dezembro de 2020

Outorga de título mais que merecido a Sir Adrian Smith

https://www.poscardio50anos.com.br/


Estamos entrando no ultimo mês desse estranho e inesquecível ano de 2020. Sei que o StatPop está em dívida por ausência de postagens desde meados de setembro. Os motivos já haviam sido antecipados nesta última postagem mas não são o objeto desta postagem. Esta postagem traz uma boa notícia para toda a comunidade estatística brasileira.

Nesta sexta feira 04 de dezembro as 11 horas será realizada a cerimônia de outorga do título de Doutor Honoris Causa da UFRJ ao Professor Sir Adrian Smith. A cerimônia será realizada em formato virtual por motivos óbvios e o endereço eletrônico será disponibilizado abaixo. Essa cerimônia pode ser entendida como o ponto alto de uma carreira profissional, pois envolve o reconhecimento máximo por uma universidade onde o agraciado com o título não trabalhou. Ela costuma ser cercada de muita pompa e circunstância com togas ornamentadas, medalhas, diplomas e discursos. Infelizmente, nada disso poderá acontecer neste formato virtual. Obviamente os discursos acontecerão mas de forma mais compactada e em número muito mais reduzido pelo próprio formato virtual, que será inaugurado na UFRJ com esta outorga.

O momento é particularmente oportuno pois Adrian acaba de assumir ontem um dos postos mais importantes de sua carreira, conforme já haviamos anunciado aqui na 1a metade deste ano. É bem possível que esta cerimônia seja seu primeiro evento internacional no cargo de presidente da Royal Society, a associação de pesquisadores mais importantes e renomado do Reino Unido. Como se trata de um dos países mais influentes na ciência, essa sociedade contem uma quantidade impressionante de saber acumulado entre seus membros. 

A carreira de Adrian é um sem fim de realizações, horarias e cargos importantes no âmbito da ciência e tecnologia no Reino Unido. Acredito que isso ficará evidente para quem puder participar do evento. O evento terá cerca de 1 hora de duração. Boa parte desse tempo será dedicado a uma palestra do professor Adrian Smith. Essa palestra versará sobre os desafios com os quais ele se delicia no seu cargo atual de Diretor do Alan Turing Institute, uma instituição pioneira na busca de soluções multidisciplinares para grandes problemas da sociedade envolvendo análise e tratamento de dados. 

Como um dos proponentes do pedido de concessão do título terei alguns poucos minutos de fala para procurar resumir a excelência de uma carreira cheia de realizações e da importância dessa vinculação à universidade brasileira, em especial à UFRJ. A cerimônia será presidida pela profa. Denise Pires de Carvalho, Reitora da UFRJ.

Convidamos a todos para esse momento único na história da Estatística brasileira. 

Link para a cerimônia é https://us02web.zoom.us/webinar/register/WN_sUYeL9PrTSqzCbs82EZ7jw


   

 


terça-feira, 15 de setembro de 2020

Mais uma adição ao Projeto CovidLP

www.est.ufmg.br/covidlp

Como todos aqui tem acompanhado, minha assiduidade ao projeto StatPop tem deixado a desejar nos últimos meses. O principal responsável por essa ausência tem sido um outro projeto: o CovidLP. O que começou com um exercício para alunos de uma disciplina suspensa pela pandemia alcançou uma abrangência que não tinha nem de longe sido antecipada pelos seus participantes. 

O projeto agregou participantes externos a essa disciplina e com isso ganhou outras funcionalidades: um app online, um site, um blog e mais recentemente o pacote PandemicLP. Esse pacote, escrito em R, dá liberdade aos usuários mais avançados, interessados em estender as análises do app para outras unidades, como municípios ou microrregiões. Ele surgiu como demanda de alguns usuários do app.

Também como demanda externa, surgiu agora um novo membro para a família CovidLP. O interesse em deixar os desenvolvimentos científicos do projeto documentados sempre fez parte das demandas de muitos usuários. Só não estava claro para a nossa equipe a melhor forma de materializar isso. 

Um aviso recente postado por uma editora, solicitando contribuições no combate à pandemia, indicou um possível caminho. Após troca de alguns emails com a editora, ficou claro para nossa equipe que o formato mais adequado para essa veiculação do nosso projeto deveria ser através de um livro, contando todos os percalços e também os nossos achados sempre do ponto de vista científico. E isso foi feito. 

Elaboramos uma proposta de livro, calcada sobre nossa experiência no projeto e ela foi submetida à editora. A editora por sua vez enviou a proposta para análise de 6 revisores. Esses revisores atuaram de forma parecida à que atuam os revisores de artigos científicos. A diferença é que os revisores de artigos científicos avaliam um produto concluído e esses revisores analisaram apenas uma proposta.

As opiniões dos revisores chegaram em poucas semanas e nos foram enviadas pela editora. Elas continham uma grande diversidade de opiniões indo desde efusivos elogios a críticas claras, passando também por revisores que viam pontos positivos e negativos. A partir daí, nossa equipe se dedicou a rever a proposta de livro de forma que fosse possível contemplar as críticas, sem perder os elogios, mas principalmente sem perder o foco no que queríamos e achamos que deveríamos reportar.

Como a equipe tinha clareza do que queria, não foi difícil identificar as críticas que mereciam ser incorporadas e separa-las daquelas que, mesmo quando meritórias, tirariam o nosso foco. E isso, nós sabíamos que não nos interessaria. Um dos pontos que veio da revisão foi a necessidade de reforçar a contextualização epidemiológica. Essa parte nos deixou particularmente felizes por 2 motivos. O primeiro e mais óbvio é que ela nos permitiu reforçar o conteúdo científico da área de aplicação que estamos lidando. 

Esse motivo já seria suficiente, mas essa revisão nos possibilitou a gratificante inclusão do Leo Bastos na equipe do livro, para que ele trouxesse parte da sua larga experiência sobre o assunto. Aqueles que acompanham o StatPop, tem visto os vários comentários do Leo às nossas postagens. Mais recentemente, um belíssimo texto do Leo serviu como postagem recente aqui. Esse texto bateu todos os recordes de visualizações do StatPop, comprovando a sua relevância. Leo agora nos dará a chance de aprofundar no livro os seus questionamentos sobre dados de pandemias e possíveis tratamentos que podem a eles ser aplicados.

A revisão da proposta contendo esse e vários outros pontos foi enfim feita e enviada à editora. Felizmente, as mudanças propostas não removeram os apoios que já possuíamos e apontou uma solução melhorada tanto para nós, quanto para a editora e para os revisores. Ao final desse processo todo, a editora se sentiu confortável para decidir pelo apoio ao projeto. 

Assim, temos agora um novo componente dentro do CovidLP. Ele demandará muito esforço e concentração de toda a equipe envolvida mas todos ficaram muito felizes com a perspectiva que se abriu para nós. Teremos que trabalhar duro pelos próximos meses e esperamos concluir o texto até o início do próximo ano, como nos comprometemos.    

 A boa notícia para todos que nos pediam uma melhor documentação é que ela virá. A má notícia é que ela vai demorar mais do que os que pediam por isso imaginavam. Serão meses ao invés de semanas. Outro efeito colateral indesejável é que continuarei sendo atraído para longe do StatPop por mais algum tempo. Assim como houve a necessidade de informar esse episódio do CovidLP aqui, outros possivelmente ocorrerão e ensejarão postagens aqui.

Apesar de muito penoso para todos nós do ponto de vista pessoal, esse ano tem sido fonte de aprendizados das mais diferentes naturezas para a humanidade. Estamos cientes da dificuldade do desafio que assumimos. Mas estamos confiantes que conseguiremos juntar um material minimamente aceitável que sirva de testemunho de toda nossa jornada, faça jus a tudo que aprendemos e deixe um legado útil a futuros desenvolvedores de plataformas de previsão de pandemias ou até mesmo de outros fenômenos.


segunda-feira, 10 de agosto de 2020

Como pensar como um epidemiologista

https://www.nytimes.com/ (James Steinberg)

O texto com o título acima, escrito pela jornalista canadense Siobhan Roberts, foi publicado na semana passada pelo jornal americano The New York Times com o sub-título "Não se preocupe, um pouco de análise Bayesiana não lhe fará mal". O texto faz um apanhado de como a inferência Bayesiana pode ser útil em análises práticas, inclusive no período da pandemia. Ele reflete posições externadas em repetidas postagens aqui no StatPop. Mas como é um texto recente, atual e veiculado em mídia de alcance internacional, achei por bem reproduzi-lo aqui em português, para a compreensão de todos. Segue abaixo o texto da matéria...

"Há uma réplica de um estatístico - às vezes oferecida como uma crítica irônica, às vezes como um conselho honesto - que dificilmente poderia ser um lema melhor para nossos tempos: "Atualize suas prioris!"

No jargão das estatísticas, prioris são seus conhecimentos e crenças anteriores, inevitavelmente confusos e incertos, antes de ver as evidências. As evidências promovem uma atualização; e, em seguida, mais evidências solicitarão atualizações adicionais, e assim por diante. Este processo iterativo aprimora maior certeza e gera um acúmulo coerente de conhecimento.

No início da era pandêmica, por exemplo, a transmissão aérea da Covid-19 não era considerada provável, mas no início de julho a Organização Mundial da Saúde, com crescentes evidências científicas, admitiu que era um fator, especialmente em ambientes fechados. A OMS atualizou seus antecedentes e mudou seus conselhos.

Este é o cerne da análise bayesiana, em homenagem a Thomas Bayes, um ministro presbiteriano do século 18 que fazia matemática paralelamente. Ele captura a incerteza em termos de probabilidade: o teorema, ou regra, de Bayes é um dispositivo para atualizar racionalmente suas crenças e incertezas anteriores com base em evidências observadas.

O reverendo Bayes expôs suas idéias em “Um ensaio para a solução de um problema na doutrina das chances”, publicado postumamente em 1763; foi refinado pelo pregador e matemático Richard Price e incluiu o teorema de Bayes. Alguns séculos depois, as estruturas e métodos bayesianos, movidos por computação, estão no centro de vários modelos em epidemiologia e outros campos científicos.

Como Marc Lipsitch, epidemiologista de doenças infecciosas de Harvard, observou no Twitter, o raciocínio bayesiano chega muito perto de sua definição de racionalidade. “À medida que aprendemos mais, nossas crenças devem mudar”, disse Lipsitch em uma entrevista. “Um extremo é decidir o que você pensa e ser imune a novas informações. Outro extremo é privilegiar demais a última coisa que você aprendeu. Em termos gerais, o raciocínio bayesiano é uma maneira baseada em princípios de integrar o que você pensava anteriormente com o que aprendeu e chegar a uma conclusão que incorpora os dois, dando-lhes pesos apropriados.”

Com uma nova doença como a Covid-19 e todas as incertezas que ela traz, há um grande interesse em estabelecer os parâmetros dos modelos: Qual é o número de reprodução básico, a taxa com que surgem novos casos? Quão mortal é isso? Qual é a taxa de mortalidade por infecção, a proporção de pessoas com o vírus que ele mata?

Mas não adianta tentar estabelecer números fixos, disse Natalie Dean, professora assistente de bioestatística da Universidade da Flórida.

“Devemos nos concentrar menos em encontrar a única 'verdade' e mais em estabelecer um intervalo razoável, reconhecendo que o valor verdadeiro pode variar entre as populações”, disse o Dr. Dean. “As análises bayesianas nos permitem incluir essa variabilidade de forma clara e, em seguida, propagar essa incerteza por meio do modelo.”

Uma aplicação de livro-texto do teorema de Bayes é o teste de sorologia para Covid-19, que procura a presença de anticorpos para o vírus. Todos os testes são imperfeitos e a precisão de um teste de anticorpos depende de muitos fatores, incluindo, de maneira crítica, a raridade ou prevalência da doença.

O primeiro teste de anticorpos contra SARS-CoV-2 aprovado pelo F.D.A., em abril, parecia estar errado com a mesma frequência com que estava certo. Com o teorema de Bayes, você pode calcular o que você realmente deseja saber: a probabilidade de que o resultado do teste esteja correto. Como dito em um comentário do Twitter: "Compreender o teorema de Bayes é uma questão de vida ou morte agora."

A lógica da incerteza

Joseph Blitzstein, um estatístico de Harvard, investiga a utilidade da análise bayesiana em seu popular curso “Estatística 110: Probabilidade”. Para uma cartilha, na aula um, ele diz: “Matemática é a lógica da certeza, e estatística é a lógica da incerteza. Todo mundo tem incerteza. Se você tem 100 por cento de certeza sobre tudo, há algo errado com você. ”

No final da aula quatro, ele chega ao teorema de Bayes - seu teorema favorito porque é matematicamente simples, mas conceitualmente poderoso.

“Literalmente, a prova é apenas uma linha de álgebra”, disse Blitzstein. O teorema se reduz essencialmente a uma fração; expressa a probabilidade P de algum evento A acontecer, dada a ocorrência de outro evento B.

"Ingenumente, você pensaria: quanto você poderia conseguir com isso?" Dr. Blitzstein disse. “Acontece que tem consequências incrivelmente profundas e é aplicável a quase todos os campos de investigação” - desde finanças e genética até ciências políticas e estudos históricos. A abordagem bayesiana é aplicada na análise das disparidades raciais no policiamento (na avaliação das decisões dos policiais para revistar os motoristas durante uma parada de trânsito) e nas operações de busca e resgate (a área de busca diminui à medida que novos dados são adicionados). Os cientistas cognitivos perguntam: "O cérebro é bayesiano?" Os filósofos da ciência postulam que a ciência como um todo é um processo bayesiano - assim como o senso comum.

Considere o teste de diagnóstico. Neste cenário, a configuração do teorema de Bayes pode usar eventos rotulados como "T" para um resultado de teste positivo - e "C" para a presença de anticorpos Covid-19:


Agora, suponha que a prevalência de casos seja de 10 por cento (era assim na cidade de Nova York na primavera) e você tenha um resultado positivo de um teste com precisão de 87,5 por cento de sensibilidade e 97,5 por cento de especificidade. Passando os números pelas engrenagens bayesianas, a probabilidade de que o resultado esteja correto e de que você realmente tenha anticorpos é de 79,5%. Probabilidades decentes, considerando tudo. Se você quer mais certeza, peça uma segunda opinião. E continue a ser cauteloso.

Uma colaboração internacional de pesquisadores, médicos e desenvolvedores criou outra estratégia bayesiana, combinando o resultado do teste com um questionário para produzir uma estimativa melhor se o resultado pode ser um falso negativo ou um falso positivo. A ferramenta, que ganhou dois hackathons, coleta informações contextuais: Você foi trabalhar durante o bloqueio? O que você fez para evitar pegar a Covid-19? Alguém em sua casa teve Covid-19?

“É um pouco semelhante a ter dois 'especialistas médicos'”, disse Claire Donnat, que recentemente concluiu seu doutorado em Estatística em Stanford e fazia parte da equipe. Um especialista tem acesso aos sintomas e antecedentes do paciente, o outro ao teste; os dois diagnósticos são combinados para produzir uma pontuação mais precisa e estimativas de imunidade mais confiáveis. As prioris são atualizadas com uma agregação de informações.

“À medida que novas informações chegam, atualizamos nossas prioris o tempo todo”, disse Susan Holmes, uma estatística de Stanford, através da instável internet da zona rural de Portugal, onde ela inesperadamente passou 105 dias de pandemia, enquanto visitava sua mãe.

Essa foi a base a partir da qual o Dr. Holmes refinou um artigo recente, em coautoria com o Dr. Donnat, que fornece outro exemplo de análise bayesiana, em termos gerais. Observando as primeiras pesquisas em março sobre como a pandemia pode evoluir, eles notaram que os modelos epidemiológicos clássicos tendem a usar parâmetros fixos, ou constantes, para o número de reprodutibilidade - por exemplo, com um R0 de 2,0.

Mas, na realidade, o número de reprodução depende de fatores aleatórios e incertos: cargas virais e suscetibilidade, comportamento e redes sociais, cultura e classe socioeconômica, clima, ar condicionado e outros fatores desconhecidos.

Com uma perspectiva bayesiana, a incerteza é codificada na aleatoriedade. Os pesquisadores começaram supondo que o número de reprodutibilidade tinha várias distribuições (os prioris). Em seguida, eles modelaram a incerteza usando uma variável aleatória que flutua, assumindo uma faixa de valores tão pequena quanto 0,6 e tão grande quanto 2,2 ou 3,5. Em algo semelhante a um processo de aninhamento, a própria variável aleatória tem parâmetros que flutuam aleatoriamente; e esses parâmetros também têm parâmetros aleatórios (hiperparâmetros), etc. Os efeitos se acumulam em uma "hierarquia bayesiana" - "tartarugas por todo o lado", disse Holmes.

Os efeitos de todas essas flutuações aleatórias para cima e para baixo se multiplicam, como os juros compostos. Como resultado, o estudo descobriu que o uso de variáveis ​​aleatórias para números de reprodutibilidade prevê de forma mais realista os eventos de cauda arriscados, os eventos de superespalhamento mais raros, porém mais significativos.

Os humanos sozinhos, no entanto, sem um modelo bayesiano de bússola, são notoriamente ruins em compreender o risco individual.

“As pessoas, incluindo crianças muito pequenas, podem usar a inferência bayesiana inconscientemente”, disse Alison Gopnik, psicóloga da Universidade da Califórnia, em Berkeley. “Mas eles precisam de evidências diretas sobre a frequência dos eventos para fazer isso.”

Muitas das informações que orientam nosso comportamento no contexto da Covid-19 são probabilísticas. Por exemplo, por algumas estimativas, se você for infectado com o coronavírus, há uma chance de 1 por cento de morrer; mas, na realidade, as chances de um indivíduo podem variar em mil vezes ou mais, dependendo da idade e de outros fatores. “Para algo como uma doença, a maioria das evidências é geralmente indireta, e as pessoas são muito ruins em lidar com informações probabilísticas explícitas”, disse Gopnik.

Modelagem de Humildade 

Mesmo com evidências, revisar crenças não é fácil. A comunidade científica lutou para atualizar suas prioris sobre a transmissão assintomática de Covid-19, mesmo quando surgiram evidências de que é um fator e que as máscaras são uma medida preventiva útil. Isso provavelmente contribuiu para a lenta resposta do mundo ao vírus.

“Os problemas surgem quando não atualizamos”, disse David Spiegelhalter, estatístico e presidente do Centro Winton para Comunicação de Evidências e Riscos da Universidade de Cambridge. “Você pode interpretar o viés de confirmação, e muitas das maneiras pelas quais reagimos mal, por sermos lentos demais para revisar nossas crenças.”

Existem técnicas que compensam as deficiências bayesianas. Dr. Spiegelhalter gosta de uma abordagem chamada lei de Cromwell. “É o paraíso”, disse ele. Em 1650, Oliver Cromwell, Lorde Protetor da Comunidade da Inglaterra, escreveu em uma carta à Igreja da Escócia: “Eu te suplico, nas entranhas de Cristo, pense possível que você esteja enganado”.

No mundo bayesiano, a lei de Cromwell significa que você deve sempre "mantenha um pouquinho - um pouco que seja de probabilidade, mesmo minúsculo - para o fato de que você pode estar errado", disse o Dr. Spiegelhalter. “Então, se aparecerem novas evidências que contradigam totalmente sua principal crença anterior, você pode rapidamente abandonar o que pensava antes e pular para essa nova forma de pensar.”

“Em outras palavras, mantenha a mente aberta”, disse o Dr. Spiegelhalter. “Essa é uma ideia muito poderosa. E não precisa necessariamente ser feito técnica ou formalmente; pode estar apenas no fundo da sua mente, como uma ideia. Chame isso de 'modelagem de humildade'. Você pode estar errado.”

segunda-feira, 27 de julho de 2020

Statisticians React to the News



Essa postagem é para divulgar mais uma iniciativa do International Statistical Institute (ISI), agora voltada para a discussão de como o estatístico deve se comunicar com a mídia e uma avaliação de como a Estatística deve ser tratada pela mídia. O tema é bastante amplo e contempla a questão da comunicação do estatístico com a sociedade. 

A idéia do ISI é fazer um blog com postagens semanais tendo reflexões de estatísticos ao redor do mundo sobre a comunicação de Estatística através da mídia. O nome do blog é Statisticians React to the News, que seria traduzido como algo do tipo Estatísticos Reagem às Notícias. Trata-se portanto de um blog muito similar em espírito ao StatPop, embora seja voltado mais para a questão da divulgação pela mídia formal. O StatPop tem um foco mais amplo envolvendo todo tipo de divulgação da Estatística, incluindo artigos científicos, artigos de divulgação, congressos, uso de Estatística pelas outras áreas da Ciência e também, por que não, a divulgação pela mídia tradicional.

Tive o prazer de ser convidado para fazer parte da equipe de articulistas desse blog e aceitei o desafio de imediato. Embora eu não conheça nenhum outro membro da equipe, acredito que ela deva ser bastante ampla pois demanda de postagens solicitada é de 2 por ano. Também foram aventadas outras formas de colaboração com o blog. Assim, estimo que devam ao menos algumas dezenas de membros na equipe. 

O blog acaba de ser lançado na semana passada. A postagem inicial não podia ser sobre algo diferente de uma reflexão da cobertura da mídia sobre as estatísticas da pandemia. Essa questão foi determinante para que os proponentes do blog criassem esse forum com a proposta mais ampla descrita acima. Ele serviria para que os estatísticos tivessem um espaço próprio para refletir sobre questões desta natureza. 

Assim, pareceu natural que eu propusesse minha postagem sobre algum dos vários aspectos da pandemia que tenho trazido aqui para o StatPop. Dada a natureza internacional do blog, a postagem que me pareceu mais relevante foi a postagem divulgada em meados do mes passado. Enviei uma tradução essa proposta para a editora do blog, uma pesquisadora de Estatística, responsável pela captação e adequação do material. Junto com o comitê consultivo, também formado por pesquisadores de Estatística, ela decide os temas e autores das postagens e a ordem com que eles serão tratados e veiculados no blog.

Para minha surpresa, ela gostou do que leu. Após algumas muito boas sugestões de revisão do material, o texto foi finalizado e saiu publicado hoje. Fiquei feliz de fazer parte de mais esse esforço de divulgação da Estatística, agora a nível internacional. Espero que outros textos instigadores sejam publicados e que esse blog cumpra a função para a qual foi criado e abraçado pelo ISI.

terça-feira, 14 de julho de 2020

Atualizações na pandemia e no projeto CovidLP


O projeto CovidLP foi descrito aqui há algumas postagens. Desde então muita coisa aconteceu dentro e fora do projeto com relação à Covid19. Gostaria de falar aqui sobre algumas delas. Elas envolvem novas manifestações da pandemia e a resposta do projeto a elas, bem como outras novidades do projeto. Procurarei descrevê-las aqui na medida do seu relacionamento com o projeto.

O primeiro e mais importante aspecto dessa pandemia é o afastamento do padrão estabelecido para pandemias/epidemias. Normalmente uma epidemia apresenta um comportamento de aumento de casos seguido de um decréscimo nos casos. Esse padrão segue a lógica do crescente aumento da infecção devido ao maior número de suscetíveis, seguido do decréscimo decorrente da diminuição desse último número. Entretanto, esse padrão tem sido quebrado pela mudança no nível de isolamento. Com o relaxamento do isolamento, novos grupos de suscetíveis se expõe ao contágio, permitindo uma nova onda de crescimento. Essa epidemia já havia exibido esse comportamento em alguns poucos países. O caso mais vistoso era o do Iran. Neste momento, que vários países já encerraram um seu (primeiro?) ciclo, estamos vendo esse ressurgimento de crescimento de contagens em uma série de países, como Estados Unidos.

Um fenômeno aparentemente similar tem sido observado em alguns países. Se o país é muito heterogêneo, o comportamento da pandemia em suas diferentes regiões tem diferenças marcantes. O início da pandemia varia muito temporalmente. No caso do Brasil, a pandemia começou pelos estados de Rio de Janeiro e São Paulo, onde estão situados os principais pontos de entrada de estrangeiros no país: os aeroportos. Além disso, o próprio formato do crescimento depende de políticas de testagem e, principalmente de políticas de isolamento, sobre os quais as decisões em esfera estadual tem grande relevância. Apesar de diferentes, esse fenômeno pode ter uma expressão em número de casos e de mortes muito parecida com a que identificamos com os fenômenos descritos no parágrafo que o antecedeu. Eles são são usualmente denominados de 2a onda.   

A forma mais simples que pode ser usada para representar matematicamente essa 2a onda, ou mais geralmente qualquer onda adicional, é a inclusão de uma curva logística adicional na formulação do modelo. Embora conceitualmente simples, a implementação dessa idéia não é tão simples quanto parece. O maior problema advém da dificuldade do modelo saber separar as 2 curvas que se somam para descrever uma única série temporal observada. Várias tentativas estão sendo adotadas para permitir essa identificação e estão sendo testadas. Espero poder reportar sobre elas em breve. 

Outro aspecto relevante a ser considerado é a correta especificação da variabilidade dos dados. O projeto CovidLP vem utilizando a especificação Poisson, por ser a mais natural para lidar com contagens. Entretanto, experimentos realizados com os dados dessa epidemia mostram que a variabilidade dos dados tem se revelado muito maior que a permitida pela Poisson. Faz-se necessária uma especificação que permita essa sobredispersão. Existem várias opções disponíveis na literatura estatística, incluindo a mais conhecida: a binomial negativa. Entretanto, todos os experimentos realizados até agora apontaram para uma especificação que, embora mais adequada em termos de ajuste, tem levado a previsões com muita incerteza. Após poucos dias a frente, os intervalos que refletem a incerteza das previsões ficam tão largos que praticamente tornam inócua qualquer inferência. Tentativas de minimizar o tamanho da incerteza, sem chegar à estreiteza dos intervalos oriundos da Poisson, ainda estão em curso.

Outro aspecto que tem sido muito comentado por aqueles que tem trabalhado com dados da pandemia é a dificuldade de obter estabilidade nas sucessivas projeções que são rotineiramente feitas e de atribuir confiabilidade nas previsões a longo prazo. Efetivamente, tem sido observadas mudanças constantes nas estimações não apenas pela pouca robustez dos modelos utilizados. As condições sobre as quais se desenvolve a pandemia em muitos países tem exibido flutuações consideráveis o que torna previsões de longo prazo ainda mais incertas. Uma busca na literatura mostra que essa não é uma prerrogativa dessa pandemia. Críticas à performance de modelos de previsão para epidemias tem sido publicadas. A fala do reitor da UEM ao fim de minha palestra a essa universidade ajuda a entender porque as projeções seguem sendo usadas apesar de todas as ressalvas. Ele essencialmente disse que as previsões não são feitas para indicar o caminho mas tão somente para jogar luz sobre ele.

A disseminação do projeto deu origem a vários instrumentos de interações com a academia e a sociedade. De fato, o projeto foi feito para isso. O aplicativo já deu origem a um site e um blog. O site divulga aspectos associados ao aplicativo, como detalhamento da metodologia, instruções para melhor compreensão dos resultados (ilustrado na figura acima) e repercussões na sociedade (mais sobre isso no próximo parágrafo). O blog serve como um espaço para interação mais direta com os usuários. Embora ainda subutilizado, ele serve para ouvirmos sugestões e até críticas. 

Vários convites para apresentações do aplicativo foram feitos para a equipe responsável. Além disso, houve interesse para utilização dos resultados em algumas instâncias oficiais, tanto a nível municipal quanto a nível estadual. Esperamos poder atingir ainda mais secretarias de saude municipais e estaduais espalhadas pelo país.

A mais recente ferramenta a ser disponibilizada é o pacote. Ele vem atender uma demanda que rotineiramente recebemos de usuários, interessados em analisar as regiões de seus interesses pessoais.  ele está sendo desenvolvido com descrição, exemplos e ajuda. Esperamos que essa facilidade tenha o potencial de angariar uma maior utilização dessa ferramenta.

terça-feira, 30 de junho de 2020

Navegar ao sabor do vírus*


Navegar ao sabor do vírus
Abrimos mão de controlar a pandemia e o vírus está nos levando para onde deseja

por Fernando Reinach,  Professor Titular da USP

Navegar ao sabor do vento significa içar vela e deixar que o vento nos leve para onde soprar. É abrir mão de comandar o futuro. O Brasil está navegando ao sabor do vírus. Abrimos mão de controlar a pandemia e o vírus está nos levando para onde deseja. Talvez mais lentamente do que poderia, pois não levantamos completamente a vela: lavamos as mãos, usamos máscaras e fazemos um mínimo de isolamento. Sem dúvida estamos caminhando em direção à tragédia, mas em câmera lenta, e não temos planos para retomar o controle. É a consumação da estratégia que chamei em 9 de maio de imunidade de rebanho por incompetência.

Ao sabor do vírus a pandemia no Brasil só terminará quando atingirmos a imunidade de rebanho, o único mecanismo biológico conhecido que inibe a propagação do vírus sem intervenção humana. Navegar ao sabor do vírus pode custar a vida de até 1% dos contaminados. A imunidade de rebanho geralmente ocorre quando 70% a 80% da população suscetível tiver sido infectada. Talvez ocorra antes, mas chegaremos lá antes de a vacina estar disponível. Isso é quase uma certeza. Quais são as evidências de que navegamos ao sabor do vírus? O gráfico abaixo, cortesia do meu amigo Cal, mostra nossa rota desde a chegada do vírus no Brasil.


No eixo vertical estão os números de novos casos por dia, por milhão de habitantes, em cada um de quatro países. Os dados diários foram plotados como uma média móvel de sete dias. O Brasil registra hoje por volta de 150 novos casos, a cada dia, por milhão de habitantes (sem contar as subnotificações), um número maior que os 90 registrados nos Estados Unidos. No eixo horizontal estão os dias que se passaram desde que cada país registrou um caso por milhão de habitantes. Isso ocorreu quando o Brasil registrou 220 novos casos por dia, os EUA, 330, o Reino Unido, 66, e a Itália, 60.

É fácil observar como a Itália, após um crescimento rápido do número de casos por dia, impôs um lockdown rigoroso após o dia 30 e tomou controle do barco. Passados 90 dias, estava com a pandemia sob controle. O Reino Unido demorou para responder e o lockdown veio mais tarde. Mas desde o dia 60 conseguiu reduzir o número de novos casos por dia. Os EUA também se assustaram com o crescimento rápido dos novos casos, implementaram um lockdown nas principais cidades, conseguiram estabilizar o número de novos casos, mas quando começaram a tomar pé da situação relaxaram o distanciamento social. Os resultados da abertura são gritantes, o crescimento rápido do número de novos casos por dia já está ocorrendo.

O mais impressionante é o barco brasileiro. Medidas brandas de distanciamento social retardaram o crescimento da pandemia, que cresceu lenta e livremente por 80 dias. Quando as medidas estavam começando a fazer efeito, veio o relaxamento do distanciamento social e a pandemia voltou a crescer mais rapidamente do que antes, totalmente fora de controle.

O pior no Brasil é que simplesmente não temos um plano para controlar esse crescimento. O exemplo mais claro dessa atitude é o anúncio da abertura das escolas no Estado de São Paulo. Ele deve ocorrer no início de setembro caso todas as áreas do Estado estejam com níveis de propagação classificadas como verde já no início de agosto. O problema é que não foi anunciado simultaneamente um plano capaz de garantir que o Estado de São Paulo atinja essa condição no início de agosto. Sem executar algum plano seguramente não chegaremos lá, pois São Paulo está batendo todos os dias os recordes de novos casos por dia e número de mortes por dia. Ou seja, as escolas não abrirão em setembro se o governo cumprir o que decretou.

Até agora as medidas anunciadas são inócuas para controlar a pandemia. Oferecer mais leitos de UTI ajuda os pacientes graves, o que é importante, mas não diminui o número de casos. E esse aumento tem limite, que eram respiradores, mas de agora em diante serão profissionais da saúde capazes de atender um número crescente de leitos. Liberar gradativamente as atividades ao menor sinal de desocupação de leitos vai seguramente na direção oposta do controle, pois cada liberação significa levantar um pouco mais a vela desse barco que navega ao sabor do vírus.

E a testagem em massa? Ela tem sido um fracasso em nosso Estado e em todo o País. Os governos sequer detalham o que significa esse termo e como ele pode levar ao controle da pandemia. O número de testes de RT-PCT, que detectam pessoas durante a fase em que estão transmitindo o vírus, e podem ser usados para isolar pessoas que estão transmitindo a doença, são executados em número ínfimo. Pululam iniciativas governamentais baseadas em testes sorológicos, que, sabemos muito bem, somente identificam pessoas que já passaram pela fase crítica da doença e já contaminaram quem deveriam contaminar. São inúteis para controlar a doença e uma bênção para o vírus.

Em suma, não existe nenhuma medida em andamento que tenha alguma chance de reverter o andamento da pandemia nos próximos meses. Nenhuma.

A impressão é que nossos governantes esperam por algum milagre, alguma intervenção divina que provoque a diminuição do espalhamento da doença de maneira mágica, sem que eles tenham de executar algum plano que tenha embasamento científico. Como a fração da população já infectada ainda é baixa, não existe nada no horizonte que vai conter o crescimento diário do número de novos casos em 2020. Estamos navegando ao sabor do vírus com a vela a meio mastro.

* - texto publicado no dia 27 de junho de 2020 n'O Estado de S.Paulo

terça-feira, 23 de junho de 2020

As estatística da Estatística no CNPq - parte IV

Minha 3a e última postagem da série As estatística da Estatística no CNPq teve uma discreta inclusão da palavra epílogo, seguida de um preocupante sinal de interrogação. Não sei ao certo porque inclui esse sinal. Afinal, metade dos pesquisadores de Estatística que não tiveram suas solicitações de bolsas de pesquisa aprovadas inicialmente e entraram com recurso acabaram tendo sua solicitação aprovada. Talvez o fato de que, mesmo havendo essa concessão por parte do CNPq, a área de Estatística tivesse continuado a ter perdas bem maiores que as outras áreas fosse o responsável pelo alerta ter permanecido ligado. Ironicamente, um artigo recente de uma das pesquisadoras que não teve seu pedido de bolsa aprovado acaba de receber um prêmio internacional pela excelência científica de um artigo recente.

As decisões tomadas naquele Edital não desagradaram apenas à Estatística. Um abaixo assinado contendo críticas ao CA-MA (comitê da Matemática que engloba a avaliação da Estatística) foi apoiado por centenas de pesquisadores (muitos deles bolsistas do CNPq) das áreas desse comitê. Uma das maiores críticas foi a pouca relevância atribuída ao histórico profissional dos solicitantes. De fato, muitos pesquisadores experientes de todas as áreas desse comitê não tiveram seus pedidos aprovados em uma primeira instância embora alguns lograram recupera-las após a fase de recursos. Mas a quantidade de bolsas das outras áreas não sofreu perdas tão significativas quanto a Estatística.

No texto que segue, procurarei elencar possíveis explicações, à luz das informações disponíveis. Para isso, adotarei a convenção de designar as outras áreas do CA-MA como Matemática. Isso facilitará a compreensão da diferença que vem havendo com respeito à Estatística neste comitê do CNPq.

A explicação é facilitada ao tomar como base um Edital do CNPq, lançado na semana passada. Esse Edital estabelece as regras para a avaliação dos pedidos de bolsa de produtividade em pesquisa. Junto ao Edital foi disponibilizado um anexo com as regras específicas de cada Comitê de área. Em particular, o CA-MA estabeleceu uma série de parâmetros. Os mais importantes são:
  1. a avaliação terá 1 nota para cada pedido e essa nota é atribuida em 2 etapas;
  2. na nota da 1a etapa, o peso da produção científica é de 60%, o peso das orientações é 30% e o peso do projeto de pesquisa é de 10%;
  3. cada artigo científico é alocado a 1 de 5 grupos que são ponderados com pesos 36, 16, 5, 2 e 1 de acordo com o periódico de publicação e os livros publicados tem pesos 16 (autor) e 4 (coletânea); 
  4.  a 2a etapa terá uma análise qualitativa que pode alterar em até 30% a nota dada na etapa 1, levando em conta aspectos mais gerais de toda a história profissional do candidato à bolsa.
Ficam claras a prevalência da produção científica e a grande ênfase dada aos níveis superiores dos periódicos, critérios que parecem prerrogativas aceitáveis do comitê. A introdução explícita da 2a etapa no Edital também parece aceitável e contempla críticas contidas no abaixo-assinado supracitado. Para avaliar a produção científica, foram listados no Edital 462 periódicos sendo 52 de Estatística e 410 de Matemática. Um levantamento feito pelo Prof. Marcos Prates, do Departamento de Estatística da UFMG, mostra os seguintes resultados

Proporção de periódicos de cada categoria de avaliação
Área
G1
G2
G3
G4
G5
Total
Estatística
7,7%
3,9%
38,5%
32,7%
17,3%
100%
Matemática
9,8%
19,5%
23,9%
34,2%
13,7%
100%

A tabela acima mostra que:
  • as chances de um periódico qualquer de Matemática estar na categoria superior G1 são superiores às chances de um periódico de Estatística estar nessa categoria. Voltaremos a esse ponto a seguir;
  • as chances de um periódico qualquer de Matemática estar na 2a categoria G2 são 5 vezes maiores que as chances de um periódico de Estatística estar nessa categoria. Esse resultado é consequência da classificação feita pelo CA-MA. Ele expressa a percepção do comitê que enquanto 30% dos periódicos de Matemática estão nos 2 primeiros e melhores níveis, menos de 12% dos periódicos de Estatística atingem esses níveis; 
  • a categoria seguinte G3, que tem peso ainda menor, apresenta uma concentração bem maior de periódicos de Estatística em relação à Matemática. Isso ajuda a entender o destino do deficit de periódicos de Estatística nas 2 categoria mais relevantes pois as últimas 2 categorias apresentam proporções similares para as 2 áreas.
Além disso, vale notar que:
  • o numero de periódicos de Matemática no nível G1 é 8 vezes maior e portanto o seleto grupo de periódicos de melhor nível oferece uma cesta de possibilidades de publicação muito maior para os matemáticos do que para os estatísticos. 
  • considero benvinda a formalização da 2a etapa dentro do Edital mas algumas reuniões recentes deste CA-MA não tiveram a participação de representantes da Estatística. Essa contextualização qualitativa fica muito difícil de ser feita por quem não é da área. Uma eventual repetição dessa ausência poderia implicar desvantagem de até 30% para estatísticos;
  • vários periódicos de Estatística (e possivelmente de Matemática também) não estão na lista que consta no Edital. Quero crer que o CA-MA promoverá a classificação desses possíveis periódicos posteriormente e provavelmente, isso seria feito dentro dos mesmos critérios que levaram à classificação disponibilizada no Edital, já similar à usada no Edital anterior, que já vimos estar relacionada a um pior desempenho de uma área em relação à outra. Mas isso não foi dito no Edital, possibilitando várias outras hipóteses e aumentando a incerteza.
Apesar dos esforços tentados pela comunidade de Estatística junto ao CNPq, tudo isso tem levado um compreensível desânimo e uma razoável dose de preocupação. Parece que esses esforços serviram apenas no curto prazo para apoiar os recursos interpostos mas foram pouco efetivos em imprimir uma mudança nas regras que permitisse à Estatística uma melhor sorte no médio e longo prazo. Vale informar que no meio desse processo, houve a troca de presidência do CNPq, o que não ajudou a interlocução dos anseios da área através da estrutura do CNPq.

A solução no curto prazo para boa parte das dificuldades da Estatística é muito simples: igualdade de condições! A tabela acima e as análises feitas a seguir deixam bem claro como fazer isso. A Estatística não quer nenhum favorecimento. Mas ela também gostaria de ser reconhecida como ela é: uma área do saber diferente de outras áreas como a Matemática. A linguagem principal da Estatística ainda é a Matemática mas sua combinação com o tratamento de sua matéria prima, os dados a serem analisados, produz um campo do conhecimento fundamentalmente diverso. Além disso, elementos específicos da área e de Computação tem desempenhado um papel cada vez mais imprescindível. Boa parte do mundo desenvolvido já reconhece essa diferenciação há algum tempo: Matemática e Estatística andam juntos quando convém a ambas e separados em outra fração do tempo.  Assim, é fundamental que no mínimo haja a presença de um estatístico para a adequada avaliação de projetos dessa área.

Do jeito que está, os movimentos recentes do CA-MA apontam um futuro preocupante para a pesquisa em Estatística no Brasil. Os jovens pesquisadores, que representam o futuro de qualquer área, em qualquer lugar do mundo sabem que precisam batalhar mais que os pesquisadores já estabelecidos para ter acesso a oportunidades similares. Isso é até esperado. O que fica difícil para os jovens estatísticos entenderem é que deverão perder oportunidades para outros pesquisadores igualmente (ou menos) qualificados simplesmente pelo fato de serem da Estatística. A parceria com a área de Matemática, que foi tão importante no passado para o crescimento da área de Estatística no Brasil, não parece estar tendo um efeito benéfico nesses últimos anos. O resultado poderá ser sombrio não só para a área mas também para o país, com evasão interna e externa de pesquisadores cujas formações tanto custaram. E o mais triste é isso acontecer em um momento onde a Estatística está se mostrando ser uma ferramenta fundamental para o bem estar da humanidade.