StatPop - Popularização da Estatística
terça-feira, 8 de dezembro de 2020
Breve relato sobre a Cerimônia para o Prof Adrian Smith
terça-feira, 1 de dezembro de 2020
Outorga de título mais que merecido a Sir Adrian Smith
https://www.poscardio50anos.com.br/
Estamos entrando no ultimo mês desse estranho e inesquecível ano de 2020. Sei que o StatPop está em dívida por ausência de postagens desde meados de setembro. Os motivos já haviam sido antecipados nesta última postagem mas não são o objeto desta postagem. Esta postagem traz uma boa notícia para toda a comunidade estatística brasileira.
Nesta sexta feira 04 de dezembro as 11 horas será realizada a cerimônia de outorga do título de Doutor Honoris Causa da UFRJ ao Professor Sir Adrian Smith. A cerimônia será realizada em formato virtual por motivos óbvios e o endereço eletrônico será disponibilizado abaixo. Essa cerimônia pode ser entendida como o ponto alto de uma carreira profissional, pois envolve o reconhecimento máximo por uma universidade onde o agraciado com o título não trabalhou. Ela costuma ser cercada de muita pompa e circunstância com togas ornamentadas, medalhas, diplomas e discursos. Infelizmente, nada disso poderá acontecer neste formato virtual. Obviamente os discursos acontecerão mas de forma mais compactada e em número muito mais reduzido pelo próprio formato virtual, que será inaugurado na UFRJ com esta outorga.
O momento é particularmente oportuno pois Adrian acaba de assumir ontem um dos postos mais importantes de sua carreira, conforme já haviamos anunciado aqui na 1a metade deste ano. É bem possível que esta cerimônia seja seu primeiro evento internacional no cargo de presidente da Royal Society, a associação de pesquisadores mais importantes e renomado do Reino Unido. Como se trata de um dos países mais influentes na ciência, essa sociedade contem uma quantidade impressionante de saber acumulado entre seus membros.
A carreira de Adrian é um sem fim de realizações, horarias e cargos importantes no âmbito da ciência e tecnologia no Reino Unido. Acredito que isso ficará evidente para quem puder participar do evento. O evento terá cerca de 1 hora de duração. Boa parte desse tempo será dedicado a uma palestra do professor Adrian Smith. Essa palestra versará sobre os desafios com os quais ele se delicia no seu cargo atual de Diretor do Alan Turing Institute, uma instituição pioneira na busca de soluções multidisciplinares para grandes problemas da sociedade envolvendo análise e tratamento de dados.
Como um dos proponentes do pedido de concessão do título terei alguns poucos minutos de fala para procurar resumir a excelência de uma carreira cheia de realizações e da importância dessa vinculação à universidade brasileira, em especial à UFRJ. A cerimônia será presidida pela profa. Denise Pires de Carvalho, Reitora da UFRJ.
Convidamos a todos para esse momento único na história da Estatística brasileira.
Link para a cerimônia é https://us02web.zoom.us/
terça-feira, 15 de setembro de 2020
Mais uma adição ao Projeto CovidLP
Como todos aqui tem acompanhado, minha assiduidade ao projeto StatPop tem deixado a desejar nos últimos meses. O principal responsável por essa ausência tem sido um outro projeto: o CovidLP. O que começou com um exercício para alunos de uma disciplina suspensa pela pandemia alcançou uma abrangência que não tinha nem de longe sido antecipada pelos seus participantes.
O projeto agregou participantes externos a essa disciplina e com isso ganhou outras funcionalidades: um app online, um site, um blog e mais recentemente o pacote PandemicLP. Esse pacote, escrito em R, dá liberdade aos usuários mais avançados, interessados em estender as análises do app para outras unidades, como municípios ou microrregiões. Ele surgiu como demanda de alguns usuários do app.
Também como demanda externa, surgiu agora um novo membro para a família CovidLP. O interesse em deixar os desenvolvimentos científicos do projeto documentados sempre fez parte das demandas de muitos usuários. Só não estava claro para a nossa equipe a melhor forma de materializar isso.
Um aviso recente postado por uma editora, solicitando contribuições no combate à pandemia, indicou um possível caminho. Após troca de alguns emails com a editora, ficou claro para nossa equipe que o formato mais adequado para essa veiculação do nosso projeto deveria ser através de um livro, contando todos os percalços e também os nossos achados sempre do ponto de vista científico. E isso foi feito.
Elaboramos uma proposta de livro, calcada sobre nossa experiência no projeto e ela foi submetida à editora. A editora por sua vez enviou a proposta para análise de 6 revisores. Esses revisores atuaram de forma parecida à que atuam os revisores de artigos científicos. A diferença é que os revisores de artigos científicos avaliam um produto concluído e esses revisores analisaram apenas uma proposta.
As opiniões dos revisores chegaram em poucas semanas e nos foram enviadas pela editora. Elas continham uma grande diversidade de opiniões indo desde efusivos elogios a críticas claras, passando também por revisores que viam pontos positivos e negativos. A partir daí, nossa equipe se dedicou a rever a proposta de livro de forma que fosse possível contemplar as críticas, sem perder os elogios, mas principalmente sem perder o foco no que queríamos e achamos que deveríamos reportar.
Como a equipe tinha clareza do que queria, não foi difícil identificar as críticas que mereciam ser incorporadas e separa-las daquelas que, mesmo quando meritórias, tirariam o nosso foco. E isso, nós sabíamos que não nos interessaria. Um dos pontos que veio da revisão foi a necessidade de reforçar a contextualização epidemiológica. Essa parte nos deixou particularmente felizes por 2 motivos. O primeiro e mais óbvio é que ela nos permitiu reforçar o conteúdo científico da área de aplicação que estamos lidando.
Esse motivo já seria suficiente, mas essa revisão nos possibilitou a gratificante inclusão do Leo Bastos na equipe do livro, para que ele trouxesse parte da sua larga experiência sobre o assunto. Aqueles que acompanham o StatPop, tem visto os vários comentários do Leo às nossas postagens. Mais recentemente, um belíssimo texto do Leo serviu como postagem recente aqui. Esse texto bateu todos os recordes de visualizações do StatPop, comprovando a sua relevância. Leo agora nos dará a chance de aprofundar no livro os seus questionamentos sobre dados de pandemias e possíveis tratamentos que podem a eles ser aplicados.
A revisão da proposta contendo esse e vários outros pontos foi enfim feita e enviada à editora. Felizmente, as mudanças propostas não removeram os apoios que já possuíamos e apontou uma solução melhorada tanto para nós, quanto para a editora e para os revisores. Ao final desse processo todo, a editora se sentiu confortável para decidir pelo apoio ao projeto.
Assim, temos agora um novo componente dentro do CovidLP. Ele demandará muito esforço e concentração de toda a equipe envolvida mas todos ficaram muito felizes com a perspectiva que se abriu para nós. Teremos que trabalhar duro pelos próximos meses e esperamos concluir o texto até o início do próximo ano, como nos comprometemos.
A boa notícia para todos que nos pediam uma melhor documentação é que ela virá. A má notícia é que ela vai demorar mais do que os que pediam por isso imaginavam. Serão meses ao invés de semanas. Outro efeito colateral indesejável é que continuarei sendo atraído para longe do StatPop por mais algum tempo. Assim como houve a necessidade de informar esse episódio do CovidLP aqui, outros possivelmente ocorrerão e ensejarão postagens aqui.
Apesar de muito penoso para todos nós do ponto de vista pessoal, esse ano tem sido fonte de aprendizados das mais diferentes naturezas para a humanidade. Estamos cientes da dificuldade do desafio que assumimos. Mas estamos confiantes que conseguiremos juntar um material minimamente aceitável que sirva de testemunho de toda nossa jornada, faça jus a tudo que aprendemos e deixe um legado útil a futuros desenvolvedores de plataformas de previsão de pandemias ou até mesmo de outros fenômenos.
segunda-feira, 10 de agosto de 2020
Como pensar como um epidemiologista
https://www.nytimes.com/ (James Steinberg)
O texto com o título acima, escrito pela jornalista canadense Siobhan Roberts, foi publicado na semana passada pelo jornal americano The New York Times com o sub-título "Não se preocupe, um pouco de análise Bayesiana não lhe fará mal". O texto faz um apanhado de como a inferência Bayesiana pode ser útil em análises práticas, inclusive no período da pandemia. Ele reflete posições externadas em repetidas postagens aqui no StatPop. Mas como é um texto recente, atual e veiculado em mídia de alcance internacional, achei por bem reproduzi-lo aqui em português, para a compreensão de todos. Segue abaixo o texto da matéria...
"Há uma réplica de um estatístico - às vezes oferecida como uma crítica irônica, às vezes como um conselho honesto - que dificilmente poderia ser um lema melhor para nossos tempos: "Atualize suas prioris!"
No jargão das estatísticas, prioris são seus conhecimentos e crenças anteriores, inevitavelmente confusos e incertos, antes de ver as evidências. As evidências promovem uma atualização; e, em seguida, mais evidências solicitarão atualizações adicionais, e assim por diante. Este processo iterativo aprimora maior certeza e gera um acúmulo coerente de conhecimento.
No início da era pandêmica, por exemplo, a transmissão aérea da Covid-19 não era considerada provável, mas no início de julho a Organização Mundial da Saúde, com crescentes evidências científicas, admitiu que era um fator, especialmente em ambientes fechados. A OMS atualizou seus antecedentes e mudou seus conselhos.
Este é o cerne da análise bayesiana, em homenagem a Thomas Bayes, um ministro presbiteriano do século 18 que fazia matemática paralelamente. Ele captura a incerteza em termos de probabilidade: o teorema, ou regra, de Bayes é um dispositivo para atualizar racionalmente suas crenças e incertezas anteriores com base em evidências observadas.
O reverendo Bayes expôs suas idéias em “Um ensaio para a solução de um problema na doutrina das chances”, publicado postumamente em 1763; foi refinado pelo pregador e matemático Richard Price e incluiu o teorema de Bayes. Alguns séculos depois, as estruturas e métodos bayesianos, movidos por computação, estão no centro de vários modelos em epidemiologia e outros campos científicos.
Como Marc Lipsitch, epidemiologista de doenças infecciosas de Harvard, observou no Twitter, o raciocínio bayesiano chega muito perto de sua definição de racionalidade. “À medida que aprendemos mais, nossas crenças devem mudar”, disse Lipsitch em uma entrevista. “Um extremo é decidir o que você pensa e ser imune a novas informações. Outro extremo é privilegiar demais a última coisa que você aprendeu. Em termos gerais, o raciocínio bayesiano é uma maneira baseada em princípios de integrar o que você pensava anteriormente com o que aprendeu e chegar a uma conclusão que incorpora os dois, dando-lhes pesos apropriados.”
Com uma nova doença como a Covid-19 e todas as incertezas que ela traz, há um grande interesse em estabelecer os parâmetros dos modelos: Qual é o número de reprodução básico, a taxa com que surgem novos casos? Quão mortal é isso? Qual é a taxa de mortalidade por infecção, a proporção de pessoas com o vírus que ele mata?
Mas não adianta tentar estabelecer números fixos, disse Natalie Dean, professora assistente de bioestatística da Universidade da Flórida.
“Devemos nos concentrar menos em encontrar a única 'verdade' e mais em estabelecer um intervalo razoável, reconhecendo que o valor verdadeiro pode variar entre as populações”, disse o Dr. Dean. “As análises bayesianas nos permitem incluir essa variabilidade de forma clara e, em seguida, propagar essa incerteza por meio do modelo.”
Uma aplicação de livro-texto do teorema de Bayes é o teste de sorologia para Covid-19, que procura a presença de anticorpos para o vírus. Todos os testes são imperfeitos e a precisão de um teste de anticorpos depende de muitos fatores, incluindo, de maneira crítica, a raridade ou prevalência da doença.
O primeiro teste de anticorpos contra SARS-CoV-2 aprovado pelo F.D.A., em abril, parecia estar errado com a mesma frequência com que estava certo. Com o teorema de Bayes, você pode calcular o que você realmente deseja saber: a probabilidade de que o resultado do teste esteja correto. Como dito em um comentário do Twitter: "Compreender o teorema de Bayes é uma questão de vida ou morte agora."
A lógica da incerteza
Joseph Blitzstein, um estatístico de Harvard, investiga a utilidade da análise bayesiana em seu popular curso “Estatística 110: Probabilidade”. Para uma cartilha, na aula um, ele diz: “Matemática é a lógica da certeza, e estatística é a lógica da incerteza. Todo mundo tem incerteza. Se você tem 100 por cento de certeza sobre tudo, há algo errado com você. ”
No final da aula quatro, ele chega ao teorema de Bayes - seu teorema favorito porque é matematicamente simples, mas conceitualmente poderoso.
“Literalmente, a prova é apenas uma linha de álgebra”, disse Blitzstein. O teorema se reduz essencialmente a uma fração; expressa a probabilidade P de algum evento A acontecer, dada a ocorrência de outro evento B.
"Ingenumente, você pensaria: quanto você poderia conseguir com isso?" Dr. Blitzstein disse. “Acontece que tem consequências incrivelmente profundas e é aplicável a quase todos os campos de investigação” - desde finanças e genética até ciências políticas e estudos históricos. A abordagem bayesiana é aplicada na análise das disparidades raciais no policiamento (na avaliação das decisões dos policiais para revistar os motoristas durante uma parada de trânsito) e nas operações de busca e resgate (a área de busca diminui à medida que novos dados são adicionados). Os cientistas cognitivos perguntam: "O cérebro é bayesiano?" Os filósofos da ciência postulam que a ciência como um todo é um processo bayesiano - assim como o senso comum.
Considere o teste de diagnóstico. Neste cenário, a configuração do teorema de Bayes pode usar eventos rotulados como "T" para um resultado de teste positivo - e "C" para a presença de anticorpos Covid-19:
Agora, suponha que a prevalência de casos seja de 10 por cento (era assim na cidade de Nova York na primavera) e você tenha um resultado positivo de um teste com precisão de 87,5 por cento de sensibilidade e 97,5 por cento de especificidade. Passando os números pelas engrenagens bayesianas, a probabilidade de que o resultado esteja correto e de que você realmente tenha anticorpos é de 79,5%. Probabilidades decentes, considerando tudo. Se você quer mais certeza, peça uma segunda opinião. E continue a ser cauteloso.
Uma colaboração internacional de pesquisadores, médicos e desenvolvedores criou outra estratégia bayesiana, combinando o resultado do teste com um questionário para produzir uma estimativa melhor se o resultado pode ser um falso negativo ou um falso positivo. A ferramenta, que ganhou dois hackathons, coleta informações contextuais: Você foi trabalhar durante o bloqueio? O que você fez para evitar pegar a Covid-19? Alguém em sua casa teve Covid-19?
“É um pouco semelhante a ter dois 'especialistas médicos'”, disse Claire Donnat, que recentemente concluiu seu doutorado em Estatística em Stanford e fazia parte da equipe. Um especialista tem acesso aos sintomas e antecedentes do paciente, o outro ao teste; os dois diagnósticos são combinados para produzir uma pontuação mais precisa e estimativas de imunidade mais confiáveis. As prioris são atualizadas com uma agregação de informações.
“À medida que novas informações chegam, atualizamos nossas prioris o tempo todo”, disse Susan Holmes, uma estatística de Stanford, através da instável internet da zona rural de Portugal, onde ela inesperadamente passou 105 dias de pandemia, enquanto visitava sua mãe.
Essa foi a base a partir da qual o Dr. Holmes refinou um artigo recente, em coautoria com o Dr. Donnat, que fornece outro exemplo de análise bayesiana, em termos gerais. Observando as primeiras pesquisas em março sobre como a pandemia pode evoluir, eles notaram que os modelos epidemiológicos clássicos tendem a usar parâmetros fixos, ou constantes, para o número de reprodutibilidade - por exemplo, com um R0 de 2,0.
Mas, na realidade, o número de reprodução depende de fatores aleatórios e incertos: cargas virais e suscetibilidade, comportamento e redes sociais, cultura e classe socioeconômica, clima, ar condicionado e outros fatores desconhecidos.
Com uma perspectiva bayesiana, a incerteza é codificada na aleatoriedade. Os pesquisadores começaram supondo que o número de reprodutibilidade tinha várias distribuições (os prioris). Em seguida, eles modelaram a incerteza usando uma variável aleatória que flutua, assumindo uma faixa de valores tão pequena quanto 0,6 e tão grande quanto 2,2 ou 3,5. Em algo semelhante a um processo de aninhamento, a própria variável aleatória tem parâmetros que flutuam aleatoriamente; e esses parâmetros também têm parâmetros aleatórios (hiperparâmetros), etc. Os efeitos se acumulam em uma "hierarquia bayesiana" - "tartarugas por todo o lado", disse Holmes.
Os efeitos de todas essas flutuações aleatórias para cima e para baixo se multiplicam, como os juros compostos. Como resultado, o estudo descobriu que o uso de variáveis aleatórias para números de reprodutibilidade prevê de forma mais realista os eventos de cauda arriscados, os eventos de superespalhamento mais raros, porém mais significativos.
Os humanos sozinhos, no entanto, sem um modelo bayesiano de bússola, são notoriamente ruins em compreender o risco individual.
“As pessoas, incluindo crianças muito pequenas, podem usar a inferência bayesiana inconscientemente”, disse Alison Gopnik, psicóloga da Universidade da Califórnia, em Berkeley. “Mas eles precisam de evidências diretas sobre a frequência dos eventos para fazer isso.”
Muitas das informações que orientam nosso comportamento no contexto da Covid-19 são probabilísticas. Por exemplo, por algumas estimativas, se você for infectado com o coronavírus, há uma chance de 1 por cento de morrer; mas, na realidade, as chances de um indivíduo podem variar em mil vezes ou mais, dependendo da idade e de outros fatores. “Para algo como uma doença, a maioria das evidências é geralmente indireta, e as pessoas são muito ruins em lidar com informações probabilísticas explícitas”, disse Gopnik.
Modelagem de Humildade
Mesmo com evidências, revisar crenças não é fácil. A comunidade científica lutou para atualizar suas prioris sobre a transmissão assintomática de Covid-19, mesmo quando surgiram evidências de que é um fator e que as máscaras são uma medida preventiva útil. Isso provavelmente contribuiu para a lenta resposta do mundo ao vírus.
“Os problemas surgem quando não atualizamos”, disse David Spiegelhalter, estatístico e presidente do Centro Winton para Comunicação de Evidências e Riscos da Universidade de Cambridge. “Você pode interpretar o viés de confirmação, e muitas das maneiras pelas quais reagimos mal, por sermos lentos demais para revisar nossas crenças.”
Existem técnicas que compensam as deficiências bayesianas. Dr. Spiegelhalter gosta de uma abordagem chamada lei de Cromwell. “É o paraíso”, disse ele. Em 1650, Oliver Cromwell, Lorde Protetor da Comunidade da Inglaterra, escreveu em uma carta à Igreja da Escócia: “Eu te suplico, nas entranhas de Cristo, pense possível que você esteja enganado”.
No mundo bayesiano, a lei de Cromwell significa que você deve sempre "mantenha um pouquinho - um pouco que seja de probabilidade, mesmo minúsculo - para o fato de que você pode estar errado", disse o Dr. Spiegelhalter. “Então, se aparecerem novas evidências que contradigam totalmente sua principal crença anterior, você pode rapidamente abandonar o que pensava antes e pular para essa nova forma de pensar.”
“Em outras palavras, mantenha a mente aberta”, disse o Dr. Spiegelhalter. “Essa é uma ideia muito poderosa. E não precisa necessariamente ser feito técnica ou formalmente; pode estar apenas no fundo da sua mente, como uma ideia. Chame isso de 'modelagem de humildade'. Você pode estar errado.”
segunda-feira, 27 de julho de 2020
Statisticians React to the News
terça-feira, 14 de julho de 2020
Atualizações na pandemia e no projeto CovidLP
terça-feira, 30 de junho de 2020
Navegar ao sabor do vírus*
Abrimos mão de controlar a pandemia e o vírus está nos levando para onde deseja
por Fernando Reinach, Professor Titular da USP
* - texto publicado no dia 27 de junho de 2020 n'O Estado de S.Paulo
terça-feira, 23 de junho de 2020
As estatística da Estatística no CNPq - parte IV
As decisões tomadas naquele Edital não desagradaram apenas à Estatística. Um abaixo assinado contendo críticas ao CA-MA (comitê da Matemática que engloba a avaliação da Estatística) foi apoiado por centenas de pesquisadores (muitos deles bolsistas do CNPq) das áreas desse comitê. Uma das maiores críticas foi a pouca relevância atribuída ao histórico profissional dos solicitantes. De fato, muitos pesquisadores experientes de todas as áreas desse comitê não tiveram seus pedidos aprovados em uma primeira instância embora alguns lograram recupera-las após a fase de recursos. Mas a quantidade de bolsas das outras áreas não sofreu perdas tão significativas quanto a Estatística.
No texto que segue, procurarei elencar possíveis explicações, à luz das informações disponíveis. Para isso, adotarei a convenção de designar as outras áreas do CA-MA como Matemática. Isso facilitará a compreensão da diferença que vem havendo com respeito à Estatística neste comitê do CNPq.
A explicação é facilitada ao tomar como base um Edital do CNPq, lançado na semana passada. Esse Edital estabelece as regras para a avaliação dos pedidos de bolsa de produtividade em pesquisa. Junto ao Edital foi disponibilizado um anexo com as regras específicas de cada Comitê de área. Em particular, o CA-MA estabeleceu uma série de parâmetros. Os mais importantes são:
- a avaliação terá 1 nota para cada pedido e essa nota é atribuida em 2 etapas;
- na nota da 1a etapa, o peso da produção científica é de 60%, o peso das orientações é 30% e o peso do projeto de pesquisa é de 10%;
- cada artigo científico é alocado a 1 de 5 grupos que são ponderados com pesos 36, 16, 5, 2 e 1 de acordo com o periódico de publicação e os livros publicados tem pesos 16 (autor) e 4 (coletânea);
- a 2a etapa terá uma análise qualitativa que pode alterar em até 30% a nota dada na etapa 1, levando em conta aspectos mais gerais de toda a história profissional do candidato à bolsa.
Proporção de periódicos de cada categoria de
avaliação
|
||||||
Área
|
G1
|
G2
|
G3
|
G4
|
G5
|
Total
|
Estatística
|
7,7%
|
3,9%
|
38,5%
|
32,7%
|
17,3%
|
100%
|
Matemática
|
9,8%
|
19,5%
|
23,9%
|
34,2%
|
13,7%
|
100%
|
- as chances de um periódico qualquer de Matemática estar na categoria superior G1 são superiores às chances de um periódico de Estatística estar nessa categoria. Voltaremos a esse ponto a seguir;
- as chances de um periódico qualquer de Matemática estar na 2a categoria G2 são 5 vezes maiores que as chances de um periódico de Estatística estar nessa categoria. Esse resultado é consequência da classificação feita pelo CA-MA. Ele expressa a percepção do comitê que enquanto 30% dos periódicos de Matemática estão nos 2 primeiros e melhores níveis, menos de 12% dos periódicos de Estatística atingem esses níveis;
- a categoria seguinte G3, que tem peso ainda menor, apresenta uma concentração bem maior de periódicos de Estatística em relação à Matemática. Isso ajuda a entender o destino do deficit de periódicos de Estatística nas 2 categoria mais relevantes pois as últimas 2 categorias apresentam proporções similares para as 2 áreas.
- o numero de periódicos de Matemática no nível G1 é 8 vezes maior e portanto o seleto grupo de periódicos de melhor nível oferece uma cesta de possibilidades de publicação muito maior para os matemáticos do que para os estatísticos.
- considero benvinda a formalização da 2a etapa dentro do Edital mas algumas reuniões recentes deste CA-MA não tiveram a participação de representantes da Estatística. Essa contextualização qualitativa fica muito difícil de ser feita por quem não é da área. Uma eventual repetição dessa ausência poderia implicar desvantagem de até 30% para estatísticos;
- vários periódicos de Estatística (e possivelmente de Matemática também) não estão na lista que consta no Edital. Quero crer que o CA-MA promoverá a classificação desses possíveis periódicos posteriormente e provavelmente, isso seria feito dentro dos mesmos critérios que levaram à classificação disponibilizada no Edital, já similar à usada no Edital anterior, que já vimos estar relacionada a um pior desempenho de uma área em relação à outra. Mas isso não foi dito no Edital, possibilitando várias outras hipóteses e aumentando a incerteza.
A solução no curto prazo para boa parte das dificuldades da Estatística é muito simples: igualdade de condições! A tabela acima e as análises feitas a seguir deixam bem claro como fazer isso. A Estatística não quer nenhum favorecimento. Mas ela também gostaria de ser reconhecida como ela é: uma área do saber diferente de outras áreas como a Matemática. A linguagem principal da Estatística ainda é a Matemática mas sua combinação com o tratamento de sua matéria prima, os dados a serem analisados, produz um campo do conhecimento fundamentalmente diverso. Além disso, elementos específicos da área e de Computação tem desempenhado um papel cada vez mais imprescindível. Boa parte do mundo desenvolvido já reconhece essa diferenciação há algum tempo: Matemática e Estatística andam juntos quando convém a ambas e separados em outra fração do tempo. Assim, é fundamental que no mínimo haja a presença de um estatístico para a adequada avaliação de projetos dessa área.
Do jeito que está, os movimentos recentes do CA-MA apontam um futuro preocupante para a pesquisa em Estatística no Brasil. Os jovens pesquisadores, que representam o futuro de qualquer área, em qualquer lugar do mundo sabem que precisam batalhar mais que os pesquisadores já estabelecidos para ter acesso a oportunidades similares. Isso é até esperado. O que fica difícil para os jovens estatísticos entenderem é que deverão perder oportunidades para outros pesquisadores igualmente (ou menos) qualificados simplesmente pelo fato de serem da Estatística. A parceria com a área de Matemática, que foi tão importante no passado para o crescimento da área de Estatística no Brasil, não parece estar tendo um efeito benéfico nesses últimos anos. O resultado poderá ser sombrio não só para a área mas também para o país, com evasão interna e externa de pesquisadores cujas formações tanto custaram. E o mais triste é isso acontecer em um momento onde a Estatística está se mostrando ser uma ferramenta fundamental para o bem estar da humanidade.
terça-feira, 16 de junho de 2020
A batalha dos dados da pandemia
- o padrão internacionalmente adotado pela vasta maioria de países ao redor do mundo é o de divulgar a cada dia os números de casos confirmados e óbitos que foram notificados naquele dia;
- tendo esses números, basta soma-los aos números acumulados anteriormente para obter os totais reportados.
terça-feira, 9 de junho de 2020
Carta Aberta ao Ministério da Saúde
terça-feira, 26 de maio de 2020
Devemos fazer previsões da pandemia?
Novamente aqui se observa a introversão de muitos estatísticos, que preferem não apresentar suas contribuições preditivas por conta da descrença na capacidade dos modelos fornecerem informação útil. Acho que existe uma razoável compreensão na sociedade da dificuldade da tarefa de previsão. Além disso, enquanto os estatísticos não ocupam o seu lugar no cenário de predição, outros profissionais menos qualificados para essa tarefa ocuparão. Finalmente, existe um grande interesse de todos por esse tipo de resultado.
Entendo que, sendo uma questão envolvendo Estatística, o estatístico tem a missão de dar sua contribuição por mais distante do ótimo que ela se situe. Ela vai provavelmente ter erros mas talvez erre menos do que boa parte das outras previsões. E recolocaria as contribuições do estatístico no lugar que elas devem ocupar: de proeminência em questões associadas a previsões na presença de incerteza.