terça-feira, 17 de março de 2020

A estatística do Coronavirus

Fonte: Christina Animashaun/Vox (baseada em material do CDC)

Finalmente, o StatPop chegou ao assunto que domina as rodas sociais e profissionais das últimas semanae e assim continuará ainda por um bom tempo. Com a chegada definitiva do Coronavirus (Covid19) ao país, não tem como não falar desse assunto. As conversas tem tido muitos aspectos e mesmo no que tange à ciência também atinge várias áreas do saber. Como de costume, focaremos em aspectos matemáticos/estatísticos dessa doença que semana passada teve seu status elevado para pandemia.    

Aproveitaremos a oportunidade para tratar simultaneamente de 2 temas: a evolução da doença e a visualização de dados. Nesse contexto, destaco aqui 2 apresentações muito bem acabadas, com roupagem atual e contendo informação relevante e contextualizada. Acho que essas cumprem bem o papel de informar e de nos ensinar como apresentar dados e fórmulas de uma maneira inclusiva, por atrair mais que repelir os espectadores, especialmente os leigos. Com certeza, há muitas outras igualmente eloquentes e elucidativas mas essas foram as que cruzaram meu caminho no mundo da internet.

A primeira é denominada Crescimento Exponencial e Epidemia e pode ser visualizada aqui. Ela cumpre exatamente a missão de relacionar os conceitos matemáticos relevantes com a ilustração prática em termos da epidemia em questão no momento. A segunda tem uma formatação menos ambiciosa e é mais voltada para análises propriamente ditas dos dados. Tanto quanto pude perceber ela não tem nem um título propriamente dito e pode ser visualizada aqui. As análises feitas são mais descritivas e menos dependentes de teoria mas nem por isso são menos eficazes em passar a mensagem. No caso, a mensagem era muito mais de contextualizar a pandemia atual com outras que ocorreram na história recente da humanidade.

Ambas as apresentações são muito bem acabadas e ilustradas e até acompanhadas e trilha sonora. O mais importante de ambas as apresentações é a forma de aprestação gráfica não só dos gráficos das evoluções temporais como de gráficos de outras naturezas. A forma dinâmica como os gráficos e os textos nele contidos se ajustam a todo instante para o assunto que se deseja destacar é exemplar. Ela não é uma exclusividade dessas apresentações. Várias apresentações disponibilizadas diariamente na internet seguem esse mesmo padrão. Essa formatação representa uma nova forma de reportar dados, viabilizada pela tecnologia atual.

Outra mídia que vem recebendo muita visibilidade, possivelmente pela sua veiculação no New York Times é a figura animada acima, obtida aqui. Existe um dito popular que fala "um gráfico vale por mil palavras". Se isso é verdade, então podemos extrapolar para um gráfico animado valeria por um milhão de palavras. O texto que acompanha a figura também é elucidativo mas queria aqui enfatizar mais uma vez a força da animação ou do dinamismo na facilitação da passagem de informação. 

Em contraste com essas formas, apresento também um texto recente produzido por uma consultoria japonesa, que pode ser lido aqui. Esse texto, escrito ainda no formato usual (do StatPop, por exemplo), contem dados apresentados em algumas tabelas e alguns gráficos simples e estáticos. Ele é voltado para o estudo da hipótese que muitos tem levantado de ligação entre temperatura e incidência da doença. Até ai tudo bem. O texto pode ser útil mesmo sem ter uma roupagem menos atual mas deve principalmente ter conteúdo relevante.

No entanto, acho que existem algumas questões técnicas mal explicadas ou mal descritas ou ambas. O textos apresenta contagens de regiões do Japão e do planeta sem fazer a padronização pela respectivas contagens da população em risco ou ao menos da população total da região. Assim sendo, fica muito difícil fazer comparações entre populações tão distintas como as consideradas. Além disso, ele desconsidera a incerteza muito maior (proporcionalmente) associada à contagens de populações menores. Isso torna praticamente inútil muitas das comparações feitas no texto. Além disso, ele compara a evolução da doença utilizando apenas a janela de 3 a 8 de março, sem comparar com outras janelas. Esse cuidado foi tomado na 1a apresentação, permitindo verificar com muito mais embasamento que o crescimento exponencial é efetivamente uma boa descrição do estágio atual da doença no mundo.

Vale informar que já existe intensa atividade científica envolvendo estudo de casos, especialmente na cidade de Wuhan, onde começou a doença, na China e no resto do mundo. Um dos primeiros artigos publicados sobre o assunto apareceu no início do ano na prestigiosa revista científica Lancet. Esse artigo, que pode ser visualizado aqui, propõe um modelo relativamente elaborado, que depende de uma série de parâmetros, que são especificados ou estimados de forma relativamente arbitrária e o artigo não deixa claro qual o impacto nos resultados se eles estiverem mal especificados. Muito estudo ainda será feito nos próximos meses e anos sobre os dados sendo gerados ao longo do mundo nos diferentes países. 

Finalmente, esta postagem termina fazendo referência a uma das figuras mais enviadas pela internet nos últimos dias e talvez a mais relevante para caracterizar essa epidemia. Por isso, ela pode e deve ser repetida à exaustão e por isso serviu de abertura para esta postagem (uma das várias versões a partir de figuras similares divulgadas pelo CDC). A pandemia chegou aqui e irá atingir o Brasil de forma expressiva. Podemos e devemos tentar diminuir a taxa de infecção e com isso mitigar ou ao menos retardar seus efeitos. Um país com tantas deficiências em seu sistema hospitalar não pode se dar ao luxo de abrir mão de medidas profiláticas simples ao alcance de todos, como constante lavagem das mãos, evitar qualquer tipo de contato físico entre pessoas e confinamento. 

Nenhum comentário:

Postar um comentário