terça-feira, 4 de julho de 2017

Os números do jogo

 www.penguin.co.uk/books/187604/the-numbers-game/

O título desta postagem é a tradução do título The Numbers Game, livro que Chris Anderson e David Sally publicaram em 2013 pela editora Penguin. Vale a pena começar falando do título, cuja tradução mais apropriada na minha opinião seria o Jogo dos Números ao invés de Os Números do Jogo. A primeira seria uma espécie de brincadeira com as palavras ao passo que o título escolhido pela tradução é uma visão mais explícita do que o livro trata. Antes de tratar disso, que é o que interessa, vale a pena falar do sub-título Why Everything You Know About Football is Wrong, corretamente traduzido na versão em português como Por que Tudo o que Você Sabe sobre Futebol Está Errado

Embora eu concorde com a tradução, eu não concordo com o sub-título. Claro que temos que descontar um interesse (da editora?) por um maior apelo publicitário. Claro que sabemos que muita gente tem uma idéia equivocada e/ou romântica sobre o futebol, como objeto de paixão de mihões de pessoas mundo afora. Mas o próprio livro trata de elencar um sem número de esforços realizados por uma grande quantidade de pessoas que entende o futebol do mesmo jeito correto que os autores entendem ter.

E que jeito é esse? O título não deixa dúvidas quanto à resposta para essa pergunta. É claro que os autores acham que o jeito certo de entender futebol é inevitavelmente ligados aos números a ele associados. E essa é basicamente a tese central do livro: para se entender o que faz com que um time ganhe, um jogador custe tanto, ou um técnico seja bem sucedido não existe nenhuma outra opção a não ser recorrer aos números. Antes de falar um pouco sobre o conteúdo do livro, vale destacar que o livro é um reflexo da atuação profissional dos seus autores, como se depreende do site da empresa que eles possuem.

O livro estuda vários aspectos relacionados ao futebol, sempre apoiado em dados. Esses aspectos foram estruturados no livro em grupos de capítulos. Tem o grupo que estuda efeitos (relevância) dos jogadores nos resultados das partidas e dos campeonatos. Nesse grupo há um interessante estudo tratando tanto do efeito dos goleadores quanto dos melhores jogadores de cada time mas também do pior jogador de cada time. Outro grupo de capítulos trata do efeito dos treinadores sobre o desempenho de um time (quão importante é o efeito de um treinador no desempenho de um time?). Outro grupo trata do efeito da forma de atuar de um time sobre o seu resultado (ter maior posse de bola garante melhor resultado?)

O que me agradou no livro foi o cuidado com as análises de dados lá feitas e apresentadas. A grande maioria delas são muito simples do ponto de vista técnico: análises descritivas, modelos de regressão simples e cálculo de correlações. O mérito maior é na forma que elas foram utilizadas; para se poder entender o efeito de uma variável em outra variável é fundamental controlar para os efeitos das outras variáveis relevantes para não haver confundimento. Isso é fácil falar mas difícil de incorporar nas análises. Mas esse cuidado é imprescindível e o livro mostra com maestria como fazer isso em cada situação estudada. As análises do livro foram apoiadas em muitos estudos já realizados e também em vários bancos de dados atualmente disponíveis. Os autores demonstram conhecer à exaustão ambos os assuntos supracitados.

Esse livro não é o único que alia estatística ao futebol mas já se tornou uma das maiores referências do mundo sobre o assunto mesmo após poucos anos de lançamento. Tive a oportunidade de ler o livro recentemente e foi um prazer lê-lo. Trata-se de um leitura muito interessante para as pessoas que gostam de estatística e de futebol, entre os quais me incluo. Mas mais geralmente, ele é uma referência útil para todos aqueles com interesse em aprender como dissecar um assunto sob a ótica da análise de dados.

terça-feira, 27 de junho de 2017

Ciência procura o público - parte II

 https://peercommunityin.org/

A postagem da semana passada tratou de aproximação da Ciência com um público mais geral. A experiência lá reportada tratava de uma iniciativa bastante específica e de âmbito de alcance bastante limitado. Afinal, lidava apenas com os artigos publicados em um específico periódico de Estatística, o Journal of the Royal Statistical Society Series B. Isso naturalmente limita o escopo da iniciativa. Além disso, ela cuida de comentários técnicos associados a esses artigos científicos, o que limita o escopo dos possíveis comentaristas e também dos possíveis interessados nesses comentários. Apesar dessas limitações, é uma proposta muito boa por amplificar a discussão em torno das novidades publicadas nesse meio de divulgação científica.

Essa iniciativa está longe de ser a única forma de aproximação da Ciência em termos de formato, escopo e abrangência. Uma outra forma que está sendo tentada é o projeto Peer Community in ... Trata-se de um projeto sem fins lucrativos que tem como objetivo a discussão de artigos científicos de uma dada área do saber. Nesse projeto, pesquisadores se cadastram e publicam comentários sobre trabalhos científicos já publicados ou não. A primeira área contemplada é Biologia Evolutiva (Evolutionary Biology) e já tem 300 contribuintes (ou recomendadores, como o projeto prefere chamá-los) cadastrados. Trata-se de um projeto em construção e em busca de colaboradores para abrirem versões em outra áreas. Entre as áreas sugeridas pelos seus autores destaca-se Estatística Computacional.

Uma iniciativa similar no sentido de divulgação de trabalhos científicos mas mais restrita em escopo e abrangência é o projeto ArXiv, sediado na Universidade de Cornell. Esse projeto permite a inclusão de artigos antes de eles serem publicados por algum periódico em uma serie de áreas da Ciência, mais concentradas nas Ciências Exatas. Esse instrumento permite a disseminação de textos científicos antes mesmo de sua publicação, isto é, antes de serem validados por algum processo de verificação. Ele também é uma iniciativa bem sucedida mas perde um pouco pela ausência de interação. De todos modos, tem sido uma fonte útil de discussão para autores divulgarem seus trabalhos e avaliarem de acordo com o feedback recebido se algum ajuste precisa ser feito antes de formalizarem pedidos de publicação.

Todos esses projetos tem uma estruturação administrativa bastante organizada com comitês de assessoramento contendo profissionais (geralmente pesquisadores) distribuídos por diversas partes do mundo, mas com uma óbvia concentração em países do mundo desenvolvido. Acho que essas inciativas tem potencial de disseminação da discussão em uma dimensão que fica difícil antecipar e podem servir como uma nova e mais eficaz forma de interação da Ciência com a sociedade.

terça-feira, 20 de junho de 2017

Ciência procura o público - parte I

 https://seriesblog.net/

O crescimento sem precedente da disseminação de informação que estamos presenciando nos dias de hoje vem afetando todas as áreas. Chefes de estado tem rotineiramente recorrido às redes sociais para divulgar seus pontos de vista sobre os mais diferentes temas. Instituições dos mais diferentes setores da sociedade fazem o mesmo, desde empresas privadas até organizações não-governamentais sem fins lucrativos.   

A Ciência não poderia ficar à margem desse processo. Afinal, foi nela que os avanços necessários para esse estado de coisas foram desenvolvidos. O problema é a forma como esse processo pode ser conciliado com a forma como a Ciência é divulgada. Como todos sabemos, a Ciência trata do avanço do conhecimento da humanidade sobre os fenômenos a ela associados. Esses avanços podem ser divulgados (ou tornados públicos) de diversas formas. As formas mais comuns são palestras, livros e prioritariamente artigos científicos.

A divulgação de artigos científicos é processada em anais de congressos e periódicos científicos. Na grande maioria dos casos, a simples elaboração de um artigo está longe de ser a etapa final desse processo. Para garantir a autenticidade das descobertas, todo artigo é submetido a uma bateria de verificações, coordenadas pelo corpo editorial do congresso ou periódico e envolvendo invariavelmente a avaliação por pares (ou peer review), isto é, por pesquisadores conhecedores do assunto tratado no artigo. 

Esse processo de depuração é fundamental para garantir a autenticidade das descobertas e permitir uma avaliação mais precisa da relevância dessas descobertas. Esse sistema foi desenvolvido ao longo de décadas e séculos de avanço científico e levou a um sistema muito estruturado de divulgação. Assim, não chega a surpreender que o resultado de todo esse sistema seja um conjunto de textos de difícil compreensão para o público em geral e muitas vezes até mesmo para pesquisadores da área que não sejam especialistas no assunto.   

Um pequeno passo nessa direção acaba de ser dado por um dos mais importantes e influentes periódicos de Estatística, o Journal of the Royal Statistical Society, Series B (methodological), já mencionado aqui. [Postagem aqui veiculada evidencia ser esse o principal periódico da área.] Esse periódico tem uma longa tradição de divulgar a principais inovações da Estatística, destacando os artigos mais relevantes para publicação com discussão por importantes pesquisadores ligados ao assunto. Essa discussão enriquece muito a compreensão dos avanços propostos no artigo e as vezes são mais interessantes que o próprio artigo.

A novidade trazida agora pelo JRSSB (ou Series B, como tb é conhecido) é a criação de um blog próprio, o Series B'log. Esse blog, cuja página inicial é destacada acima, é destinado à discussão pública dos artigos publicados pelo periódico, estendendo a discussão que já vem sendo publicada para além das páginas impressas do periódico. O blog é moderado com um experiente pesquisador que já foi editor chefe do periódico na década passada.

Uma inspeção nas contribuições ao blog dá uma bela mostra do alto nível das discussões que podem lá ser encontradas. Elas fornecem uma ferramenta muito útil para contextualizar as contribuições da Series B e podem contribuir para a melhor compreensão dos avanços nele propostos. Trata-se de uma iniciativa inovadora de um periódico que se mantém à frente da inovação científica em Estatística.

É ainda cedo para avaliar os efeitos que esse blog trará mas trata-se de iniciativa que deve ser acompanhada por todos interessados no maior avanço possível da Estatística. Iniciativa similares em outras áreas serão oportunamente comentadas aqui.

terça-feira, 13 de junho de 2017

Pilar Iglesias



https://bayesian.org/

A última edição do Congresso Bayesiano da América Latina (COBAL) acaba de ocorrer no México no início deste mês de junho de 2017. A organização do evento coletou contribuições em videos sobre a homenageada do evento, a Profa. Pilar Iglesias. Pilar foi uma importante pesquisadora chilena que faleceu em 2007 (Para saber um pouco sobre Pilar, leia aqui). Embora eu não tenha podido participar desta edição do COBAL, minha contribuição foi solicitada pela organização. Abaixo, transcrevo o texto do vídeo que enviei...
 
Bom dia a todos. 

É com muito prazer que trago minha contribuição para o COBAL, que não pude participar, para falar um pouco de nossa amiga Pilar. 

Conheci Pilar no início dos anos 90. Creio que foi em um dos primeiros Encontros Brasileiros de Estatística Bayesiana. E já no início de nosso conhecimento se pode ver que era uma pessoal muito especial. Sempre muito contente, feliz, sorrindo o tempo todo. E sempre com muita vontade de interagir com todos, de todas as maneiras possíveis. Um pouco depois, fui convidado para fazer parte da banca avaliadora de sua defesa de tese de doutorado. E ai pude conhecer um pouco mais da Pilar como pesquisadora de Estatística. E fiquei muito impressionado com a vitalidade e a profundidade dos temas nos quais ela trabalhou na sua tese. 

Bom, depois a Pilar se tornou doutora, trabalhou um pouco como professora no Brasil e voltou para o Chile. E sempre mantivemos nosso contato a partir daí em encontros científicos de Estatística. Me lembro de forma saudosa de nosso encontro do World Meeting do ISBA de 2004, onde tive a honra de proferir a conferência de abertura do evento. Acredito que a mão de Pilar esteve por trás desse convite, que foi uma grande honra de minha vida profissional. Naquele momento, Pilar já era uma personalidade importante não somente no Chile ou na América Latina como no mundo de pesquisa em Estatística. 

Pouco depois, não lembro bem da data, tive conhecimento de sua enfermidade e tivemos a oportunidade de fazer um convite para que Pilar viesse ao Brasil mais uma vez para o encontro Bayesiano que organizamos em Búzios, para o qual Pilar foi convidada para proferir uma conferência convidada. Creio que foi uma das últimas, senão a última, conferência que ela participou fora do Chile em sua vida.

Assim, estou muito contente de ter participado de todas essas etapas e presto minha homenagem, minha pequena homenagem, a Pilar nesse momento no idioma que creio que é o idioma preferido de Pilar: o portunhol.

terça-feira, 6 de junho de 2017

Palestras virtuais

Fonte: Nascimento, Gamerman & Lopes (2016)


A entrada da internet na vida da sociedade provocou uma mudança sem volta na forma que a humanidade passou a se comunicar. Esse processo está longe de estar encerrado mas já deixou marcas permanentes. Podemos hoje falar com e ver nossos interlocutores em qualquer parte do planeta. Obviamente isso tem impacto nas nossas atividades profissionais.

A ciência não podia ficar à parte desse processo. Muito pelo contrário, deveria estar à frente dele. Reuniões de trabalho para discutir projetos de pesquisa tem sido rotineiramente feitas ao redor do mundo. O mesmo vale para palestras e conferências. É claro que o assunto não é livre de polêmica; contato presencial continua sendo a melhor opção mas em situações onde ele é inviável, contatos virtuais constituem uma ótima opção substituta. Essa alternativa é particularmente relevante em cenários onde recursos são escassos, como a atual situação pela qual o Brasil está passando.

É dentro desse espírito que se insere a recente iniciativa do Departamento de Estatística da Universidade Federal da Bahia (UFBA). Esse tradicional departamento possui já há muitos anos um ciclo de palestras onde professores de diferentes instituições apresentam seus trabalhos de pesquisa. Eu mesmo já tive o prazer de participar desse ciclo em algumas oportunidades no passado. Entretanto, a situação econômica das universidades tem dificultado a concretização desse tipo de atividade, especialmente para aquelas distantes de outros centros. 

A solução adotada pela UFBA foi promover o seu ciclo de palestras de Estatística no formato virtual. Tive o prazer de fazer a apresentação inaugural do desse novo formato na última sexta feira, dia 02 de junho de 2017. Na realidade, hove uma série de palestras anteriores à minha dentro desse formato mas resolveram me apresentar como palestrante inaugural, uma distinção que muito me honrou. Minha palestra versou sobre análise de valores extremos e suas aplicações em finanças. A figura acima fez parte da apresentação e fornece uma ilustração sobre os resultados dessa análise e a identificação de períodos de crise/turbulência no mercado, através de indicadores estatísticos.

Houve alguns pequenos problemas na atividade, em parte associados à minha inexperiência nesse novo formato e em outra parte com alguns problemas técnicos com a transmissão também não ajudaram. A que mais lamento é a janela com a minha imagem ter ficado concentrada na parte da tela que não foi projetada e não ter sido podido que eu fosse visto pelas platéias virtual e presencial. Mas o arquivo com a projeção da apresentação pode ser visto, assim como eu pude ser ouvido com perfeição. Ao final, também pude ouvir e responder perguntas das platéias.

No cômputo geral, considero a experiência bem sucedida e acredito ser um exemplo a seguir seguido por vários outros departamentos de Estatística e de outras áreas pelo Brasil. Parabenizo o Departamento de Estatística da UFBA e os professores Bruno Ramos dos Santos e Lizandra Castilho Fabio, organizadores do ciclo. Claro que palestras na forma presencial são insubstituíveis mas, caso isso não seja possível, a forma virtual é uma boa alternativa. Além disso, mesmo com a forma presencial sendo possível, sempre haverão pessoas que não poderão estar presentes e que poderiam se beneficiar desse tipo de iniciativa, com salutar conotação de inclusão social.

Para ver a palestra em questão, clique aqui

terça-feira, 30 de maio de 2017

Dia do Estatístico 2017

 http://www.ufjf.br/bigdata

Como já dissemos aqui antes, o dia 29 de maio é a data escolhida para comemorar o Dia do Estatístico no Brasil. Essa é a data de fundação do Instituto Brasileiro de Geografia e Estatística (IBGE). Não surpreende que a data sirva também para comemorar o Dia do Geógrafo. [O momento não é dos mais apropriados para comemoração pelo IBGE pois a instituição está há alguns dias sem o seu presidente, que foi deslocado pelo governo federal para assumir o BNDES.]

Ao longo do país, vários eventos aconteceram ontem para marcar a data e comemorar o dia. Essas manifestações ocorreram principalmente em instituições acadêmicas. Mas algumas entidades de classe como Conselhos Regionais e Federal e também outros instituições onde Estatística é empregada de forma mais constante.  

Pode-se notar nas programações desses eventos uma preocupação crescente ao longo dos anos de aproximar a vida acadêmica de pesquisa e investigação com uma maior inserção no mercado de trabalho. Assim, pesquisadores estão falando não mais de seus específicos projetos de pesquisa mas contextualizando-os dentro do panorama mais amplo da utilização dessa ferramenta no mercado de trabalho.

Além disso, pode se notar ainda que de forma incipiente um maior interesse em temas na ordem do dia da Estatística no mundo mas pouco tratados no Brasil. Especial atenção vem sendo dada aos temas atuais de Big Data e Data Science. Para se ter uma idéia, o Departamento de Estatística da Universidade Federal de Juiz de Fora vai organizar um workshop sobre o assunto na próxima semana. As inscrições já se esgotaram com mais de uma semana de antecedência.  

Esse movimento é muito saudável e cumpre a missão de aproximar a academia com o mercado de trabalho, que ainda estão situados muito distante um do outro. Tomara que esse movimento só se intensifique.

A programação de uma amostra de instituições de diferentes regiões do país é listada abaixo:





terça-feira, 23 de maio de 2017

Pensamento crítico e alfabetização estatística são a resposta para uma era de pós-verdades*

www.rss.org.uk

por Hetan Shah, UK Statistics Authority e diretor executivo da Royal Statistical Society (RSS)


Estamos aparentemente em um mundo de pós-verdades. A eleição do Presidente Trump através da lagoa (NT: referência jocosa ao Oceano Atlântico) e a campanha do referendo da UE convenceram muitos de que a verdade está sob ataque de uma forma nunca antes vista. O que isso tudo significa para a campanha para a inesperada eleitoral geral em que estamos agora?

O Comitê de Cultura, Meios de Comunicação e Esportes da Câmara dos Comuns estava preocupado o suficiente para ter aberto um inquérito sobre "notícias falsas". No entanto, como sabem os estatísticos, este não é um fenômeno novo: propaganda de diferentes formatos são perigos sempre presentes na política. A preocupação da Royal Statistical Society sobre como melhorar o uso de fatos e evidências no debate público começou bem antes do interesse recente por esse problema.

O debate no período que antecedeu o referendo da UE conduziu particularmente a preocupações de que estamos numa era de pós-verdades. A reivindicação pela campanha da licença que nós pagamos 350 milhões de libras por semana à UE, que a autoridade independente de estatísticas britânica chamou de enganosa, tornou-se emblemática para a política de pós-verdades. 

Mas o referendo é mais bem entendido como um caso especial, ao invés de representativo da vida diária no Reino Unido. Os referendos estão sujeitos a uma regulação mais fraca do que as eleições e as campanhas não estão concorrendo para eleição, onde o eleitorado pode cobra-los depois. Talvez por ambas as razões, a campanha de referendo da UE deixou 52 por cento dos eleitores sentindo que ela não foi conduzida de forma "justa e equilibrada". 

Uma coisa que é nova, é claro, é a mídia social, que tem tido muita culpa pelo fenômeno pós-verdade. Em particular, plataformas como o Facebook tornaram muito rentável a invenção de notícias. 

Isso tem se mostrado irresistível para pessoas sem particular interesse no conteúdo das histórias que escrevem além do fato de elas serem lucrativas. Adolescentes macedônios, por exemplo, que construíram sites de notícias pro-Trump ganharam US$ 1.000 por mês em um país com um salário médio mensal de US$ 371.

Mas notícias falsas não tem nada de novo. Em 1835 um jornal americano publicou uma história em que um astrônomo dizia ter encontrado vida na lua. A história se tornou 'viral' e dentro de um mês estava sendo publicada na Europa. Os jornais lucraram com manchetes que hoje chamaríamos de "clickbait" (NT: conteúdo com interesse principal em geração de receita). Essas estruturas de incentivo são reconhecíveis nas mídias sociais de hoje.

As mídias sociais também são culpadas por criar câmaras de eco onde ouvimos apenas as nossas opiniões pré-existentes repetidas para nós. Isso poderia nos tornar mais crédulos de histórias que não são baseadas em fatos. No entanto, sempre tivemos nossas câmaras de eco no mundo analógico. Afinal, o Guardian e o Daily Mail falam para seus próprios públicos.

Assim, as notícias pós-verdade e falsas são menos novas do que as primeiras poderiam parecer. Já não havia era de verdade antes da pós-verdade. Mas isso não quer dizer que não há problema.

O que pode ser feito para melhorar o uso dos fatos nessa eleição? Os gigantes das mídias sociais têm claramente um papel a desempenhar. Eles têm sido relutantes, mas estão começando a lidar com a questão. Fundamentalmente, eles estão concordando que tornaram-se tão poderosos que não são apenas plataformas, mas editores, e, portanto, têm alguma função editorial.

Facebook começou a sinalizar histórias que são contestadas por verificações factuais. O Google parou o fluxo de receita proveniente de anúncios em alguns sites de notícias falsas. A Alemanha está desenvolvendo leis para multar redes sociais que não eliminem notícias falsas. Isso pode funcionar quando é claro o que é verdadeiro e o que é falso, mas provavelmente também irá criar muitos casos na fronteira.

Os acadêmicos podem desempenhar um papel importante na obtenção dos fatos nessa eleição, mas poucos tendem a fazê-lo com sucesso. Você precisa estar preparado para colocar a cabeça acima do parapeito, responder em tempo hábil, falar uma língua que as pessoas entendam, e não ir além de sua experiência. É um equilíbrio complicado, mas extremamente gratificante.

Verificadores independentes podem ajudar. Mas eles sofrem um problema de free-rider (NT: provedores de conteúdos gratuitos): todo mundo gosta da idéia, mas ninguém quer pagar pelo que eles fornecem. Fundações e filantropos precisam intervir e colocar dinheiro para apoiar a iniciativa. É bom ver que a BBC criou sua própria equipe interna de verificação de realismo.
 

E, no entanto, até os fatos em si mesmos não são suficientes. Há preocupações que dizer às pessoas os fatos podem apenas reforçar suas opiniões pré-existentes; o chamado "efeito de retrocesso". Uma nova pesquisa promissora por Sander van der Linden e colegas sugere, no entanto, que podemos vacinar o público contra a desinformação, fornecendo informações sobre os métodos através dos quais os fatos são obscurecidos ou negados ao lado de dar os fatos propriamente ditos. 

Em última análise, precisamos de um cidadão que tenha acesso a ferramentas de auto-defesa contra a pós-verdades e que se preocupam com a qualidade das notícias que consome. As sociedades mais esclarecidas têm um papel a desempenhar para alcançar além das suas audiências tradicionais. Por exemplo, o RSS desenvolveu treinamento estatístico gratuito para jornalistas e políticos para ajudar a melhorar o debate. Também organizamos debates públicos sobre questões sociais fundamentais, tais como "os fatos sobre a migração". 

Devemos explorar novas formas de promover o pensamento crítico, alfabetização estatística e uma mentalidade curiosa entre as pessoas jovens e velhas. Como é frequentemente o caso, as correções técnicas e políticas só podem nos levar até um certo ponto; educação é a única resposta sustentável a esta importante questão social.

============================
* - Texto publicado no mais recente boletim da Royal Statistical Society. Uma versão desse texto apareceu em Research Fortnight and Research Professional.

terça-feira, 16 de maio de 2017

Pint of Science

https://pintofscience.com/

Pint of Science é uma iniciativa mundial que terá eventos ocorrendo este ano em 11 países, incluindo o Brasil. Trata-se de um evento multidimensional com caráter eclético de divulgação da Ciência de uma forma informal para o publico em geral. Segundo a sucinta descrição do site do evento trata-se de "um festival que traz cientistas para seu bar local para discutirem suas mais recentes pesquisas e descobertas com você. Essa é sua chance de encontrar as pessoas responsáveis pelo futuro da Ciência."

O nome Pint of Science refere-se à medida de volume líquido usada no Reino Unido para servir cerveja. 1 pint é aproximadamente igual a 573 mililitros. Assim, o nome procura fazer a ligação entre Pint of Beer (medida mais usada para quantificar a quantidade de cerveja servida em pubs britânicos), coloquialmente referida como uma pint, para representar a idéia de consumir ciência em um ambiente descontraído ao invés de (ou em conjunto com) consumir cerveja. 
   
Assim, é um evento caracterizado como festival, que está acontecendo em várias cidades dos países realizadores e tem atividades concentradas no período da noite. O evento tem duração de 3 dias, começou ontem (15 de maio) e prosegue até amanhã (17 de maio). No Brasil, o festival terá atividades em 22 cidades, sendo 10 delas no estado de São Paulo. O evento no Brasil é patrocinado por uma variedade de instituições com grande maioria de universidades públicas mas incluindo algumas organizações não-governamentais.

A programação completa da versão brasileira pode ser vista aqui. Apesar da Matemática estar presente em muitas cidades pelo país, a Estatística tem uma participação mais discreta, praticamente toda concentrada em Natal e São Carlos. Recomendo a visita para quem tiver a oportunidade de estar em alguma das cidades onde o festival acontecerá.

terça-feira, 9 de maio de 2017

Elon Lages Lima

www.abc.org.br/~elima

Faleceu anteontem (07 de maio de 2017) o matemático Elon Lages Lima. Elon foi um dos nomes mais importantes na história da Matemática brasileira. Um resumo da descrição da contribuição será dado a seguir. Mas queria aproveitar o momento para prestar a ele um tributo falando da contribuição de Elon para minha formação profissional.

Meu primeiro contato com o Elon se confunde com meu primeiro contato com o IMPA (Instituto de Matemática Pura e Aplicada, que ele dirigia à época. Eu era um simples aluno de graduação, desconhecido de todos, fazendo minha primeira incursão no mundo da pós-graduação. Mesmo assim, já tive contato com ele. Elon era a personificação da instituição que dirigia, emprestando a imagem de comprometimento com a qualidade acima de tudo.

Essa visão me encantou e eu acabei permanecendo como aluno do IMPA por vários anos, inicialmente até terminar minha graduação e posteriormente para completar meu mestrado. Sempre encontrando com Elon e sempre tendo palavras de incentivo. Lembro de uma carona que deu a mim e outros alunos no carro do IMPA para voltar do Colóquio, então realizado em Poços de Caldas. Guardo ainda na memória os casos que ele foi nos brindando ao longo da viagem, que passou muita rápida com esse entretenimento. Após esse período, segui para meu doutorado no exterior e novamente nossos caminhos se cruzaram. Elon foi passar seu ano sabático na mesma universidade e novamente retomamos contato.

Lembro de uma noite que ele me convidou para jantar na sua casa. Eu estava no início do meu trabalho, naquela fase frustrante onde você tenta várias coisas que não dão certo. Expus isso a ele e ele insistiu que eu estava lá para completar meu doutorado e voltar ao país. Em um momento indelicado do qual me arrependo, eu lhe disse que não tinha essa obrigação (o que eu hoje discordo!). Ele teve paciência para me ouvir e relevar aquela insolência da juventude. Alguns anos atrás, houve uma cerimônia em homenagem a ele e tive a oportunidade de me desculpar com ele por essa impertinência. Elegantemente como de costume, ele não deu muita importância ao fato e prontamente aceitou meu pedido de desculpas.

Elon tinha uma proeminência rara no mundo da Ciência e, na minha opinião, foi fundamental para a desenvoltura que o IMPA estabeleceu, com reflexos claros para toda a Matemática brasileira.

O site da Sociedade Brasileira de Matemática apresenta um outro depoimento muito mais eloquente do que eu seria capaz de escrever.

Finalmente, concluo esta postagem com o texto abaixo, extraído do site do IMPA, que faz um apanhado geral da contribuição profissional do Elon para a Matemática.

"Um dos mais importantes e prolíficos autores de livros de matemática no país, Elon Lages Lima, ex-diretor do IMPA (Instituto de Matemática Pura e Aplicada), morreu na manhã deste domingo [07 de maio de 2017], aos 87 anos, no Rio de Janeiro.

Matemático de ponta, o alagoano Elon deu contribuição fundamental à literatura matemática brasileira, com mais de 40 livros, e recebeu duas vezes o Prêmio Jabuti de Ciências Exatas, da Câmara Brasileira do Livro. Ele também desempenhou o papel de mentor e inspirador de jovens matemáticos de grande destaque no país, como o ganhador da Medalha Fields Artur Avila, Carlos Gustavo Moreira, o Gugu (ambos do IMPA), Ralph Teixeira (UFF) e Nicolau Saldanha (PUC-Rio), entre outros.

“Eu era aluno de graduação, em Portugal, quando ouvi falar de Elon pela primeira vez, por meio de seus livros. Ninguém, nos dois países, contribuiu como ele para a criação de uma literatura matemática em língua portuguesa”, afirmou o diretor-geral do IMPA, Marcelo Viana. Para o ex-diretor do IMPA Jacob Palis, Elon “foi um excelente matemático, escritor e didata”. “Ele deu uma contribuição muito grande ao IMPA, desde o início, integrando um grupo pequeno e de alta qualidade.”

Membro titular da Academia Brasileira de Ciências desde 1963, foi diretor do IMPA em três períodos (1969-71, 79-80 e 1989-93), presidente da Sociedade Brasileira de Matemática (1973-75) e integrou o Conselho Nacional de Educação e o Conselho Superior da Faperj. Recebeu a Ordem do Mérito Científico na Classe Grã-Cruz, da Presidência da República, e o Prêmio Anísio Teixeira, do MEC.

O jovem Elon fez sua formação inicial no Ceará e no Rio de Janeiro. Ao chegar ao Rio, presenciou a fundação do IMPA, por Leopoldo Nachbin e Maurício Matos Peixoto. Obteve os graus de mestrado e doutorado na prestigiosa Universidade de Chicago, onde especializou-se em Topologia Algébrica, entre 1954 e 1958, e recebeu o Prêmio Edna M. Allen.

Após voltar ao Brasil, tornou-se pesquisador do IMPA. Com uma bolsa Guggenheim, esteve em Princeton e Columbia e foi influenciado pelo norte-americano Stephen Smale, ganhador da medalha Fields. Nessa época, obteve resultados pioneiros no campo de vetores comutativos. Foi professor da UnB, de onde pediu demissão em 1965, após o início do Regime Militar. Foi Elon que abriu o caminho para outros pesquisadores do IMPA, como Jacob Palis e César Camacho, serem orientados por Smale – hoje pesquisador honorário do IMPA.

Além de pesquisador de alto nível, Elon sempre compreendeu a importância da divulgação da Matemática e da formação de professores, áreas em que desempenhou um papel de protagonista nacional. Colaborou para estruturar os cursos de licenciatura, bacharelado e pós-graduação Universidade Federal do Ceará, de onde recebeu, em 89, o título de Professor Honoris Causa. Ele também era doutor Honoris Causa da Universidade Federal de Alagoas.

Idealizou e dirigiu as coleções “Projeto Euclides” e “Coleção Matemática Universitária” e foi o criador, em 1990, do PAPMEM (Programa de Formação e Aperfeiçoamento de Professores do Ensino Médio), que continua ativo e já beneficiou mais de 20 mil professores do país. Talvez porque tenha sido justamente na Educação Básica o início de sua brilhante trajetória de matemático, como professor, aos 18 anos, no Ginásio Farias Brito e no Colégio Estadual do Ceará."

terça-feira, 2 de maio de 2017

Crise da Estatística?

www.theguardian.com

O crescimento da Estatística ao longo do século passado sempre foi acompanhado de críticas por parte da sociedade. É célebre a anedota do indivíduo que tem a cabeça no congelador e os pés no forno e que portanto tem a temperatura média normal, segundo a Estatística. Esse ponto foi tratado aqui em postagem recente. Ela é a materialização da expressão "mentiras, mentiras malditas e Estatística" atribuída a Benjamim Disraeli, importante político britânico do século XIX.

Apesar de toda essa carga negativa, a Estatística cresceu e floresceu. Ela cresceu pois se mostrou imprescindível para correta caracterização de fenômenos e estudos científicos. Nesse crescimento, ela acabou se tornando um padrão para caracterização de aspectos quantificáveis de fenômenos e teve sua relevância muito pouco questionada, mesmo se indesejada. E isso aconteceu em todas as áreas do saber.

O que esse século parece estar apresentando em seu início são tentativas difusas de ressuscitar esse questionamento. Paralelamente, estamos vendo crescer com muita força uma onda de redescoberta da Estatística, onda essa ligada à disponibilização e consequentemente interesse em utilização de grandes massas de dados. Esse ponto suscita a criação de neologismos para assuntos antigos por conta de novas roupagens. Expressões como big data e data science estão na ordem do dia.

Uma possível conexão está no fato de estarmos nessa era de big data passando a lidar e conviver com massas de dados que são expressivamente maiores em ordens de magnitude que as massas de dados com as quais a humanidade estava acostumada. Esse novo mundo altamente informatizado talvez esteja fazendo ressurgir velhos ceticismos.

Não está claro para mim qual a relação de causalidade entre a definição de uma nova roupagem para a Estatística (ou mais geralmente análise de dados) e o surgimento de uma nova onde de críticas. Esse assunto está na ordem do dia, a ponto de merecer veiculação com destaque em jornais de grande circulação. O artigo citado vincula fortemente o ceticismo com relação à Estatística em assuntos de ordem política. 

Esse desprezo pela evidência trazida pelos dados talvez tenha atingido seu ápice com Donald Trump recentemente. Logo após a sua posse, ele contestou as afirmações que atestavam que o publico presente na festa publica de sua posse foi substancialmente menor que o publico presente na posse de seu antecessor, Barack Obama. Fotos dessas posses fornecem claras evidências de diferenças gritantes entre os dois públicos. O assunto acabou sendo tratado com humor pois sua argumentação não tem muita sustentação na realidade. [Uma descrição de como essas contagens são feitas foi postada aqui.]

Resta saber se raciocínios como esse sem embasamento crível na realidade encontrarão eco em outras instâncias. Acredito que não mas é bom estarmos atentos, em prol da verdade.

terça-feira, 25 de abril de 2017

Marcha pela Ciência

www.reuters.com

Acaba de ser realizada no sábado passado (22/04) a primeira edição da Marcha pela Ciência (ou March for Science, em inglês). A missão do movimento é utilizar a Ciência como mola propulsora da formulação de políticas públicas em prol do avanço da sociedade, como atesta o site da campanha. O grupo promotor consiste de dezenas de instituições científicas internacionais com predominância de grupos norte-americanos.

Essa edição foi realizada no Dia Internacional da Terra e contou com eventos realizados ao redor do mundo em várias cidades. A foto acima foi feita na manifestação ocorrida em Sydney, na Australia. O evento teve participação brasileira também. Pelo menos as cidades Rio de Janeiro e São Paulo participaram com uma série de atividades relacionadas à valorização da Ciência.

As manifestações ao redor do mundo tiveram forte motivação política, estimuladas pelas atitudes do presidente americano Donald Trump. Ele assumiu a presidência recentemente, com posições no mínimo polêmicas nos mais variados fronts. Entre as mais preocupantes para o grupo organizador da Marcha, estão suas políticas voltadas para o meio ambiente, e seu manifesto desprezo pela Ciência, com cortes nas verbas para pesquisa. Seus "fatos alternativos" refletem sua peculiar posição perante evidências, um dos pilares da Ciência. O assunto será tema de postagens futuras.

Aqui no Brasil não foi muito diferente. Por conta da forte crise fiscal que vem assolando o país, vários cortes foram implementados pelo atual governo na sua maquina administrativa, atingindo também os recursos destinados a Ciência e Tecnologia. Esses cortes tem deixado a comunidade científica nacional preocupada com seu futuro e o evento foi mais uma oportunidade de manifestação publica dessa preocupação.

Demonstrações dos principais órgãos em defesa da Ciência nacional podem ser lidas aqui e aqui. Por conta disso, as manifestações aqui no Brasil tiveram como palavra de ordem a expressão "Conhecimento sem cortes".

terça-feira, 18 de abril de 2017

Estatística aparece desde o 1º ano do fundamental na nova base curricular*


 www1.folha.uol.com.br

por Natália Cancian e Sabina Righetti

A nova versão da base nacional curricular traz mudanças na organização dos conteúdos e nos objetivos previstos para cada etapa e tenta aproximar o aluno da vida real, segundo especialistas e técnicos do Ministério da Educação que participaram da elaboração do documento.

Após rodadas de discussões, a versão final do documento que deve servir como referência para o ensino no país será entregue pelo Ministério da Educação ao Conselho Nacional de Educação nesta quinta-feira (6). A previsão é que o conselho analise o documento até o fim deste ano.

Só depois disso, as mudanças começam a ser implementas nas escolas públicas e privadas de todo o país. Hoje, o que é ensinado nas escolas se baseia em diretrizes municipais ou estaduais de ensino, no material didático e em exames de avaliação como o Enem (Exame Nacional do Ensino Médio).

Entre as alterações em relação às versões anteriores do documento, estão o aumento de conteúdos de probabilidade e estatística em matemática, reforço da ordem cronológica para o ensino de história e maior atenção à redação em português, por exemplo.

Entenda a base curricular

Na parte dedicada à língua portuguesa, o documento reforça a necessidade de maior atenção, nos últimos anos do ensino fundamental, a atividades que envolvam interpretação de textos, distinção de fatos e opiniões e produção de textos –algumas das principais dificuldades hoje dos alunos nas avaliações como o Enem.

Já a matemática passa a ter maior foco na resolução e entendimento de problemas do que em técnicas a serem decoradas. Entre os conteúdos, o destaque vai para a probabilidade e estatística, que, antes praticamente ausentes do documento, passam a constar na base para serem ensinados desde o 1º ano. Logo aos seis anos, descreve a base, o aluno deve ter habilidade de "leitura de tabelas e de gráficos de colunas simples."

Neste caso, o aluno poderá encontrar, no conteúdo ensinado em sala de aula, algumas noções iniciais de probabilidade, atividades que envolvam a coleta e o registro de informações, além da leitura gráficos e tabelas simples. Em ciências, foram incorporados exemplos práticos e próximos da realidade –como questões ligadas à saúde, ou o ensino da atmosfera atrelado a discussões sobre mudanças climáticas, por exemplo.

A base, no entanto, deixou de fora algumas sugestões, apresentadas por especialistas, para maior incorporação da tecnologia nessa área de ensino.

"Em pleno século 21, é inconcebível que o Brasil não ensine tecnologia e programação para suas crianças", diz Paulo Blikstein, do Lemann Center da Universidade de Stanford (EUA). "É trágico porque a criança da escola particular vai aprender a programar, deixando o aluno da escola pública ainda mais para trás."

A base é composta por...*

...4 áreas do conhecimento:
> Matemática
> Ciências da natureza: ciências
> Linguagens: língua portuguesa, arte, educação física e língua inglesa
> Ciências humanas: geografia e história

...e as principais mudanças ocorreram em:

Alfabetização
Como é: Plano Nacional da Educação prevê aluno alfabetizado até o 3º ano
Como fica: Alfabetização será antecipada para o 2º ano, aos 7 anos de idade

Ensino religioso
Como é: Constituição de 1988 define que o tema é facultativo nas escolas
Como fica: Foi retirado do texto; caberá aos Estados, municípios e escolas privadas decidir

Estatística e probabilidade
Como é: Não apareciam nos documentos prévios da base
Como fica: Serão ensinadas a partir do 1º ano do fundamental

Exemplos de mudança com a base curricular

*Considera apenas os ensinos infantil e fundamental; a base do ensino médio foi adiada

Bases curriculares de países como o Canadá já incluem programação entre as linguagens a serem aprendidas. "A base precisa olhar para o futuro", diz Blikstein. "Precisa sinalizar para governos e as escolas como as coisas devem ser em cinco ou dez anos, e fazer acontecer."

==============================
* - Texto publicado em www1.folha.uol.com.br/educacao/2017/04/1873126-estatistica-aparece-desde-o-1-ano-do-fundamental-na-nova-base-curricular.shtml


terça-feira, 11 de abril de 2017

A academia agoniza

 

 www.gilbertopalmares.com.br

por Gauss M. Cordeiro*
 

Nas prestigiosas universidades estrangeiras, a carreira acadêmica é viva, dinâmica e evolutiva e norteada pelos valores de competência, eficiência e disciplina. A produtividade científica permeia as atividades-fim e o objetivo primordial é formar bons profissionais com conhecimentos técnicos, filosóficos, científicos e artísticos que produzam muitos efeitos benéficos na sociedade. Nelas, o ensino superior é realmente de qualidade.
 
Às avessas, existe um gigantismo que assola as nossas universidades públicas (estaduais e federais) e um número significativo de professores só faz cumprir carga horária. Com efeito, esses docentes se dedicam a outras atividades que lhes oferecem maior retorno financeiro. Muitos outros professores não têm qualquer interesse na pesquisa científica, o que se reflete na nossa baixa produtividade científica e no desempenho pífio do ensino de qualidade. Muito poucas áreas do conhecimento do País aparecem entre as 200 melhores do planeta quando avaliadas nos mais conceituados rankings acadêmicos internacionais. Em nossas instituições, ocorre um nivelamento por baixo que não permite distinguir aqueles que realmente produzem daqueles que apenas hibernam. A variável "mérito" não faz parte de muitos objetivos da vida acadêmica. Nas universidades federais, por exemplo, para ascender na carreira, basta não fazer nada. A promoção ocorre quase de forma automática por tempo de serviço. O corolário mais evidente é inevitável: irrelevância da grande maioria dessas instituições no cenário científico internacional.   

Adicionalmente, os sindicatos docentes são formados, em boa parte, por professores que não têm o mínimo compromisso com a pesquisa e, obviamente, seus interesses são norteados pelo corporativismo exacerbado. Se fosse colocada em artigos científicos a mesma energia gerada em debates sindicais, o Brasil seria uma superpotência. Aqueles professores que realmente ensinam e publicam ganham muito mal, mas os demais que não fazem essas duas atividades ganham bem. Essa distorção precisaria ser corrigida de forma firme pelo Governo Federal.

Ao longo dos últimos anos, presenciamos vários eventos que se combinam para desmantelar qualquer ambiente acadêmico no País que pretenda esboçar excelência. Nominalmente, temos: invasões descabidas de salas de aulas e de prédios das universidades por alunos delapidando o patrimônio público; destruição dos valores acadêmicos baseados no mérito; infraestrutura extremamente precária; greves literalmente direcionadas por simpatizantes de partidos políticos, numa nítida afronta à nobreza e à pluralidade das nossas instituições, prejudicando milhares de alunos que realmente querem estudar; vestibular com fraquíssimo crivo de seleção; excessivas preocupações com evasão ou reprovação, mas pouco esforço em melhorar o ensino; priorização em criar novos cursos e diplomar alunos em grande quantidade sem necessariamente zelo pela qualidade; desmotivação dos professores mais destacados. Efetivamente, vem-se introduzindo de forma acentuada ações assistencialistas que exaltam apenas a mediocridade.  
 
Pior ainda, persiste preocupante que grandes instituições privadas de ensino superior se comportam apenas como meras fábricas de diplomas que objetivam não mais que maximizar o lucro deixando à margem a qualidade acadêmica. Sir Winston Churchill afirmava que os "impérios do futuro são impérios da mente". Infelizmente, o ensino superior do Brasil persiste na contra mão dos países desenvolvidos. 
 
* Gauss M. Cordeiro é Professor Titular de Estatística da Universidade Federal de Pernambuco (UFPE). O texto foi publicado na Folha de Pernambuco no dia 27 de janeiro de 2017. 

terça-feira, 4 de abril de 2017

Desmistificando idéias equivocadas sobre Estatística - parte V

 http://covingtonweekly.com

A postagem anterior desta série reacendeu a velha máxima usada para desmerecer a Estatística de ser a ciência que diz que um homem com metade do corpo no congelador (a 0 graus) e a outra metade no forno (digamos a 75 graus) tem temperatura média 37 graus e portanto está normal. Em geral, os valores dados acima de temperatura raramente são fornecidos mas os acrescento para emprestar ainda mais credibilidade à afirmação. Meios mais esclarecidos reconhecem os problemas dessa afirmação e não se preocupam com ela. Mas nunca encontrei em lugar algum a explicação dos problemas, apesar de sua aparente obviedade. Devo acrescentar desde o inicio que a situação descrita é completamente irreal mas consideraremos ela possível para poder tratá-la adequadamente.

Um dos aspectos interessantes da comunicação entre seres humanos é que muitas vezes consideramos óbvio algo que não é óbvio para outros e a única forma de nos certificarmos de estar falando a mesma coisa é explicitar o "óbvio". Algumas vezes percebemos que estamos todos entendendo a mesma coisa. Mas ném sempre é assim. Logo, nada melhor que aproveitar este espaço para destrinchar o assunto.

Em primeiro lugar, deve ser esclarecido que quem diz que a temperatura média é normal não é a Estatística mas a Matemática. Na realidade, trata-se de uma aritmética elementar. E isso é um fato inquestionável: no caso em questão, a temperatura média será mesmo 37 graus. O problema está na uso da média como um sumarizador adequado para qualquer situação. Isto é, o problema está nessa extrapolação.

O caso em questão temos metade dos dados concentrados em 0 graus e a outra metade dos dados concentrada em 75 graus. Ou seja, nenhum dos dados está sobre a média e nem mesmo perto dela. Isso torna a média um péssimo sumarisador dos dados. Além disso, eles apresentam uma dispersão relevante que não pode ser desprezada em nenhuma análise.

Tudo isso leva à conclusão que não dá para olhar para algumas estatísticas sem verificar se elas representam adequadamente o todo. O exemplo dos testículos citado na postagem anterior é uma forma mais gritante, e portanto de mais fácil compreensão por todos, do mesmo fenômeno.

terça-feira, 28 de março de 2017

Toda biologia é biologia computacional


Fonte:Nationalmuseum Stockholm

O título provocativo desta postagem é a tradução do título de um artigo científico, escrito por Florian Markowetz, publicado alguns dias atrás (17/03/2017) no periódico científico PLOS Biology. Esse texto tem despertado interesse na comunidade científica de Biologia. Um pouco da reação favorável pode ser vista aqui. Mas com certeza ele está levantando reação contrária em igual ou maior intensidade.

O que o artigo sustenta de fato não é tão forte quanto o título. Ele descreve através de inúmeros exemplos que um aspecto fundamental da atividade científica do biólogo nos dias de hoje é a busca de apoio quantitativo nas suas mais diferentes formas. Ele cita não apenas o input computacional explicitado no título mas fala bastante de modelagem matemática e de análise estatística. 

O que considero interessante para nós é o reconhecimento da importância de análises estatísticas. Isso é explicitado através de uma lista de exemplos onde essas análises se revelam fundamentais para a obtenção de conclusões científicas. Esse tipo de situação foi/é encontrado em várias outras áreas da Ciência, notadamente nas Ciências Sociais. Existe em alguns grupos nessas áreas o entendimento que o avanço científico deve ser resultado de uma reflexão teórica sobre o objeto de estudo e a interferência de quantificação seria um reducionismo inapropriado.

Essa visão vem paulatinamente perdendo força mas ainda persiste. Independente de estarmos de acordo ou não com essa visão da Ciência, a entrada de computadores em larga escala no mundo e a ênfase mais recente no manuseio de grandes massas de dados (big data, já tratada aqui) vem criando um novo paradigma para a Ciência e ensejando a possibilidade de "descobertas" de questões e possíveis respostas a elas através de uma apropriada investigação nos dados.

Esse novo cenário permite que teorias sejam formuladas com base nessas descobertas e desenvolvidas a partir daí, com sustentação fortemente calcada na análise direta dos dados. Segundo o autor, foi esse tipo de visão da Ciência que norteou Carl von Linné (ou Carlos Lineu, em português), registrado no quadro acima. Ele foi o fundador da taxonomia de Lineu, onde foi estabelecido o conjunto de regras usado até os dias de hoje para classificação dos seres vivos.

O artigo parece sugerir que esse passou a ser o único caminho possível para o avanço científico. Sabemos que isso não é verdade e o tratamento reflexivo do escopo da Ciência estabelece um outro caminho mais convencional, que continua tendo seu valor. Na minha opinião, essa componente pode até ter perdido sua proeminência com o crescente pragmatismo dos dias de hoje mas está ainda muito longe de não ter mais espaço na Ciência do século XXI. Um adequado equilíbrio entre teoria e prática continua a me parecer o melhor paradigma para o avanço da Ciência.

O artigo começa com uma série de episódios que explicitam o desapontamento do autor com seus colegas de profissão devido a discriminações por ele sofridas devido a sua abordagem voltada para aspectos computacionais da Biologia. Esses episódios parecem ter deixado feridas no autor e seu ressentimento é evidente. Isso talvez o tenha levado ao extremo do título que me parece refletir um pouco do exagero descrito acima.

O artigo completo pode ser visto aqui.

terça-feira, 21 de março de 2017

Desmistificando idéias equivocadas sobre Estatística - parte IV

www.economist.com

 Um minicurso em compreensão de números*

As pessoas recebem cinco vezes mais informações a cada dia do que faziam em meados dos anos 80. Com toda essa avalanche de dados é fácil se sentir perdido. Um político usa uma estatística para sustentar seu argumento; Um jornal usa outro fato para refutá-lo; Um economista usa um terceiro para provar que ambos estão errados. A Field Guide to Lies and Statistics de Daniel Levitin, um neurocientista americano, mostra ao leitor como encontrar um caminho através de toda essa confusão numérica.

Um livro sobre estatísticas pode facilmente ser chato. Felizmente, o Sr. Levitin é o guia perfeito. Antes de se tornar um acadêmico ele costumava trabalhar como um comediante. Com base nessas habilidades, o Sr. Levitin apimenta seu livro com piadas. Ele usa a frase "em média, os seres humanos têm um testículo" para fazer o ponto que a média pode ser uma descrição enganosa de uma população. Ele sai em tangentes interessantes, concedendo ao leitor algum alívio da análise detalhada de amostragem e probabilidades. Apenas ocasionalmente seu estilo é irritante.

Usando muitos exemplos, o Sr. Levitin mostra como facilmente as estatísticas podem levar as pessoas a se perderem. Considere a seguinte afirmação, que em uma rápida avaliação pode parecer perfeitamente razoável: "Nos 35 anos desde que as leis de maconha deixaram de ser aplicadas na Califórnia, o número de fumantes de maconha dobrou a cada ano". Logo se perceberá que isso deve ser absurdo; Mesmo com apenas um fumante para começar, depois de dobrar a cada ano durante 35 anos haveria mais de 17 bilhões deles. Levitin repetidamente lança essas "bolas estatísticas" em seus leitores, treinando-os a adotar uma atitude de não aceitar nada de ninguém. É uma técnica pedagógica eficaz.

Algumas estatísticas revelam-se claramente erradas, mas mais comumente elas enganam. No entanto, isso é difícil de detectar: os números parecem objetivos e apolíticos. Um favorito de acadêmicos e jornalistas, ao analisar as tendências, é "rebasear" seus números para 100, de modo a apoiar o argumento que eles desejam fazer. Por exemplo, começando um gráfico do crescimento do PIB americano em 2009, quando o país estava em recessão, engana o leitor a pensar que a longo prazo a economia é mais forte do que realmente é. "Tenha em mente que os especialistas podem ser tendenciosos, mesmo sem perceber", o Sr. Levitin lembra as pessoas.

Uma compreensão básica da teoria estatística ajuda o leitor a lidar com a investida de informações. Levitin explica pacientemente a diferença entre uma variação percentual e uma alteração percentual, uma fonte comum de confusão. Quando um jornalista descreve um resultado estatístico como "significativo", isso raramente tem o mesmo significado que quando um estatístico diz. O jornalista pode querer dizer que o fato é interessante. O estatístico geralmente significa que há uma probabilidade de 95% de que o resultado não tenha ocorrido por acaso. (Se é interessante ou não é outra questão.)

Alguns leitores podem achar o livro do Sr. Levitin digno, mas ingênuo. O problema com alguns políticos populistas não é que eles erram a legenda de um eixo x aqui ou não especificam um grupo de controle lá. Pelo contrário, eles deliberadamente proclamam mentiras flagrantes que jogam com a irracionalidades e inseguranças dos eleitores. No entanto, se todos pudessem adotar o nível de saudável ceticismo estatístico que o Sr. Levitin gostaria, o debate político estaria em muito melhor forma. Este livro é um instrutor indispensável.

* O texto acima é uma crônica publicada pelo The Economist no dia 04/02/2017 sobre o livro “A Field Guide to Lies and Statistics”, de Daniel Levitin

terça-feira, 14 de março de 2017

Extremos - parte II

 Fonte: arquivo pessoal

Na postagem inicial sobre o assunto destacamos o resultado provado por J. Pickands. Esse resultado, também atribuido a A. Balkema e L. de Haan, descreveu de forma surpreendentemente precisa o comportamento da cauda da distribuição. Com isso, podemos adquirir precisão sobre os eventos mais extremos (descritos como a cauda da distribuição) sem impor restrições sobre os dados. Assim, não se torna mais necessário assumir hipóteses de difícil verificação, como supor que os dados tem estrutura Gaussiana.

A questão remanescente então é entender quão extremo deve ser o dado para ser considerado extremo. Em linguagem mais técnica, a partir de que ponto pode-se assumir que se entrou no comportamento limite descrito pelo resultado de Pickands. A estratégia utilizada no século passado foi propor argumento heurísticos, alguns baseados em propriedades gráficas, para determinar o ponto de corte, que aqui chamaremos de limiar, a partir do qual está a cauda da distribuição. 

Essa determinação está longe de ser precisa e, mesmo sendo consistente, pode se comportar muito mal para problemas reais onde a quantidades de dados pode não ser tão grande quanto o necessário. Além disso, essa determinação do ponto de corte por métodos gráficos está longe de ser uma tarefa simples, como ilustra a figura acima. Outro ponto relevante é que todas as técnicas usam apenas os dados tomados a partir desse limiar e esse valor precisa ser conhecido sem sê-lo. Ou seja, parece haver um grau desnecessário de arbitrariedade.

Assim, desde o início deste século, técnicas mais robustas tem sido propostas, boa parte delas baseadas em uma especificação de modelos. Com isso, diferentes técnicas de determinação da cauda podem ser testadas e comparadas. Entretanto, a dificuldade aqui é que, se por um lado tem-se uma determinação precisa do comportamento da cauda, por outro lado não existe nenhum resultado geral sobre como se comporta a parte central dos dados, ou a não-cauda.

A proposta que fizemos a partir de uma tese de doutorado foi deixar a estrutura mais flexível possível para a não-cauda. Isso foi possibilitado pelo uso de uma mistura de distribuições Gama, que possui boas propriedades teóricas. Com isso, a determinação do limiar pode ser feita de forma precisa e a incerteza inerente a esse processo de escolha é incorporada ao processo de estimação.

Estimação de quantis elevados ou níveis de retorno (além do máximo dos dados observados) pode ser facilmente realizada e as incertezas associadas a essas estimações são facilmente reportadas. Embora mais trabalhoso computacionalmente, esse procedimento apresenta bons resultados com superioridade em relação aos procedimentos gráficos.

Além disso, ele se presta de forma relativamente natural a várias extensões. Exemplos incluem modelos para extremos com estrutura de regressão (dependência em variáveis explicativas), com estrutura de dependência temporal ou espacial e também extensões para extremos multivariados.


terça-feira, 7 de março de 2017

Colocando as chances para trabalhar

 www.worldscientific.com/worldscibooks/10.1142/3454

O título desta postagem é uma tradução livre que fiz do título Putting Chances to Work, do livro escrito pela Dra. Nalini Krishnankutty e publicado em 1996 pela editora Dialogue. Apesar de seu doutorado em Engenharia Química, Nalini se especializou em escrever sobre aspectos pessoais de cientistas e outras formas de popularização da ciência para a sociedade em geral. 

Este livro em particular trata da trajetória pessoal do estatístico Calyampudy Radhakrishna Rao (ou C. R. Rao), com alguma ênfase na sua vida profissional. Uma crítica sucinta mas positiva do livro foi feita pelo nosso colega Basílio. O título do livro deve ter sido baseado no livro homônimo escrito pelo próprio Rao alguns anos antes, cuja capa ilustra esta postagem acima.

Aproveitei o feriado de Carnaval para ler o livro, que não é muito extenso e tem leitura fácil. Através dele, ficamos sabendo um pouco sobre a vida de um dos maiores pesquisadores vivos de Estatística. O livro acompanha o pesquisador desde sua infância, ilustrando seu grande precoce brilhantismo nas fases anteriores (pré-universitárias) de sua formação.

Filho de um funcionário público de bom nível hierárquico e de uma das castas mais altas, Rao teve uma infância/adolescência sem luxos mas confortável. Como exemplo, pode ser citada a mudança da família para a cidade onde estava situada a universidade onde Rao obteve sua formação acadêmica em matemática. Apesar de seu interesse em aplicações de Matemática, Rao não teve muito contato com a Estatística durante sua formação.

Esse contato se deu de forma fortuita e casual. durante uma ida a Calcuta para uma seleção para um emprego que não o interessou muito, Rao soube por um conhecido da sua região da existência do International Statistical Institute (ISI). Acho que muitos profissionais da área, entre os quais me incluo, foram trazidos para a área através de encontros igualmente fortuitos sobre a existência de oportunidades de trabalho e/ou estudo na área. O ISI foi um polo atrator e disseminador da formação da Estatística na Índia e foi criado e desenvolvido a partir da desenvoltura científica e política de um de seus fundadores, Prasanta Chandra Mahalanobis, natural de Calcuta. 

O primeiro contato de Rao com o ISI no início dos anos 1940 foi um tanto errático pois o instituto estava em processo de estruturação e não tinha seus cursos bem organizados. Apesar disso, Rao tomou algumas das poucas disciplinas que estavam disponíveis. Isso foi o suficiente para ele se inteirar do estado atual dessa ciência que estava ainda engatinhando. A maior prova do seu brilhantismo foram os 2 teoremas que ele provou nesse período:
  1. teorema de Rao-Blackwell, onde ele mostra que usar estatística suficientes é sempre uma boa estratégia de construção de estimadores;
  2. teorema de Carmer-Rao, onde ele mostra que existe um limite inferior para a variância de estimadores.
Chama a atenção que ambos os teoremas foram provados de forma concomitante por outros pesquisadores, dai a denominação composta deles. Isso é só uma comprovação da efervescência daquela época onde ainda se construia do arcabouço teórico da Estatística (frequentista), tal qual o conhecemos. 

Ambos os resultados foram obtidos por Rao em 1945. Nessa época, ele tinha a tenra idade de 25 anos, antes mesmo do início de seu doutorado. Esses resultados fazem parte da essência da construção de estimadores, devem ser do conhecimento de qualquer pessoa interessada na teoria estatística e tiveram uma importância enorme no desenvolvimento de estimadores. Acho que eles são a prova mais eloquente da genialidade de C. R. Rao.


Após essa fase, Rao foi indicado por Mahalanobis para fazer um estágio em Cambridge no Reino Unido. Esse estágio lhe permitiu realizar o trabalho necessário para a obtenção de um título de doutor. Sua tese foi feita a partir do maior contato de Rao com aplicações de Estatística. Esse contato se provou muito útil para a vida profissional futura de Rao e deu origem a muitas outras contribuições de Rao em termos de criação e caracterização de ferramentas estatísticas úteis para utilização em aplicações práticas.

Após o término desse estágio, Rao volta para a Índia com o titulo de doutor. Mahalanobis se aproximou de Rao e foi colocando ele progressivamente à frente da estrutura do ISI, onde ele permaneceu por cerca de 3 décadas e ajudou a formatar o ISI em seu estado atual. Ele só saiu de lá após a sua aposentadoria, indo para os Estados Unidos inicialmente como visitante para acompanhar os estudos de um de seus filhos, numa trajetória de certa forma similar à de seu pai. Lá ele ficou até hoje onde se mantem ativo de alto de seus quase 100 anos.

O livro aponta uma série de peculiaridades tanto pessoais quanto profissionais de Rao e trata um pouco de sua vida pessoal, sua família, esposa e filhos e seus outros interesses. Acho que se trata de um painel interessante sobre a vida de um dos maiores pesquisadores de nossa área, detentor de várias honrarias em instituições e universidades espalhadas pelo mundo. 

Recomendo a leitura.

terça-feira, 21 de fevereiro de 2017

Torrada queimada dá câncer?

 www.statslife.org.uk

por Sir David Spiegelhalter*

A agência de controle de alimentos britânica (FSA, sigla de Food Standards Agency) lançou hoje (dia xx/01/2017) a campanha Rumo ao Ouro (Go for Gold) encorajando os britânicos a não tostar as comidas assadas ou torradas e manter as batatas fritas a uma bonita cor dourada. A idéia é reduzir o consumo de acrilamida, um produto químico que, segundo a FSA,  é "criado quando muitos alimentos, particularmente os ricos em amido como batata e pão,  são cozidos por longos períodos e a altas temperaturas, oque acontece quando são assados, fritos, grelhados ou torrados."

Acrilamida (AA) pode ser bastante nociva em doses grandes. É usada como selante industrial e trabalhadores com níveis muito altos de exposição sofrem neurotoxicidade severa. Doses muito altas mostraram crescimento de risco de cancer em ratos. A agência internacional de pesquisa em cancer (IARC, sigla de International Agency for Research on Cancer) a considera ‘um provável agente carcinogênico humano’, colocando-a na mesma categoria que muitos produtos químicos, carne vermelha, ser cabeleireiro ou trabalhar em turnos longos.

Entretanto, não existência evidência sólida de danos a humanos consumidores de acrilamida em sia dieta: a agência de cancer britânica diz que 'no momento não existe evidência ligando acrilamida e cancer'.

Essa falta de evidência não é por falta de tentativas. Um volumoso relatório da agência de alimentos européia (EFSA) lista 16 estudos e 36 publicações, mas conclui:

Nos estudos epidemiológicos disponíveis até o momento, o consumo de AA não foi associada com um maior risco dos canceres mais comuns, incluindo aqueles do trato gastrointestinal ou respiratório, de bexiga, prostata ou de mama. Alguns estudos sugeriram um risco aumentado para cancer renal, endometrial (em particular para não-fumantes) e de ovário, mas a ewvidência é limitada e inconsistente. Além disso, um estudo sugeriu uma menor sobrevida para mulheres não fumantes com cancer de mama para uma exposição pré-diagnóstica à AA mas mais estudos são necessários para confirmar esse resultado. (p185)

Lembre que cada estudo testa a associação com uma longa lista de tipos de cancer. Usando critérios usuais para significância estatística, esperaríamos 1 em 20 dessas associações ser positiva pelo mero acaso.

Uma resposta padrão é o cliché muito usado: ‘Ausência de evidência não é evidência de ausência’. Se houve um esforço enorme para encontrar associação e nenhuma foi encontrada, é verdade que isso pode não ser evidência direta de ausência de efeito (embora isso não pode nunca ser provado). Mas pode ser considerado evidência de ausência de um efeito importante.

Daso os números fornecidos pela EFSA e pela FSA, talvez não seja surpresa que nenhuma associação foi mostrada em grandes estudos. A EFSA estimou o BMDL10 da acrilamida em 170 µg/kg de peso corporal /dia  —  isso significa que é improvável que exposições nesse nível causariam tumores em ratos (tecnicamente, esse é o limite inferior de um intervalo de confiança que causaria aumento de 10% de tumores). Daí, eles compararam esse nível com a exposição humana obtida em multiplos estudos nutricionais. Em adultos, eles revelaram uma exposição média à acrilamida de 0,56 e exposição alta de 1,1 µg/kg/day, no sentido que 97,5% das pessoas consumem menos que isso. O BMDL10 é então dividido por essas exposições para gerar a ‘margem de exposição’, que confusamente acaba sendo alta para riscos baixos e baixa para riscos altos.


Tabela 1: BMDL10 é a exposição à acrilamida que toxicologistas consideram imporovável de causar aumento de tumor em ratos. A ‘margem de exposição’ é o BMDL10 dividido pela exposição estimada.

Então, por exemplo, adultos com o maior consumo de acrilamida poderiam consumir 160 vezes mais e ainda estar em níveis que toxicologistas consideram ser improvável causar aumento de tumores em ratos (é essencialmente isso que a ‘margem de exposição’ significa).

Isso parece ser reconfortante e pode explicar porque tem sido tão difícil observar algum efeito da acrilamida na dieta. Para cancer, os comitês toxicológicos demandam uma arbitrária ‘margem de exposição’ de 10.000 para considerar aceitável um composto químico. Isso é 33 vezes maior que a margem atual para adultos no Reino Unido  —  fazendo com que a acrilamida não atinja esse padrão bastante rigoroso de segurança, e essa é a base para a campanha da FSA.

Reações ao Go for Gold pode variar dos extremos de encorajar preocupação obssessiva entre os mais suscetíveis a anúncios de doenças como os hipocondríacos ao extremo oposto de irar editoriais em mais uma invasão do estado na vida das pessoas. Mias preocupante, as pessoas podem simplesmente considerar essa como mais uma história de terror dos cientistas e isso levá-las a descartar avisos realmente importantes como por exemplo dos perigos trazidos pela obesidade.

A agência de cancer britânica diz que 'pesquisadores estimam que sobrepeso e obesidade estão ligados a cerca de 18.000 casos de cancer por ano no Reino Unido'. Em contraste direto, a FSA não fornece estimativa do mal causado pela acrilamida, ném do benefício advindo da redução que os indivíduos terão ao seguir sua recomendação. Honestamente, não estou convencido que seja apropriado lançar uma campanha baseado nisso.

* - texto publicado pelo presidente da Royal Statistical Society (RSS) no boletim on-line da sociedade em 22 de janeiro de 2017 (versão original aqui).