terça-feira, 4 de novembro de 2014

Meus artigos de Estatística preferidos

Toda Ciência se baseia em avanços propostos por pesquisadores da área. Esses avanços são geralmente divulgados através de artigos publicados em periódicos científicos da área. Existem vários critérios para escolher artigos como melhores na área de Estatística. Obviamente a importância que o artigo teve para desenvolvimentos futuros é um critério importante. Mas na nossa área não é incomum artigos terem influência por algo que eles não propuseram mas que acabou lá aparecendo ou sendo enfatizado. Um critério que me agrada é a elegância matemática como assunto foi tratado.

Assim, novamente qualquer lista formulada padecerá do mesmo mal de ausência de unanimidade. Um critério que tem sido muito usado recentemente é o número de citações que o artigo teve em outros artigos (publicados por outros autores). Esse critério procura dar objetividade mas está longe disso. Por exemplo, ele dá o mesmo peso a citações feitas por artigos fracos publicados em periódicos de baixo nível que o peso de uma citação em um artigo importante em um bom periódico. Em suma, essa é mais uma discussão sem fim que será encerrada com a definição de um critério eminentemente subjetivo: são os artigos que eu mais aprecio!

Dada toda a diversidade discutida acima fica difícil fazer uma ordenação da minha lista abaixo. Irei lista-los por ordem cronológica definida pelo ano de sua publicação. Também serão contemplados apenas os artigos da era moderna da Estatística, isto é, a partir do início do século XX. A forma como os artigos eram publicados anteriormente era muito diferente do formato adotado desde então. Incluir esses artigos mais antigos tornaria ainda mais difícil a tarefa.

Inicio minha lista com o artigo Monte Carlo sampling methods using Markov chains and their applications, publicado por W.K. Hastings  em 1970,  no periódico Biometrika, volume 57, pp 97-109.  Esse artigo veio a ser a base do que se conhece hoje por MCMC e já foi tratado em postagem anterior daqui do blog. Esse artigo só ficou famoso e foi extensivamente utilizado após a publicação do artigo Sampling-based approaches to calculating marginal densities, no Journal of the American Statistical Association, em 1990, por Alan Gelfand e Adrian Smith.

Um artigo que também revolucionou a Estatística moderna foi Generalized linear models, publicado por J. Nelder e R. W. M. Wedderburn  no Journal of the Royal Statistical Society, Series A, em 1972, volume 135, pp. 370-384. Esse artigo revolucionou a forma de pensar modelos de regressão, antes restritos a mínimos quadrados e outros casos específicos. Nelder e Wedderburn mostraram que existe uma formulação geral que agrega quase todos os modelos lineares de regressão até então contemplados e muitos outros. Isso abriu uma nova forma de pensar modelos e expandiu enormemente a gama de modelos que podiam ser contemplados e usados rotineiramente.

Outro artigo importante foi Regression models and life tables, publicado por David Cox no Journal of the Royal Statistical Society, Series B, também em 1972, volume 34, pp. 187-220. Esse artigo formulou as bases do avanço das análises de sobrevivência e confiabilidade na direção de modelos de regressão, criando uma nova área da Estatística. E Cox fez isso com uma formulação quase totalmente baseada em argumentos heurísticos e sem clara comprovação. Isso acabou sendo feito por Cox e também por outros autores em uma série de artigos subsequentes.

Um pouco adiante no tempo, B. Efron publicou em 1979 o artigo Bootstrap methods: another look at the jackknife no periódico Annals of Statistics, volume 7, pp 1—26. Esse artigo forneceu as bases para aproximar via simulação distribuições de estimadores, ferramenta fundamental para obtenção de intervalos de confiança e testes de hipóteses em situações onde não existem soluções exatas. Até então, a alternativa primordial para essas situações eram as aproximações baseadas em teoria assintótica, que se sabe funcionar mal em muitas situações reais. Assim como no artigo de Cox, a fundamentação teórica ainda não estava clara mas a importância do artigo, referência importante na Estatística até os dias de hoje, falou mais alto.

Termino minha lista com uma pequena obra prima, que considero o melhor artigo da última década. O artigo Reversible jump Markov chain Monte Carlo computation and Bayesian model determination, publicado por Green, P. J. em 1995 na Biometrika, volume 82, pp 711–732 é um primor sob vários aspectos. Trata-se de um daqueles artigos que avança a Ciência em direções desejadas mas até então desconhecidas. Esse artigo mostra como contemplar MCMC em situações onde deseja-se contemplar vários modelos simultaneamente. O artigo é longe de ser trivial e desenvolve teoria de cadeias de Markov com espaço de estados Além disso, o artigo é de grande amplitude em termos de inovação e apresenta elegância matemática para tratar de tema complexo e inovador, sem perder de vista o rigor científico.

Como pode se perceber todos os artigos acima citados estão contidos nos periódicos Annals of Statistics, Biometrika, Journal of the American Statistical Association e Journal of the Royal Statistical Society, que constituem a elite da Estatística.

Nenhum comentário:

Postar um comentário