terça-feira, 31 de outubro de 2017

Data Science e Estatística

http://science.unimelb.edu.au/data-science


A emergência de Data Science (ou Ciência dos Dados) introduziu uma nova realidade no quotidiano de todos os profissionais que lidam com dados e especialmente com grandes massas de dados. Isso envolve uma grande parte de profissionais e pesquisadores. Mas toca especialmente a comunidade estatística, cuja função primordial está associada ao manuseio de massas de dados (grandes ou não). Essa nova Ciência é, para muitos, uma reinvenção da Estatística com uma pitada mais forte de Computação, necessária para fazer frente às novas demandas associadas à administração de arquivos de tamanho maior que a capacidade de memória e processamento de arquivos dos computadores usuais.

O fato é que essa nova ciência tem atraído profissionais de diversas áreas, especialmente Estatística e de Computação. Além disso, ela tem se desenvolvido de forma relativamente autônoma da área de Estatística. Esse movimento tem suscitado diferentes reações da comunidade estatística. E essa relação já foi tratada antes aqui. Muitos setores apresentam preocupação, como ilustra a recente mensagem da presidente do International Statistical Institute, importante associação mundial.

Gostaria de contrastar essas compreensíveis preocupações compartilhadas por estatísticos mundo afora com uma abordagem mais pró-ativa do assunto. A mensagem mencionada acima aponta nessa direção mas de uma maneira ainda embrionária. Vale destacar algumas iniciativas tomadas pela comunidade estatística no Brasil, como por ser visto aqui e aqui. Ainda é pouco e muito ainda pode ser feito.

A RSS, associação que congrega os estatísticos do Reino Unido, está mais avançada nesse assunto. Trata-se de uma instituição muito atuante nos mais diferentes aspectos da Estatística, tanto em termos acadêmicos e em termos profissionais mas também de interação com a sociedade e com o governo britânico. A RSS tem seções temáticas que se dedicam a temas específicos e no inicio do ano foi criada a seção de Data Science (DSS). A DSS foi criada e é formada por profissionais de várias áreas de atuação, como academia, indústria e governo. Ela tem um objetivo inclusivo de atrair a comunidade de Data Science para o uso de boas práticas de Estatística.

Uma das primeiras atividades da DSS foi formular uma série de perguntas, cujas respostas devem nortear as ações dessa seção, e debater o assunto em uma reunião presencial ocorrida em junho deste ano. Uma melhor descrição da DSS e desse debate pode ser visto aqui. Mas o ponto que gostaria de destacar é o interesse em atrair a comunidade atuante em Data Science, expresso pela presença de importantes profissionais da área, para interagir com profissionais de Estatística, expresso pela presença do atual presidente da RSS, Sir David Spiegelhalter.

Nenhum comentário:

Postar um comentário