Fonte: arquivo pessoal
O recesso de férias do StatPop será encerrado a partir do seu ponto de início: o encontro mundial do ISBA, em Edimburgo, no final de junho. A escolha do local do evento teve particular simbologia. Thomas Bayes teve uma estreita ligação com a Universidade de Edimburgo, se tornando inclusive nome de rua da universidade e "herói" do novo centro de tecnologia de dados (como atesta a foto acima) que está sendo construído pela Universidade ao lado do local do encontro.
Os encontros mundiais da ISBA tem uma estrutura que vem sendo moldada ao longo de suas sucessivas edições. Ele tem seu 1o dia centrado em torno de conferências plenárias, proferidas por grandes personalidades, para fazer uma análise crítica de suas áreas de pesquisa. Essas palestras atraíram grande atenção dos participantes, como esperado, e trouxeram reflexões relevantes. Além dessas palestras, houve palestras plenárias dadas por personalidade atuantes na fronteira do conhecimento e que também despertaram muito interesse. O encontro foi completado com sessões de comunicações centradas em cima de temas específicos de pesquisa e sessões de apresentação de posters.
Participei com alguma intensidade dessa edição desses encontros, indo não apenas às sessões mais ligadas às minhas áreas de pesquisa mas também a outras de interesse mais geral. Uma área que despertou o interesse meu e de muitos outros participantes foi a área de Big Data/Machine Learning e todas as outras denominações sob o guardachuva de Ciência dos Dados ou Data Science. A atenção que essa área vem recebendo gerou uma série de sessões de apresentações e atraiu grande parte do público. [Um exemplo desse interesse foi a presença de pouquíssimas pessoas na apresentação do Prof. Richard Smith, um dos pesquisadores mais importantes da Estatística atual, enquanto que uma sessão de Big Data, que corria em paralelo, estava lotada.]
Assisti algumas das sessões dedicadas a esse tema e saí com uma perspectiva um pouco diferente da que eu tinha antes desse evento. Olhando de forma um pouco descuidada, corremos o risco de perceber apenas a sua superfície. Essa visão já norteou uma postagem no StatPop. Essa superfície dá conta da ponta aplicada dessa área, centrada na solução de problemas de alta complexidade e/ou dimensionalidade. Nesse caso, diferentes técnicas de computação tem sido experimentadas com graus variados de sucesso.
No entanto, existe uma outra face talvez menos glamourosa mas igualmente importante de consolidação das técnicas utilizadas. E nessa situação não há outra saída possível que não a fundamentação teórica. E não faltam grupos importantes de pesquisa intensamente dedicados a essa tarefa. Essa vertente caminha na direção oposta àquela mais aplicada. Ela trabalha no nível mais conceitual e depende fundamentalmente de ferramentas teóricas, usando muita Matemática.
No entanto, existe uma outra face talvez menos glamourosa mas igualmente importante de consolidação das técnicas utilizadas. E nessa situação não há outra saída possível que não a fundamentação teórica. E não faltam grupos importantes de pesquisa intensamente dedicados a essa tarefa. Essa vertente caminha na direção oposta àquela mais aplicada. Ela trabalha no nível mais conceitual e depende fundamentalmente de ferramentas teóricas, usando muita Matemática.
Assisti várias apresentações ligadas ao tema mas gostaria de destacar a conferência de Michael Jordan, um dos maiores expoentes mundiais de Data Science, e que dará uma palestra na UFRJ na próxima semana (detalhes aqui). A conferência do Prof. Jordan foi centrada no problema de obtenção do máximo de funções. Essa assunto já foi bastante estudado na literatura ao longo dos últimos séculos. Mas agora, lidando-se com funções tendo número muito alto de argumentos e com possível existência de muitos máximos locais e de plateaus ou regiões de baixa variação, tem se reacendido o interesse em refinamento dessas técnicas de otimização. A conferência passeou por uma combinação de ferramentas sofisticadas de diferentes áreas da Matemática, visando otimizar os procedimentos de otimização em cenários de alta dimensão. Resulta que a geometria do problema desempenha um papel fundamental e as técnicas recentes tem procurado explorar esse ponto.
Muitos dos avanços em Big Data/Data Science estão associados ao uso de técnicas aproximadoras para poder operacionalizar a análise numérica/estatística em cenário complexo. Como exemplo, pode ser citada a busca por core sets, subconjuntos de dados que capturem a essência da informação trazida pela massa de dados disponível. Um ponto presente em várias apresentações foram estudos procurando caracterizar a qualidade matemática das aproximações utilizadas. Novamente, não precisa ser ressaltada a importância da Matemática nesses estudos.
Enfim, um novo mundo se descortina para a Estatística olhando para a Computação pelo lado aplicado mas também para a Matemática pelo lado teórico. Esse movimento me remete à entrevista que fiz com Sir David Spiegelhalter durante o 22o SINAPE. Nessa entrevista, David falava justamente da importância da Matemática para o futuro da Estatística e para os futuros estatísticos. [Infelizmente, não recuperei registro dessa entrevista a tempo desta postagem.] Ele não se referia à Ciência dos Dados mas até mesmo os pesquisadores dessa área parecem concordar com ele.
Muitos dos avanços em Big Data/Data Science estão associados ao uso de técnicas aproximadoras para poder operacionalizar a análise numérica/estatística em cenário complexo. Como exemplo, pode ser citada a busca por core sets, subconjuntos de dados que capturem a essência da informação trazida pela massa de dados disponível. Um ponto presente em várias apresentações foram estudos procurando caracterizar a qualidade matemática das aproximações utilizadas. Novamente, não precisa ser ressaltada a importância da Matemática nesses estudos.
Enfim, um novo mundo se descortina para a Estatística olhando para a Computação pelo lado aplicado mas também para a Matemática pelo lado teórico. Esse movimento me remete à entrevista que fiz com Sir David Spiegelhalter durante o 22o SINAPE. Nessa entrevista, David falava justamente da importância da Matemática para o futuro da Estatística e para os futuros estatísticos. [Infelizmente, não recuperei registro dessa entrevista a tempo desta postagem.] Ele não se referia à Ciência dos Dados mas até mesmo os pesquisadores dessa área parecem concordar com ele.
Nenhum comentário:
Postar um comentário