terça-feira, 19 de março de 2019

International Workshop on Applied Statistics

Fonte: Organização do IWAS

Como informado aqui, estive ausente semana passada devido a uma viagem à Colômbia para participar do VI International Workshop on Applied Statistics (IWAS). Esse evento é realizado regularmente (a cada 2 anos) pelo grupo de Estatística da Universidad Santo Tomás. Esse grupo possui vários jovens e animados pesquisadores desta universidade privada pertencente à igreja católica. Eles são responsáveis por uma graduação e também de um mestrado em Estatística recentemente iniciado.

Esses workshops são eventos científicos com carater eminentemente local, onde os docentes e os alunos apresentam seus trabalhos de pesquisa. O aspecto internacional do workshop vem da presença de alguns poucos convidados internacionais. Esta edição do IWAS teve como convidados um professor peruano e um venezuelano, além da minha presença. Minha participação envolveu um minicurso em Modelos de Espaço de Estados e a palestra inaugural, intitulada Como Ser um Estatístico Aplicado. Os outros convidados também ministraram minicursos e deram palestras.

O aspecto aplicado do workshop não está presente só no seu nome. O evento teve uma forte interação com o mercado de trabalho e foi inclusive patrocinado por algumas instituições publicas, como o Banco de la Republica (equivalente ao nosso Banco Central), e privadas. Essas instituições enviaram participantes tanto para apresentar trabalhos, minicursos e palestras como também para assistir essas apresentações. O evento teve no total cerca de 200 participantes, majoritariamente jovens, e pode se perceber muita animação e interesse por parte deles.

Durante a visita, tive conhecimento que esse grupo de pesquisadores tem um programa de radio com uma proposta similar à proposta do StatPop, que é a de divulgar a Estatística para a sociedade em geral com participações semanais. Devo reconhecer que o programa de radio tem uma produção muito mais elaborada, com apoio de toda uma estrutura de cabine à prova de som, equipamentos e profissionais qualificados. Outra diferença é que o programa de radio procura dar sempre uma inclinação mais lúdica, focando mais fortemente nos aspectos pessoais dos entrevistados do que costumamos fazer aqui no StatPop.

Fui convidado a participar do programa da semana passada e isso foi um dos pontos altos de minha visita à Colômbia. (A foto acima foi tirada dentro do estudio de gravação, logo após a gravação programa, com todos os participantes.) Fui entrevistado junto com o convidado venezuelano e com um conferencista colombiano, que foi meu aluno de doutorado aqui na UFRJ. Durante a entrevista, pudemos repassar ainda que rapidamente alguns aspectos de nossa trajetória pessoal, sempre ligando com as escolhas profissionais. Particularmente gratificante foi o depoimento altamente elogioso de meu ex-aluno sobre sua experiência com aluno estrangeiro no Brasil. Também foi interessante ver algumas similaridades nas trajetórias dos entrevistados.

Apesar de curta, a viagem foi bastante agradável e intensa em termos profissionais e pessoais. É sempre gratificante encontrar um grupo interessado em aprender e conhecer mais. A organização do encontro fez de tudo para tornar minha estadia a mais confortável possível, cuidando de todos os meus traslados e outros detalhes relativos à minha viagem. Fiquei profundamente agradecido a todos eles e novamente bem impressionado com à acolhida do povo colombiano de uma forma geral. 
  
A entrevista de radio pode ser ouvida na íntegra aqui

Informação sobre o IWAS pode ser obtida aqui.
     

terça-feira, 26 de fevereiro de 2019

Existe limite para a vida humana?

https://exame.abril.com.br/estilo-de-vida/eles-passaram-dos-75-anos-mas-tem-memoria-de-jovens-sao-os-superidosos/

O título desta postagem é uma das perguntas mais transcendentais para a humanidade e remete a inúmeras questões existenciais, filosóficas e até religiosas. Mas ele também tem sido o alvo de estudos demográficos e estatísticos com os dados disponíveis. Esses estudos utilizam a ferramenta estatística que parece ser a mais adequada para estudo de limites de distribuições, a Teoria de Valores Extremos (TVE). Essa é uma área bastante ativa da Estatística e já foi detalhada aqui.

Existem vários estudos na TVE que procuram determinar se existe um limite finito ou infinito para o excessos, ou pontos que ficam na cauda de uma distribuição. Essas idéias tem sido aplicada a todas as áreas onde existe particular interesse na cauda ou valores mais extremos da distribuição. Exemplos incluem quantidade de chuva ou vazão de um rio ou mesmo retorno de ativos financeiros e o interesse são nas potenciais catástrofes ambientais ou financeiras que os extremos podem causar. Interessantemente, a teoria mostra que o comportamento limite da cauda tem a mesma estabilidade, tanto quando se admite limite finito quanto quando se admite limite infinito.

Dentro da parte científica da Estatística, inovações são divulgadas em diferentes periódicos mas um deles foi recentemente estabelecido e se dedica apenas a contribuições de TVE. O nome do periódico não podia ser nada diferente do que ele tem: Extremes. No final de 2017, esse periódico publicou um artigo com o título (traduzido para o português) "Vida humana é ilimitada mas curta". O artigo foi escrito por 2 pesquisadores baseados na Suécia: Holger Rootzén e Dmitrii Zholud.

O resumo do artigo diz

A vida humana tem um limite superior biológico impenetrável que, em última análise, irá parar o aumento dos tempos de vida? Esta questão é importante para entender o envelhecimento e para a sociedade, e levou a intensas controvérsias. Dados demográficos para humanos têm sido interpretados como mostrando a existência de um limite, ou mesmo como uma indicação de um limite decrescente, mas também como evidência de que um limite não existe. Este artigo estuda o que pode ser inferido a partir de dados sobre a mortalidade humana em idades extremas. Descobrimos que nos países ocidentais e no Japão e depois dos 110 anos o risco de morrer é constante e é de cerca de 47% ao ano. Portanto, os dados não suportam a existência de um limite superior à vida humana. Ainda assim, dado o estágio atual da biotecnologia, é improvável que durante os próximos 25 anos alguém viva mais de 128 anos nestes países. Dados, notavelmente, não mostram diferença na mortalidade após os 110 anos de idade entre sexos, entre idades, ou entre diferentes estilos de vida ou origens genéticas. Estes resultados, e os métodos de análise desenvolvidos neste trabalho, podem ajudar a testar teorias do envelhecimento e confirmação da ajuda do sucesso dos esforços para encontrar uma cura para o envelhecimento.

A inexistência de limite aludida no título do artigo está ligada à constância das taxas de morte anuais após 110 anos de idade encontradas pelos autores no valor de 47%. Isso significa que uma pessoa que chega aos 110 anos, teria chances de 47% de chegar aos 111 anos de vida, 22% (= 47% x 47% )  de chegar aos 112 anos de vida, 10%  (= 47% x 47% x 47%)  de chegar aos 113 anos de vida e assim sucessivamente. Assim, para qualquer idade que se imaginasse acima de 110 anos, existiria uma chance positiva mas crescentemente reduzida de se chegar a essa idade.

Para se ter uma idéia da ordem de grandeza, as chances de um idoso com 110 anos chegar aos 120 anos de vida cairia para 0,05% (= 47%^10). E não custa relembrar que essa conta só serve para quem conseguiu chegar aos 110 anos. Ou seja, é possível mas extremamente improvável. No caso de um limite finito de N anos para a vida, a taxa de morte anual após N-1 anos de vida seria 1.

O artigo realizou alguns testes que não permitiram demonstrar a existência de diferença entre longevidade de homens e mulheres, entre dados do início da coleta dos dados para os dados do final da coleta, entre países e entre hábitos alimentares. Entretanto, os próprios autores atestam informalmente a final de sua réplica que a maioria dos idosos com idade mais avançada são mulheres com hábitos mais saudáveis (alimentação e de não fumantes), aparentando uma certa contradição.

Quer pelo tema, quer pelas técnicas utilizadas, o artigo suscitou um intenso debate que também está registrado na Extremes. Questionamentos de toda ordem foram registrados. Muitos deles foram associados aos dados utilizados, outros ligados a fatores associados à longevidade e alguns falaram sobre a influência das constantes modificações que vem sido introduzidas no nosso padrão de vida pelos avanços da Medicina. Também foi dado aos autores a oportunidade de réplica aos comentários recebidos. Todo esse material (artigo, discussões e réplica) foi publicado pela Extremes em dezembro de 2017, no volume 20, pág 713-728 e pode ser acessado a partir deste link.

terça-feira, 19 de fevereiro de 2019

Escola de Ciência dos Dados no Rio de Janeiro

Fonte: Nade - UFRJ

Começou ontem e vai durar toda esta semana, de 18 a 22 de fevereiro, a 1a Escola de Ciência dos Dados da UFRJ. Essa Escola terá cursos intensivos sobre assuntos diretamente ligados à Ciência dos Dados. Isso envolve software específico da área (Python) e de tópicos de Estatística mais comumente utilizados em aprendizado de máquina, como técnicas de classificação e de formação de conglomerados (clusters, em inglês) e de análise de séries temporais. Os cursos serão ministrados por professores (e terão monitoria de alunos de doutorado) do Instituto de Matemática da UFRJ.


Após a realização de Escola, na semana seguinte ocorrerá o 1º Workshop de Estatística e Matemática em Inovação, também na UFRJ. Esse workshop segue uma tendência recente de trazer problemas reais de empresas, cuja solução possa envolver o uso de técnicas de Matemática, Estatística e/ou Computação. Essa iniciativa já vem sendo posta em prática por algumas instituições acadêmicas no exterior há algum tempo e mais recentemente vem sendo utilizadas no nosso país também.
https://cienciadedadosufrj.wixsite.com/page

Isso ajuda a explicar o sucesso que essa Escola teve antes mesmo de seu início. O número de inscritos, com várias centenas de solicitantes, supera em muito a capacidade prevista para o evento. Ele mostra também o inegável interesse que esse tema vem recebendo, como já pontuado aqui no StatPop em algumas oportunidades. [Para comprovar isso, basta procurar a expressão "ciência dos dados" no painel de busca no canto superior direito de sua tela.]

A forma de organização desse tipo de workshop se inicia com alguns problemas previamente selecionados e trazidos pelas empresas e apresentados aos participantes do workshop. Sob a coordenação de docentes da instituição acadêmica e sempre que possível com a participação de profissionais das empresas, participantes do workshop são instados a utilizar seu expertise prévio aliado ao expertise adquirido ao longo da Escola.

Recentemente foi postada aqui uma inciativa com essa mesma intenção de avanço da Ciência através da interação entre indústria e academia. Essa iniciativa era mais estruturada (envolvendo várias universidades de prestígio internacional) e com horizonte de mais longo prazo (organizada em uma nova instituição voltada exclusivamente para esse fim). O Brasil ainda tem avanços muito incipientes na interação industria-academia mas são inciativas como esta que podem viabilizar o caminho para que essa interlocução seja pavimentada em bases mais sólidas e permanentes. Todos só temos a ganhar com isso! 

Maiores informações sobre a Escola e o Workshop podem ser obtidas aqui.

terça-feira, 12 de fevereiro de 2019

A tragédia recorrente do Rio


http://noticias.cennoticias.com/3524890?origin=relative&pageId=5c0896b2-97a3-40de-a630-77caef5b57a7&PageIndex=1

Assim como na postagem da semana passada, falamos novamente de uma tragédia nacional. Novamente, falamos de uma repetição de tragédia recentemente ocorrida na mesma região. A maior diferença é que esta tragédia acontece todo ano, alguns com maior gravidade e outros com menor gravidade. Trata-se de temporais na cidade do Rio de Janeiro. 

Já é de conhecimento de todos que a região sudeste do país está sujeita a fortes chuvas no verão, especialmente nos meses de janeiro e fevereiro. Lembro ainda criança de um temporal na cidade há cerca de meio século, que inundou o bairro de Laranjeiras de tal forma que ao final foram vistas verdadeiras esculturas de automóveis empilhados após terem sidos arrastados pela correnteza formada pela chuva na rua principal do bairro. Houve também deslizamentos que causaram mortes e tristeza para parte da população do bairro.

O que acontece da cidade do Rio é a conjugação de fenômenos esperados pela natureza mas que se magnificaram por vários motivos. O aumento substancial da população nessa região aumenta as chances desses fenômenos, já esperados como disse acima, causarem mais estragos materiais e pessoais pelo simples aumento da população a eles exposta. Assim, é comum vermos várias pessoas atingidas pelos temporais de verão nas cidades mais populosas do país, Rio e São Paulo. 

No caso do Rio, entretanto, existe o agravante da ocupação desordenada da cidade em encostas de morros, alguns muito íngremes. Isso aumenta o risco global de mortes no Rio em relação à capital paulista. De fato, todas as mortes ocorridas nesse último temporal tiveram relação direta com deslizamento de encostas. Isso é esperado em relevos tão íngremes como o carioca. Só que poucos desses locais tem tanta aglomeração urbana como na cidade do Rio de Janeiro. Além desses fatores habituais, temos novos fatores adicionados à essa receita. 

O primeiro deles é o fator climático. É inegável que estamos atravessando um período de mudanças no clima. Neste ano, a cidade teve o máximo histórico de temperaturas médias no mês de janeiro. Nunca um janeiro foi tão quente. Embora o máximo seja temporalmente fortuito, evidências auxiliares reforçam a existência de uma mudança. O verão de 2016 também houve recorde de temperatura. Embora não esteja diretamente relacionada à tragédia recém-ocorrida, a temperatura elevada é indiretamente relacionada, por causar aumento da evaporação da água na superfície. 

Isso nos leva ao motivo principal da tragédia, que foi a chuva ocorrida na semana passada. Choveu em poucas horas um excesso de chuva com respeito à média histórica de chuva nos meses de fevereiro, que são meses reconhecidamente chuvosos. A quantidade de chuva estava entre as maiores já ocorridas. Novamente vale lembrar que entre as maiores quantidades de chuva já observadas na cidade há uma presença substancial de chuva na última década. Isso reforça a tese da mudança climática. Note que essa observação é meramente empírica e não tem relação direta com os estudos que apontam o aquecimento global.

Estamos vivendo uma era de extremos climáticos e alternâncias imensas em diferentes fatores climáticos vem sendo observados com frequência crescente. Recentemente, houve uma nevasca no leste da América do Norte com temperaturas extremamente baixas. Na semana seguinte, a temperatura chegou perto dos 20 graus Celsius (positivos!) na cidade de Nova York, em pleno inverno.

Um outro componente que não pode ser esquecido é o componente econômico. O Estado do Rio de Janeiro passa por um momento particularmente difícil com dívidas enormes e comprometimento total de sua receita com pagamento de pessoal. Isso implica uma diminuição dos aportes a todos os serviços, com a precarização deles como consequência inescapável. Isso vale para a saúde, para a educação e para a segurança pública mas vale também para os programas voltados a mitigar os efeitos das intempéries do destino no Estado.

Essa conjugação de fatores acaba explicando a tragédia anunciada pela qual os cariocas foram obrigados a passar. A perspectiva futura não é boa, a começar com a forte chuva prevista para a noite de hoje. Vai envolver uma mudança de mentalidade de diversos aspectos por parte da administração da cidade e do Estado e isso leva tempo. Resta-nos torcer que os administradores públicos atuais e futuros percebam a importância desse redirecionamento de atitude, gestos e ações.

PS: uma postagem falando em tragédia no Rio na semana passada não pode se furtar a lamentar profundamente o ocorrido no Centro de Treinamento de futebol do Clube de Regatas do Flamengo. Ela não parece ter sido causada pelo temporal embora ele possa ter danificado os equipamentos de ar condicionados causadores de mais essa tragédia carioca. Desejamos um pronto re-estabelecimento do clube e as mais sinceras condolências aos familiares dos meninos que perderam suas vidas na luta pelo sonho de ascensão social.

terça-feira, 5 de fevereiro de 2019

A tragédia de Brumadinho

https://www.guiaviagensbrasil.com/galerias/mg/fotos-de-instituto-inhotim-brumadinho/

Mais uma vez somos impactados com a tragédia ambiental e, principalmente, humana com o rompimento da barragem de rejeitos da mineradora Vale na mina em Corrégo do Feijão, no município mineiro de Brumadinho. A cidade era até semana passada conhecida por sediar Inhotim, um dos mais belos museus a céu aberto, como ilustra a imagem acima, que tive o prazer de conhecer em minhas viagens pelo mundo. Desde então, a passou a ser mais conhecida por motivos bem menos ilustres que o museu, que felizmente foi poupado da devastação.

Passada mais de uma semana do acidente, já temos mais de uma centena de mortes confirmadas e ainda duas centenas de pessoas desaparecidas. Esse desastre já suplanta em muito o desastre ocorrido na também mineira Mariana com a mineradora Samarco, controlada pela Vale, quando 19 pessoas perderam a vida e o vazamento dos rejeitos causou perdas incalculáveis ao meio ambiente.

Esse foi o maior tema da última semana no país mas ele não está sendo trazido ao StatPop por isso. Ele está sendo veiculado aqui por conta da repetida menção à avaliação de riscos em muitas das menções a essa catástrofe. Efetivamente, houve uma falha (gravíssima, nesse caso) em um projeto de Engenharia e falhas em Engenharia estão inexoravelmente ligadas a avaliação de riscos. Existem inúmeros aspectos técnicos associados a falhas. Ela pode ter sido de projeto, de execução, de manutenção ou até de uma combinação de algumas das causas acima. Não tenho capacidade técnica para tratar desse ponto. [Espero em breve poder trazer postagens mais esclarecedoras sobre esse aspecto.]

Li alguns textos escritos por engenheiros com experiência em minas. Esses textos explicam em detalhe como é feita a construção de barragens de rejeitos. Eles também falam sobre a necessidade de aumento dessas barragens à medida que mais rejeitos são nelas depositados. O que senti falta nesses textos foi uma discussão sobre custos e sobre as chances de falha.

E é justamente esse ponto que gostaria de discutir aqui: como se operacionaliza uma avaliação de riscos. Ela envolve uma infindável de sequência de eventos mas termina com uma recomendação, com vistas a uma tomada de decisão. A recomendação deve ser sempre alicerçada por uma quantificação da probabilidade de possíveis eventos. Esse ponto já foi tratado aqui.

O ponto que merece atenção aqui é que todo processo de tomada de decisão não envolve apenas o cálculo das probabilidades envolvidas. A outra componente imprescindível da avaliação de risco é, como já dissemos antes, o custo associado a (ou a utilidade de) cada possível ação. Assim, eventos com probabilidades baixas podem influenciar mais ou menos a nossa decisão de acordo com as consequências a ela associadas.

Tomemos como exemplo a situação em tela: construção de barragem de rejeitos. Simplificadamente, os elementos que se precisa são as probabilidades de rompimento da barragem e as utilidades ou custos de cada ação de prevenção adotada. O cálculo dos custos está muito longe de ser trivial. Como quantificar a perda de uma vida? Apenas pelo custo das indenizações associadas? Como quantificar um desastre ambiental? Apenas pelas perdas financeiras das populações das vizinhas à área atingida?

De todo mundo esse custo, uma vez quantificado, deve ser contrastado contra os custos de construção e manutenção da barragem e ponderados pelas respectivas probabilidades dos eventos associados. Com isso, pode-se calcular a perda esperada de cada ação. As possíveis ações aqui são as diferentes políticas de construção e de manutenção das barragens.

Suponhamos que existam apenas 2 ações possíveis no caso de uma barragem de rejeitos: construção/manutenção de forma econômica (E) ou de forma abrangente (A). Suponhamos que o custo de A seja 10 vezes maior que o custo de E. Suponha também que as probabilidades de rompimento da barragem sejam de 0,1% para E e 0,001% para A. Vamos supor também que o custo de um rompimento seja 10.000 vezes maior que o custo de E. [Esses custos não são necessariamente quantificados em reais ou dólares mas em unidades monetárias mais amplas, que podem envolver (in)satisfação ou (des)prazer dos atingidos pelas ações tomadas.]

As perdas esperadas então são:

  • A: 10.000 x 0,00001 + 10 x 0,99999 = 10,0099
  • E: 10.000 x 0,0001  + 1 x 0,9999 = 1,9999
Por essas contas, espera-se uma perda cinco vezes maior (10,0099/1,9999 ~ 5) para o tratamento econômico da barragem. Portanto, a decisão correta nesse caso seria investir mais na prevenção de desastres. Não estou aqui nem de longe sugerindo que os números acima constituem uma quantificação correta da situação recentemente ocorrida. Tampouco estou dizendo que qualquer acontecimento, por mais trágico que seja, possa ser reduzido a números. Só estou tentando mostrar como a teoria de decisão poderia ser utilizada para auxiliar a correta tomada de decisão em qualquer problema, por mais doloroso ou complexo que ele seja.  

Por fim, resta destacar que o mesmo problema pode ter diferentes soluções dependendo de quem é o tomador de decisões. No caso de mineração, ele pode ser a empresa mineradora, pode ser a população atingida, pode ser o poder público. Para cada um desses decisores, os custos podem ser alterados ao contemplar outros elementos como ganhos/perdas associados com os empregos gerados para a população e os impostos pagos aos cofres públicos pela atividade mineradora. Tudo isso só ilustra a complexidade do problema e a cadeia de avaliações que precisa ser utilizada para a correta quantificação de atividades econômicas em todas as suas vantagens e desvantagens.  


terça-feira, 29 de janeiro de 2019

Fracaso e Acaso

https://www.rocco.com.br/livro/?cod=3026

O título desta postagem é o nome de um livro recentemente lançado pela Editora Rocco. O livro tem como sub-título: uma reflexão sobre erros, acertos e o papel do aleatório em nossas vidas. O livro é escrito por Ricardo Horowicz e Luiz Alberto Py e pode ser encontrado em várias livrarias virtuais e físicas. O primeiro autor é um físico teórico que chegou a trabalhar na Universidade de São Paulo, onde liderou o grupo de ótica quântica. Atualmente, trabalha no mercado financeiro para a gigante TCW Asset Management, baseada em Los Angeles, no desenvolvimento de ferramentas de apoio às operações financeiras. O segundo autor é um psicanalista de renome e de larga experiência nos ramos da Psicologia e da Psicanálise no Rio de Janeiro. Autor de vários livros e consultor de inúmeros meios de comunicação, tendo assinado colunas por vários anos em revistas e jornais. 

A pouco usual parceria entre um profissional das áreas humanas com outro das ciências exatas deu um tempero único ao texto. Teorias das duas grandes áreas do saber puderam ser combinadas e interrelacionadas. Isso deu um toque especial que permeou toda a narrativa.

Acho que o sub-título é um ótimo resumo do que trata o livro. Ele apresenta um estudo dissecando inúmeros aspectos da vivência humana e do seu relacionamento com o meio ambiente e com os outros seres humanos. A recorrente e inevitável discussão sobre a questão fatores genéticos (nature) x meio ambiente (nurture) não escapou. Ela também está presente com uma discussão dos aspectos psicólogicos, mas sempre que possível, amparada por estudos da natureza bio-fisico-química assocada às nossas reações como seres humanos. 

Mas o livro vai muito além disso. Ele detalha item a item cada um dos aspectos relacionados à nossa existência. Temas como inveja, desejos, ambição, memória, tempo, arrependimento, dinheiro e livre-arbítrio e tantos outros foram tratados. Sua influência no nosso sucesso ou fracasso é estudada e sempre pontuada em termos do peso que o acaso pode ou não ter.

Assim, trata-se de um apanhado detalhado e minucioso do que nos constitui como espécie humana e do papel desempenhado por eventos fortuitos que intercorrem ao longo da nossa vida. Algumas décadas atrás, quando John Lennon compos Beautiful Boy em homenagem ao seu recém-nascido filho, ele profetizou: "...life is what happens to you when you are busy making other plans..." (vida é o que acontece a nós enquanto estamos ocupados fazendo outros planos, em português). Mal sabia ele que sua vida teria uma imediata e trágica concretização dessa idéia: meses após gravar a música para o disco, ele foi alvejado mortalmente na calçada de casa pelo seu admirador Mark David Chapman.

O livro ajuda a entender e contextualizar o peso que situações como essa tem na nossa vida. O livro trata seus assuntos de forma não-trivial e relativamente profunda. Assim, recomendo fazer como eu e ir lendo o livro aos poucos, aproveitando as férias ou momento de lazer, mais apropriados à reflexão. 

Tenho o privilégio de conhecer o Ricardo desde a minha pré-adolescência mas, como não o vejo há muitos anos, estou seguro da neutralidade de minha avaliação positiva. Tenho até certas ressalvas à tese do livro de que o acaso desempenha um papel muito grande nas nossas vidas. Já expus uma parte de meu ponto vista em postagem anterior. Mas certamente não fiz essa defesa com a abrangência, eloquência, elegância e profundidade que os autores usaram nesse livro.

Vale a pena conferir!  

terça-feira, 22 de janeiro de 2019

Aprendizagem de máquina leva matemáticos a um problema insolúvel*

Alfred Eisenstaedt/ LIFE Picture Coll./Getty

por Davide Castelvecchi

Uma equipe de pesquisadores esbarrou em uma questão que é matematicamente irrespondível porque está ligada a paradoxos lógicos descobertos pelo matemático austríaco Kurt Gödel, nos anos 1930, que não podem ser resolvidos usando a matemática padrão.

Os matemáticos, que estavam trabalhando em um problema de aprendizagem de máquina, mostram que a questão da "capacidade de aprendizado" - se um algoritmo pode extrair um padrão de dados limitados - está ligada a um paradoxo conhecido como a hipótese do contínuo. Gödel mostrou que a afirmação não pode ser comprovada como verdadeira ou falsa usando linguagem matemática padrão. O último resultado apareceu no dia 7 de janeiro no Nature Machine Intelligence[1].

"Para nós, foi uma surpresa", diz Amir Yehudayoff, do Instituto de Tecnologia Technion-Israel, em Haifa, co-autor do artigo. Ele diz que, embora haja um número de questões matemáticas técnicas que são conhecidas como "indecidíveis", ele não esperava que esse fenômeno aparecesse em um problema relativamente simples no aprendizado de máquina.

John Tucker, um cientista da computação na Universidade de Swansea, no Reino Unido, diz que o artigo é "um resultado pesado nos limites do nosso conhecimento", com implicações fundamentais para a matemática e o aprendizado de máquina.

Nem todos os conjuntos são iguais

Os pesquisadores geralmente definem a capacidade de aprendizado em termos de se um algoritmo pode generalizar seu conhecimento. O algoritmo recebe a resposta para uma pergunta "sim ou não" - como "Essa imagem mostra um gato?" - para um número limitado de objetos e, em seguida, precisa adivinhar a resposta para novos objetos.

Yehudayoff e seus colaboradores chegaram a seu resultado enquanto investigavam a conexão entre capacidade de aprendizado e "compressão", que envolve encontrar uma maneira de resumir as características salientes de um grande conjunto de dados em um conjunto menor de dados. Os autores descobriram que a capacidade da informação de ser comprimida eficientemente se resume a uma questão na teoria de conjuntos - coleções matemáticas de objetos, como os conjuntos nos diagramas de Venn. Em particular, refere-se aos diferentes tamanhos de conjuntos contendo infinitamente muitos objetos.

Georg Cantor, o fundador da teoria dos conjuntos, demonstrou na década de 1870 que nem todos os conjuntos infinitos são criados iguais: em particular, o conjunto de números inteiros é "menor" que o conjunto de todos os números reais, também conhecido como continuum. (Os números reais incluem os números irracionais, bem como os racionais e inteiros.) Cantor também sugeriu que não pode haver conjuntos de tamanho intermediário - isto é, maiores que os inteiros, mas menores que o contínuo. Mas ele não foi capaz de provar essa hipótese contínua, nem muitos matemáticos e lógicos que o seguiram.

Seus esforços foram em vão. Um resultado de 1940 de Gödel (que foi completado na década de 1960 pelo matemático americano Paul Cohen) mostrou que a hipótese do contínuo não pode ser provada nem verdadeira nem falsa a partir dos axiomas padrões - as afirmações tomadas como verdadeiras - da teoria dos conjuntos, que são comumente tomados como base para toda a matemática.

O trabalho de Gödel e Cohen sobre a hipótese do continuum implica que podem existir universos matemáticos paralelos que são compatíveis com a matemática padrão - um em que a hipótese do contínuo é adicionada aos axiomas padrão e, portanto, declarada como verdadeira e outra na qual é declarada falso.

Limbo da capacidade de aprendizado

No último artigo, Yehudayoff e seus colaboradores definem a capacidade de aprendizado como a habilidade de fazer previsões sobre um grande conjunto de dados por amostragem de um pequeno número de pontos de dados. O link com o problema do Cantor é que existem infinitas maneiras de escolher o conjunto menor, mas o tamanho desse infinito é desconhecido.

Os autores mostram que, se a hipótese do contínuo é verdadeira, uma amostra pequena é suficiente para fazer a extrapolação. Mas se for falso, nenhuma amostra finita pode ser suficiente. Dessa forma, eles mostram que o problema da capacidade de aprender é equivalente à hipótese do contínuo. Portanto, o problema da capacidade de aprendizado também está em um estado de limbo que só pode ser resolvido escolhendo o universo axiomático.

O resultado também ajuda a dar uma compreensão mais ampla da capacidade de aprendizado, diz Yehudayoff. “Essa conexão entre compressão e generalização é realmente fundamental se você quiser entender o aprendizado.”

Pesquisadores descobriram uma série de problemas "indecidíveis", diz Peter O'Hearn, cientista da computação da University College London. Em particular, seguindo o trabalho de Gödel, Alan Turing - que foi um dos fundadores da teoria dos algoritmos - encontrou uma classe de questões que nenhum programa de computador pode ter a garantia de responder em qualquer número finito de passos.

Mas a indecidibilidade nos resultados mais recentes é "de um tipo raro", e muito mais surpreendente, O’Hearn acrescenta: aponta para o que Gödel descobriu ser uma incompletude intrínseca em qualquer linguagem matemática. As descobertas provavelmente serão importantes para a teoria do aprendizado de máquina, acrescenta ele, embora “não tenha certeza se terá muito impacto na prática”.

Referência
[1]. Ben-David, S., Hrubeš, P., Moran, S., Shpilka, A. & Yehudayoff, A. (2019). Nature Machine Inteligence 1, 44–48 (2019).

=============================
Artigo publicado na Nature, vol 565, pag 277, em 08 de janeiro de 2019.

terça-feira, 15 de janeiro de 2019

Estatística do Ano 2018*

https://www.statslife.org.uk/news/4026-statistics-of-the-year-2018-winners-announced

O anúncio das Estatísticas do Ano de 2018 teve um tema distintamente ambiental, uma vez que as estatísticas relativas a resíduos de plástico e o uso de energia solar surgiram como as vencedoras das categorias Internacional e do Reino Unido deste ano, respectivamente. 

As inscrições elogiadas cobrem uma infinidade de outras questões, desde a redução da "pobreza absoluta" global até o número de Jaffa cakes [NT: um tipo de biscoito tradicional do Reino Unido] presentes em seu tubo de Natal - ilustrando o fenômeno da "encolhimento".

A estatística internacional vencedora de 2018 é 90,5%: a proporção de resíduos plásticos que nunca foram reciclados. Estimados em 6,3 bilhões de toneladas métricas, acredita-se que cerca de 12% de todos os resíduos plásticos tenham sido incinerados, com cerca de 79% acumulados em aterros sanitários ou no ambiente natural (provenientes do artigo Production, use, and fate of all plastic ever made de R Geyer, JR Jambeck e K Lavender Law). 

"É muito preocupante que uma proporção tão grande de resíduos de plástico nunca tenha sido reciclada", diz o presidente da RSS, Sir David Spiegelhalter, que presidiu o painel de jurados do Stats of the Year. Esta estatística ajuda a mostrar a escala do desafio que todos enfrentamos. Foi justamente chamada de "Estatística Internacional do Ano" do RSS para 2018."

O vencedor da estatística do Reino Unido de 2018 é de 28,7%: a porcentagem máxima de toda a eletricidade produzida no Reino Unido devido à energia solar em 30 de junho deste ano. Este número surpreendente reflete o fato de que a energia solar era, embora apenas brevemente, a principal fonte de eletricidade do país - à frente do gás (proveniente da Electric Insights).

A ex-estatística nacional, Dame Jil Matheson, que também estava no painel de julgamento da SOTY [NT: abreviatura de Statistics of the Year], chamou a estatística de "uma figura muito bem-vinda". "2018 foi um ano marcante para a eletricidade gerada por energia solar no Reino Unido - assim como para energia renovável em geral", acrescentou ela.

"As estatísticas dessa lista captam alguns dos sinais dos tempos de 2018", diz o diretor executivo da RSS, Hetan Shah. "Ficamos encantados com a qualidade e quantidade das indicações deste ano - com mais de 200 recebidas". Hetan explicou o significado das inscrições vencedoras em um pequeno vídeo.

Agora, em seu segundo ano, as Estatísticas do Ano pretendem mostrar as histórias às vezes surpreendentes que os números podem nos dizer sobre o mundo. Além de David Spiegelhalter e Jil Matheson, outros jurados do painel incluem o editor de assuntos domésticos da BBC, Mark Easton, e a editora de dados do Guardian, Mona Chalabi.

Várias estatísticas surpreendentes foram selecionadas como "altamente elogiadas"; aquelas sob a categoria Internacional são as seguintes:

9,5%: a redução do ponto percentual na "pobreza absoluta" mundial nos últimos dez anos - o que significa que a proporção de pessoas que vivem nessa condição caiu para menos de metade desde 2008. (originada do Banco Mundial em 2018 e 2008).

64.946: o número de casos de sarampo na Europa de novembro de 2017 a outubro de 2018 (proveniente da Organização Mundial da Saúde).

40%: a porcentagem de homens russos que não vivem até os 65 anos de idade - a idade proposta para a aposentadoria dos homens (proveniente do Times, Independent, Guardian e da Organização Mundial da Saúde).

US$ 1,3 bilhão: o valor bateu o valor do Snapchat em um dia de um tweet Kylie Jenner (fornecido pela Reuters, CNBC, Business Insider e The Guardian).

As estatísticas do Reino Unido "altamente elogiadas" para 2018 são:

6,4%: o percentual de diretores executivos do sexo feminino dentro das empresas do FTSE 250 (proveniente do The Female FTSE Board Report 2018 da Cranfield).

85,9%: a proporção de trens britânicos que funcionaram no horário - a mais baixa por mais de uma década (proveniente do Desempenho de Trens de Passageiros e Fretes 2018-19 Q2 Release Estatístico, Escritório de Rodovias e Ferrovias).

82%: a porcentagem de todas as lojas de varejo da Grã-Bretanha que ainda estão em lojas físicas, em vez de on-line (provenientes de vendas de lojas físicas e vendas on-line com varejo on-line: agosto de 2018, Office for National Statistics).

16,7%: a redução percentual no número de Jaffa cakes no tubo de Natal da McVities [NT: tradicional fabricante britânica de biscoitos], ilustrando assim o conceito de shrinkflation [NT: neologismo inglês para representar o fenômeno de manter o preço de um produto mas diminuir o seu volume].

=====================
* - artigo publicado em 17 de dezembro de 2018 pela StatsLife, o boletim da RSS.

terça-feira, 18 de dezembro de 2018

Retrospectiva 2018

http://www.capes.gov.br/sala-de-imprensa/noticias/9274-a-flor-da-pele-a-emocao-de-receber-o-premio-capes-de-tese-2018

Fim de ano chegando com as inúmeras festas de confraternização acontecendo. É época de balanços sobre o passado, o presente e o futuro. O StatPop não foge a essa regra e revê os temas que tiveram maior participação e maior impacto ao longo do ano. É bom deixar claro que se trata de uma avaliação essencialmente subjetiva sobre o que foi mais relevante.

Revendo as postagens do ano, tivemos um tema claramente vencedor que foi a Ciência dos Dados. Vários assuntos a ela relacionados foram tratados e talvez o ponto alto para nós tenha sido a visita do Prof. Michael Jordan à UFRJ. Jordan é um dos pesquisadores mais influente se não o mais influente dessa área. A sua visita serviu para traçar um panorama desse setor, que não para de crescer no mundo todo, mas que ainda engatinha no Brasil. Ele procurou caracterizá-lo como uma janela de oportunidades para a interação entre Estatística, Computação e Matemática. Esperemos que assim seja por aqui mas os primeiros sinais apresentam desenvolvimentos separados dessas áreas, tornando-os necessariamente mais frágeis. Vamos torcer e também trabalhar, na medida do possível, para que esse quadro seja realinhado na direção correta.

Outro tema que abalou a sociedade brasileira e foi repercutido aqui no StatPop foram as eleições presidenciais de outubro. Houve uma forte polarização da sociedade, provocando inúmeras discussões acaloradas até mesmo dentro do seio familiar com consequências ainda não definidas. Passado o período do pleito, os ânimos serenaram um pouco e houve um movimento em direção ao normal mas as sequelas ainda estão presentes. Tanta inflexão emocional teve seu peso em termos das análises das pesquisas de opinião. As rápidas mudanças de humor, potencializadas pela influência sem precedentes das mídias sociais, foram difíceis de serem captadas. Isso provocou uma série de informações desencontradas entre o que as pesquisas prévias de opinião e o resultado das urnas, especialmente no 1o turno das eleições. Acho que existem importantes lições a serem tiradas desse evento, tanto para a forma de divulgação das pesquisas como para a sua compreensão pelo grande público.

Finalmente, o último tema que merece ser destacado é a avaliação da Ciência brasileira. Fiquei surpreso com a quantidade de postagens que foi dedicada ao tema pelo StatPop neste ano. Acredito que isso possa ser um reflexo do momento que passei neste ano. O ano começou com as homenagens que recebi durante o EBEB. Teve alguns outros envolvimentos ao longo do  ano. Ao seu término, houve alguns envolvimentos em premiações a teses de jovens recém-graduados. Participei de uma comissão avaliadora de um grande prêmio nacional de teses e tive o prazer de uma sobrinha ser contemplada em outra premiação nacional de teses. Para completar o ano, ainda participei como patrono da formatura de uma turma de graduação.

terça-feira, 11 de dezembro de 2018

O futuro da Ciência brasileira

http://www.capes.gov.br/sala-de-imprensa/noticias/7771-vencedor-do-grande-premio-capes-de-tese-fala-sobre-a-conquista

Nesta 5a feira, dia 13 de dezembro, terá lugar na CAPES a cerimônia de premiação dos agraciados no Premio CAPES de Teses de 2018. Os premiados de cada área já foram anunciados em 01 de outubro e irão à cerimônia para receberem a justa homenagem pelo feito atingido. Esse Premio foi instituído há alguns anos e visa dar visibilidade à nata da inovação científica em termos de geração dos futuros candidatos a lideres de grupos de pesquisa pelo Brasil afora.

Todos os premiados a cada ano são escolhidos dentre as teses defendidas no ano anterior para cada uma das 49 áreas da Ciência, sendo a divisão estabelecida pela CAPES. Assim, é de se esperar que a lista dos vencedores contenha apenas trabalhos de excelente nível. Além disso, esse reconhecimento tem um benefício indireto de dar visibilidade à produção científica realizada em todo o país, tarefa em geral silenciosa e pouco afeita aos holofotes da mídia. A iniciativa parece estar dando certo pois o número de inscrições para esse prêmio vem subindo progressivamente, tornando o concurso ainda mais competitivo. Além do importante reconhecimento recebido, que sempre faz bem ao agraciado, haverá premiação financeira com apoios a apresentação de trabalhos em congresso e uma bolsa para estágio pos-doutoral no exterior.

Dentre as instituições de onde estudaram os 49 vencedores do prêmio deste ano há uma supremacia bastante destacada da USP com 13 vencedores, seguida de longe pela UFRGS com 5 vencedores, UFMG com 4 vencedores e PUC-RJ, UFPE e UFRJ com 3 vencedores. Além dos vencedores das áreas, existe a possibilidade de menções honrosas em cada uma das áreas. Tive a alegria de ser o orientador de uma tese que recebeu menção honrosa da área de Matemática/Probabilidade e Estatística na edição de 2014 do Prêmio.

Mas os 49 vencedores não irão à cerimônia apenas para receberem seu prêmio. A CAPES instituiu também o Grande Prêmio CAPES de Teses, onde grandes áreas pré-estabelecidas terão suas áreas agregadas em 3 grandes grupos: Ciências Exatas/Engenharias, Ciências da Saude e Ciências Humanas. Assim, esses 49 vencedores também concorrerão a esses 3 Grandes Prêmios. Cada um dos 3 premiados será agraciado com a distinção extra de ser considerado o melhor entre os melhores e além disso terá benefícios financeiros palpáveis:15 mil dólares mais um estágio pos-doutoral. Os 3 prêmios receberam o nome de personalidades científicas importantes dessas 3 grandes áreas e os seus vencedores só serão divulgados durante a cerimônia.

O prêmio da área de Ciências Exatas/Engenharias congregou 11 áreas e recebeu o nome de Luis Alberto Coimbra, para homenagear o fundador da COPPE, da UFRJ. Coimbra foi um pioneiro da Engenharia brasileira, que infelizmente faleceu em maio deste ano aos 94 anos. Assim, achei bastante apropriado que ele emprestasse seu nome a essa distinção.  A distribuição dos 11 concorrentes, os vencedores das áreas de Ciências Exatas/Engenharias foi distribuída entre USP com 4 premiados (sendo 2 do campus de São Paulo e 2 do campus de São Carlos), 2 da UFMG e 1 de IMPA, INPE, Mackenzie, PUC-RJ e UNESP. Chama a atenção que a grande maioria (7 das 11 teses) ter se concentrado em teses defendidas no estado de São Paulo. 

Eu tive o prazer de fazer parte da Comissão de seleção do premiado. O prazer foi em parte proporcionado pela alta qualificação dos outros membros da Comissão, o que facilitou a tarefa de escolha. A outra parte do prazer foi ter tido a oportunidade de conhecer de forma um pouco mais detalhada o trabalho desenvolvido pelos concorrentes. Isso nos deixou bastante à vontade por termos constatado que qualquer um dos 11 candidatos poderia ser o vencedor sem grande margem de erro. 

Todos os trabalhos traziam uma alta quantidade de novos conhecimentos de qualidade que foram gerados e que encontraram/encontrarão uma vitrine de destaque no cenário científico internacional. Também chamou nossa atenção a multidisciplinariedade dos trabalhos, com vários deles envolvendo o uso de ferramentas e técnicas não só de sua área de atuação como também de outras áreas vizinhas. Finalmente foi interessante ver várias teses gerando contribuições com resultados concretos ou em vias de serem concretizados com retornos imediatos para a sociedade. Exemplos envolveram geração e identificação de propriedades de novos equipamentos, novos materiais, novos combustíveis, novas vacinas e novos sistemas de coleta de dados e de informação. Como se pode ver, trata-se de uma gama bastante abrangente de contextos.

No final, os membros das comissões selecionadoras tiveram um dia muito agradável em Brasília, onde se pode ver um pouco do que o futuro guarda para a Ciência brasileira e a perspectiva é muito boa. Estamos conscientes que o que foi visto lá está longe de ser representativo do universo de teses produzidas no país; tivemos acesso ao topo do topo. Mas foi muito bom e promissor ver tantas teses de tão boa qualidade. Precisamos agora torcer e propiciar o ambiente de trabalho apropriado para que todo esse potencial possa encontrar seguimento e se materialize em pesquisadores com sólidas carreiras e, quem sabe, liderando grupos de pesquisa e emulando em seus colegas a ambição por alçar vôos cada vez mais altos em busca da geração de conhecimento de ponta.  

A lista completa dos vencedores de 2018 pode ser vista aqui.

terça-feira, 4 de dezembro de 2018

Guia do Estudante 2018

https://guiadoestudante.abril.com.br/

Foi divulgada mais uma edição das avaliações dos cursos pelo Guia do Estudante, da Editora Abril. Na área de Estatística, foram avaliados 35 cursos de graduação entre instituições públicas e privadas. O resultado de uma certa maneira reproduz o resultado da edição de 2015, que já haviamos divulgado aqui. Lá, falamos sobre essa avaliação, fazendo as devidas ressalvas. Naquele ano, cursos de apenas 5 instituições obtiveram a pontuação máxima de 5 estrelas: 3 universidades paulistas, 1 nordestina e a UFRJ. Nesta edição, houve um pequeno aumento para 6 das instituições com pontuação máxima, sendo 4 paulistas, 1 mineira e a UFRJ. 

Chama muito a nossa atenção a expressiva participação do Estado de SP na formação de alta qualidade em Estatística. Também chamou a minha atenção que 2 dessas instituições fossem na cidade de São Carlos. (As outras 2 foram as tradicionais USP e Unicamp.) Juntando com outras informações que recebo tanto da área de Estatística como de outras áreas, parece-me que essa pequena cidade está tendo destaque crescente na área acadêmica. Se ela ainda não conta com o prestígio emprestado por uma USP, na cidade de São Paulo, ou uma Unicamp, na cidade de Campinas, não deveria ser surpresa para ninguém se em breve ela comece a ocupar rotineiramente as mesmas prateleiras de destaque que essas líderes ocupam no cenário paulista.

A avaliação dos cursos de graduação em Estatística deste ano listou 35 instituições e a elas foram atribuídas as pontuações de 5 estrelas (máxima), 4 estrelas, 3 estrelas e nenhuma estrela. Não sei dizer o que fez com que instituições fossem listadas nessa última categoria. Pode ter sido por uma baixa avaliação mas mais provavelmente se deveu a  alguns requisitos não terem sido atendidos. Entre esses, podem ser citados a pouca idade do curso, a inexistência de informação junto ao mercado de trabalho ou indisponibilidade de dados por parte das instituições. A grande maioria dos cursos (30 dos 35), entretanto, foi classificada em 5, 4 ou 3 estrelas.

É interessante comparar a Estatística com algumas de suas áreas vizinhas. A Matemática exibe centenas de cursos avaliados, incluindo Bacharelados e Licenciaturas. Dentre essas centenas de cursos, apenas 21 foram algum de seus cursos contemplados com 5 estrelas, sendo 8 paulistas, 3 mineiras, 3 fluminenses, 3 gauchas, 2 paranaenses, 1 baiana e uma brasiliense. Novamente, a presença paulista se destaca embora em proporção mais similar ao tamanho da população do estado que a proporção de cursos com nota máxima de Estatística.

Já a área de Atuária teve apenas 14 cursos avaliados, sendo que nenhum obteve pontuação máxima de 5 estrelas, 7 obtiveram 4 estrelas, 3 obtiveram 3 estrelas e 4 não obtiveram estrelas. Juntando com a área de Estatística, USP, UFRJ e UFMG foram as únicas instituições a terem cursos de Atuária e de Estatística com a pontuação máxima em ambas as áreas.

A lista completa da Estatística pode ser obtida aqui e está reproduzida abaixo

5* - USP/SP, USP/SC, UNICAMP, UFRJ, UFMG, UFSCAR

4* - UFU, UFC, UFSM, UFJF, UFRGS, ENCE, UFPE, UFPA, UFPR, UFPB, UFRN, UNB

3* - UFF, UFOP, UNESP/PP, UFMT, UFCG, UFG, UEM, UFBA, UFAM, UERJ, UEPB, UFES

0* - UFPI, UFRondonia, FMU/SP, UFS, CUC/SP

terça-feira, 27 de novembro de 2018

1a Conferência de Estatística e Ciência dos Dados

http://www.csds.ime.ufba.br/

Aconteceu há 2 semanas atrás a 1a Conferência de Estatística e Ciência dos Dados, organizada em Salvador pela Universidade Federal da Bahia. A conferência procurou congregar profissionais e pesquisadores da diferentes áreas que abrigam o guarda chuva de Ciência de Dados, especialmente Estatística, Computação e Matemática. O evento contou com um pouco menos de uma centena de participantes de várias partes do país e também do exterior, notadamente de países vizinhos da América Latina.

Vários trabalhos foram apresentados e houve uma razoável e saudável interação e troca de idéias entre profissionais das áreas listadas acima. O evento teve conferências, várias mesas redondas e minicursos em temas ligados à Ciência de Dados. Vários trabalhos também foram apresentados, com destaque para apresentações de iniciativas de utilização de grandes massas de dados na resolução de problemas concretos reais. Uma iniciativa que chamou minha atenção foi o laboratório montado na Universidade Federal de Viçosa para tratamento de grandes bancos de dados para oferecimento de soluções a diversas instituições. Esse laboratório tem vários trabalhos em andamento, em colaboração com instituições públicas, como ilustrado aqui. A propósito, me pareceu interessante o prefeito de um município mineiro ter participado do evento com apresentação de trabalho, resultante dessa colaboração. Veja no programa do evento a sessão convidada sobre Data Science for Smart Cities (Ciência dos Dados para Cidades Inteligentes). 

Apesar do evento ter durado 3 dias, minha participação ficou confinada, por restrições na minha agenda, ao último dia de atividades. Fui convidado para apresentar a conferência de encerramento e participar de uma mesa redonda sobre Ciência de Dados no Brasil. Minha participação na mesa redonda se restringiu a apresentar um pouco da minha visão sobre a situação da área no Brasil. Assim, falei um pouco sobre minha preocupação com a inexistência de trabalhos de pesquisa aqui no Brasil. Já falei aqui do que tenho visto de inovações na área em eventos fora do país e que não vejo reproduzido aqui. O que mais tenho visto por aqui são aplicações de técnicas já conhecidas para solução de problemas. Isso não está ruim pois demonstra que os usuários de Estatística e de análise de dados estão sintonizados para os avanços realizados no mundo. Mas é pouco para o output que se espera de universidades brasileiras.

Outro ponto que também defendi foi a criação de mais cursos voltados especificamente para Ciência de Dados. Atualmente já existem algumas especializações no pais com esse fim a nível de pós-graduação. No entanto, só tenho conhecimento de um único curso de graduação nesse tema. E mesmo esse curso, forma tecnólogos em uma graduação de apenas 3 anos. Acredito que existe um interesse muito grande pela área por parte dos alunos terminando o ensino médio e esse interesse tem sido frustrado e/ou atendido de forma incompleta por algumas graduações (notadamente de Estatística e Computação) com ênfases na área.

Acho que graduações formais explicitando essa área de formação poderiam atrais alunos com esse interesse. Essas graduações podem ser estruturadas com relativa facilidade se houver uma concertação de interesses entre os Departamentos de Estatística, de Computação e de Matemática existente em diferentes universidades do país. Várias dessas universidades tem atividades de pesquisa nessas áreas. Essas investigações poderiam dar o suporte científico (para além do suporte tecnológico) necessário a um curso formador de profissionais plenamente capacitados em Ciência de Dados. Isso significa formar profissionais que entendam como os importantes avanços dessas áreas podem ser concatenados para fornecer uma visão abrangente das análises de grandes massas de dados. E, principalmente, dar a esses alunos a base para que entendam e sejam capazes de analisar criticamente os vários avanços que vem regulamente sendo propostos na área.

Alguns entendem que o caminho que descrevi no parágrafo anterior apontam para o fim da Estatística.  Outros entendem que o que descrevi poderia ser atendido com poucas mudanças na grade curricular da formação de um estatístico. Acho que deve-se ser capaz de propor soluções cada vez mais requeridas pelo mercado de trabalho. A descrição que fiz no parágrafo anterior é relativamente próxima da formação de um estatística e até de outras áreas de Computação e Matemática. Isso deveria ser um fator facilitador e não complicador. Por exemplo, muitas universidades já tem implementadas formações duplas, onde com um pouco de atividades didáticas adicionais, os alunos podem sair da universidade com 2 diplomas. Assim, o aluno de graduação de uma das áreas já existentes (Estatística, por exemplo) poderia sair com dupla formação em Ciência de Dados e sua área atual. Quem seguir esse caminho, fatalmente sairá na frente e certamente poderá atrair alunos interessados e de bom nível. 

terça-feira, 20 de novembro de 2018

Super erupção vulcânica apocalíptica que poderia DESTRUIR a civilização está muito mais próxima do que pensávamos - parte II

https://www.hakaimagazine.com/sites/default/files/facebook-sakurajima.jpg

A foto acima é do vulcão Sakurajima, no Japão, um dos vulcões mais ativos do mundo. Ela foi escolhida por abrir as apresentações que o Professor Jonathan Rougier faz sobre o seu trabalho, que foi o assunto da postagem da semana passada. O professor Rougier teve a gentileza de nos responder para dar sua visão sobre o seu trabalho, sobre a repercussão que ele teve na mídia e sobre qual a avaliação que ele fez de todo esse processo. Ele não só fez isso como nos enviou o material que ele usa nas palestras que ele faz sobre o assunto. O arquivo das apresentações pode ser visualizado aqui. A íntegra da avaliação que o professor Rougier fez do processo segue (traduzida) abaixo:

O que aconteceu com o artigo foi que meus coautores ficaram entusiasmados com o resultado, quando finalmente emergiu de forma inequívoca - levou muito tempo para descobrir como lidar com as limitações das observações de uma maneira simples e transparente. Então falei com a assessoria de imprensa, e eles disseram, mais ou menos, que "todo mundo gosta de uma história de vulcão, e todo mundo gosta de uma história de fim de civilização, então você definitivamente deveria fazer um comunicado à imprensa". Eles me ajudaram a escrever um, que era uma mistura de narrativa e citações. Veja aqui.

Isso tornou mais fácil para os meios de comunicação produzir uma reportagem.

O comunicado de imprensa permitiu-me expressar um conjunto mais amplo de pontos de vista do que estava no jornal, centrado na fragilidade do nosso mandato como civilização, aqui na superfície da Terra, e na nossa necessidade de resolver problemas mais importantes (incluindo o problema de grandes, mas não super-erupções). Vários dos meios de comunicação captaram isso. Na minha palestra sobre este documento, eu digo que nos últimos 30 anos a economia global se desenvolveu sob o ímpeto de crescimento e lucro, e nenhuma atenção foi dada à resiliência, e a população mundial aumentou de 4,5 bilhões para 7,5 bilhões. O resultado é que nós humanos nunca fomos mais vulneráveis. Eu acho que Peter Hess do site Inverse realmente entendeu a mensagem, daí "surpreendentemente frio" - o que fez todos os meus co-autores rirem!

[Nota da tradução: Peter Hess publicou uma postagem no site da Inverse sobre o assunto, tendo como título "Vulcanologista que mudou a data da próxima super-erupção está surpreendentemente frio".]

Seguimos um modelo bastante padrão para divulgar o comunicado à imprensa e o jornal, e a Elsevier, editora do artigo, foram úteis. O comunicado de imprensa foi divulgado na manhã de segunda-feira, e as matérias foram embargadas até o meio-dia de quarta-feira, quando a Elsevier disponibilizou o artigo na Science Direct. Nesse intervalo de tempo, lidei com consultas por e-mail, cerca de sete no total, incluindo várias trocas com Peter Hess. Eu monitorei o Google News para 'super-erupção' e as histórias começaram a sair imediatamente: as manchetes do End Times foram as primeiras!

[Nota da tradução: End Times Headlines é um site que relaciona vários aspectos da sociedade, inclusive Ciência, com assuntos religiosos e publicou uma postagem sobre esse trabalho.]

Uma coisa interessante é que todos, incluindo o nosso escritório de imprensa, queriam uma imagem de um vulcão com uma super-erupção. Eu tive que explicar que provavelmente nenhum ser vivente havia testemunhado uma super-erupção e vivido, e nós estabelecemos em uma foto do espaço da caldeira de Toba - Toba foi uma das maiores erupções explosivas jamais registradas. Eu incluo o artigo do Sunday Times em meus slides porque, ao tentar transmitir a magnitude de uma super-erupção, o artista inteiramente re-imaginou a estrutura da Terra.

No geral, fiquei muito feliz com a cobertura da imprensa, que, em grande parte, acompanhou de perto o comunicado de imprensa, e que, portanto, nos permitiu expressar e promover um conjunto mais amplo de pontos de vista do que o próprio documento. Eu não fiz uma contagem final, mas a história foi repercutida por centenas de meios de comunicação. Um efeito colateral divertido foi que eu recebi e-mails de todo o mundo, dizendo "Eu vi você em nosso jornal, eu não sabia que você estava trabalhando em vulcões". Outra foi que fui contactado por uma escola e pedi para dar uma palestra no dia de estudos, o que eu fiz. Acho que já falei nove vezes, com mais uma vez por vir, para todo tipo de público, incluindo uma feira de ciências.

Quando eu dou a palestra, como você pode ver nos slides, eu incluo uma descrição do comunicado de imprensa e interesse da mídia, porque é divertido e gráfico. Mas termino com uma reflexão sobre aonde nosso trabalho está indo agora. Nossa intenção é fornecer mapas de risco regionais para informar a mitigação de riscos; por exemplo, onde colocar observatórios vulcânicos. Começamos isso em 2011, mas levamos alguns anos para chegarmos a um acordo com os dados e, é claro, também estamos fazendo outras coisas! Estamos quase lá, embora eu pense que vamos produzir um artigo sobre as taxas regionais de vulcanismo primeiro.

terça-feira, 13 de novembro de 2018

Super erupção vulcânica apocalíptica que poderia DESTRUIR a civilização está muito mais próxima do que pensávamos

https://www.dailymail.co.uk/sciencetech/article-5125109/Supervolcano-eruptions-regular-expected.html

O título desta postagem poderá atrair a atenção de muitos, assim como atraiu a minha. Trata-se do título de uma reportagem publicada na seção de Ciência do reconhecido jornal britânico Daily Mail, no dia 29 de novembro de 2017. A reportagem apresenta também os sub-títulos 
  • Uma erupção seria capaz de devolver a humanidade a um estado de pré-civilização
  • As gigantescas explosões poderiam liberar mais de 1.000 gigatoneladas de cinzas no ar
  • Super erupções podem ocorrer tão regularmente quanto uma vez a cada 17.000 anos
  • A janela entre super-erupções pode ser tão curta quanto a cada 5.200 anos
Esse título atraiu a atenção da mídia britânica no final do ano passado e a matéria foi repercutida em  vários outros veículos jornalísticos de comunicação, como o The IndependentThe TimesCBC, Pulse e 24hGold. E com certeza, os sub-títulos ajudaram o clima apocalítico ensejado pelo título. Embora não contivessem nenhuma mentira, elas enfatizaram mais os aspectos mais negativos associados a essa possibilidade.

O mesmo tipo de preocupação foi externada no mesmo período, mas de forma independente do artigo do Daily Mail, pela imprensa americana. Nesse caso, a preocupação estava concentrada especificamente no campo de magma situado abaixo da superfície do Parque Nacional de Yellowstone. Exemplos de reportagens sobre isso incluem matérias do New York Post, do IFLScience! e Usa Today.

A reportagem do título foi baseada nos achados científicos reportados no artigo "The global magnitude–frequency relationship for large explosive volcanic eruptions", publicado no volume 482 do periódico científico Earth and Planetary Science Letters, em 15 de janeiro deste ano. O artigo tem autoria de 4 pesquisadores, todos da Universidade de Bristol, no Reino Unido, tendo como 1o autor o professor de Estatística Jonathan Rougier e os outros autores do Departamento de Geociências. O resumo do artigo de Rougier e seus colegas informa (em tradução feita para o português) que

Para vulcões, como para outros perigos naturais, a freqüência de grandes eventos diminui com sua magnitude, conforme capturado pela relação magnitude-frequência. Avaliar essa relação é valioso tanto para os insights que ela fornece sobre o vulcanismo quanto para o desafio prático do gerenciamento de risco. Nós derivamos uma relação global de magnitude e freqüência para explosões de erupções vulcânicas de pelo menos 300Mt de massa irrompida (ou M4.5). Nossa abordagem é essencialmente empírica, baseada nas erupções registradas no banco de dados LaMEVE. Ela difere das abordagens anteriores principalmente em nosso tratamento conservador de arredondamento e sub-notificação de magnitude. Nossa estimativa para o período de retorno de 'super-erupções' (1000Gt ou M8) é 17ka (95% CI: 5.2ka, 48ka), que é substancialmente menor do que estimativas anteriores, indicando que os vulcões representam um risco maior para a civilização humana do que se havia pensado anteriormente.

A última frase do resumo faz referência à estimativa anterior de tempo de retorno de super-vulcões, que era de 45.000 anos a 714.000 anos. Vale notar que apesar de muito mais ampla, ou seja muito mais incerta, essa estimativa anterior ainda assim guarda uma pequena interseção com a estimativa intervalar encontrada por Rougier, que vai de 5.200 anos a 48.000 anos. Foi essa novidade que atraiu a atenção da mídia e possibilitou as interpretações mais catastróficas dos resultados obtidos. O clima de pânico pode ainda ser aumentado pelo fato que as últimas super-erupções aconteceram há cerca de 20.000 anos e a estimativa pontual do tempo de retorno foi de 17.000 anos, tornando ainda mais plausível uma ocorrência para os próximos anos, décadas ou séculos. Em breve, pretendo postar uma reflexão pessoal do Professor Rougier sobre essa cobertura da mídia.

É bem verdade que a humanidade ainda não presenciou uma super-erupção. Mas os conhecimentos científicos nos garantem que tais eventos só acontecem após décadas de avisos emitidos pelo próprio planeta e, no momento, não há nenhum sinal indicando essa proximidade. Rougier tratou de esclarecer que não há motivos para alarmes. Ele procurou classificar sua descoberta com uma importante ferramenta para estabelecer novos parâmetros para (e uma redefinição da urgência de) uma nova forma de estudar a importância e influência que vulcões podem ter na nossa vida. Apenas isso!

terça-feira, 6 de novembro de 2018

Como redigir artigos científicos?

http://ijobs.rutgers.edu

Esse texto foi motivado por um pedido dos alunos do Programa de Pós-Graduação em Estatística da UFRJ para que fosse apresentado uma palestra sobre o tema. Achei o pedido extremamente oportuno e me ofereci para falar um pouco sobre o assunto, baseado na minha experiência. Essa conversa acontecerá amanhã mas resolvi deixar registrado o resultado dessa reflexão aqui no StatPop. A postagem acabou se tornando mais uma digressão sobre princípios que devem reger a redação de artigos do que uma resposta detalhada à pergunta-título dessa postagem. O texto é uma exposição mais voltada para redação de artigos científicos de Estatística. Mas desconfio que muito do que vou descrever aqui vale para várias outras áreas da Ciência, como ilustra a figura acima.

Para começar, vale dizer que a forma primordial de avanço da Ciência é através da publicação de artigos em periódicos para reportar esses avanços. Para garantir que esses textos representem avanços e não retrocessos, todo artigo é submetido a uma bateria de avaliações para verificar se ele está correto cientificamente e se suas contribuições são relevantes. Essas avaliações em geral seguem uma hierarquias, e a maioria dos periódicos científicos tem o seu Editor, que envia o artigo para um Editor Associado, que por sua vez o envia para (em geral) 2 revisores. Os revisores avaliam as contribuições do artigo e remetem sua avaliação para o Editor Associado. Com base nas avaliações dos revisores, o Editor Associado formula sua recomendação para o artigo ao Editor, que finalmente toma a decisão. As decisões mais comuns são aceitar, rejeitar e pedir para o artigo ser revisado. Nesse último caso, o artigo volta para os seus autores modificarem de acordo com o exigido pelo Editor e prepararem uma nova versão até que fique claro (para o Editor) se o artigo merece ser aceito ou rejeitado.

Embora esse processo pareça simples, ele é sujeito a uma série de circunstâncias que podem levar um artigo para um ou outro destino final. E são essas circunstâncias que é importante ter em conta antes de submeter um artigo à publicação em um dado periódico. Para começar, não custa repetir que o artigo deve apresentar resultados que demonstrem claramente um avanço relevante para a Ciência. Assim, é fundamental que os resultados obtidos sejam claramente apresentados e devidamente justificados. 

Além disso, revisores, editores e leitores de artigos em geral estão expostos regularmente a uma série de artigos científicos. Essa demanda diuturna torna difícil que eles possam dedicar a cada artigo o tempo que ele merece. Essa restrição temporal de todos os leitores faz com que seja muito importante que o artigo seja bem apresentado. Se assim for, seus leitores terão interesse em ler com toda a atenção o seu conteúdo e fazer a avaliação mais justa possível.

Grande parte de um artigo deve ser dedicada às suas contribuições mas para que o leitor se disponha a enfrentar essa tarefa, ele precisa ser atraído a ela. O que atrai mais cada leitor é dificil dizer mas grande parte vem do título, seguido do seu resumo e sua introdução, onde é descrita a área onde se insere o artigo, qual a sua contribuição e o que ela tem de diferente do que já foi feito. Essas são as partes do artigo mais facilmente digeridas por um leitor causal. Junto com a seção final de conclusões, onde serão resumidos os principais achados científicos do texto, esse material introdutório serve para dar o tom do que está por vir. Embora aparentemente de menor importância, esses trechos servirão para animar/desanimar o leitor/revisor quanto ao cerne do artigo.

Assim, título, resumo, introdução e conclusão devem enfatizar ao máximo as vantagens dos avanços contidos no artigo, mas nada além nem aquém disso. Uma subvalorização poderá fazer o revisor menos atento ficar menos propenso a entender a total relevância da contribuição científica do artigo. Uma supervalorização poderá fazer o revisor ficar mais atento e querer verificar com mais afinco a veracidade das afirmações contidas nas partes introdutórias. 

Outro ponto importante é saber avaliar o real valor da contribuição científica trazida pelo artigo. Note que esse ponto está relacionado ao parágrafo anterior mas não deve com ele ser confundido. Mesmo se você descreve corretamente que contribuições o seu artigo traz, você pode achar que essa contribuição é menor/maior do que a contribuição que o artigo efetivamente traz. Novamente, uma subvalorização/supervalorização poderá levar a uma escolha infeliz de periódico onde o artigo será publicado. Em um extremo, ter-se-á um artigo publicado em periódico aquém do seu valor e portanto com menor alcance perante a comunidade científica. No extremo oposto, tem-se um artigo enviado a um periódico acima do seu valor e portanto com maior chance de não ser bem recebido e acabar sendo rejeitado.

Esse é um "jogo" que só se aprende corretamente a jogar depois de se adquirir experiência. Essa experiência pode vir à custa de artigos muito bons saindo em periódicos de menor expressão e de artigos não tão bons que acabam sendo rejeitados. Para jogar esse "jogo", é preciso ter vontade de contribuir e não esmorecer perante as dificuldades e dissabores que negativas necessariamente trarão.

Sugestões para saber localizar melhor a prateleira onde se encontra sua contribuição passam primeiro por uma auto-avaliação, mas também passam por avaliações formais ou informais de colegas. Para isso, apresentações em congressos e seminários tem um imenso valor em função dos feed-back recebidos. As auto-avaliações são sempre mais difíceis pois em geral um artigo é fruto de um grande esforço pessoal e tendemos a vê-lo com uma pequena obra-prima. Ném sempre os outros verão nosso trabalho da mesma forma; eles não gastaram semanas ou meses na sua elaboração, nem perderam noites de sono para resolver os problemas que apareceram no meio do caminho.

Um colega me disse muitos anos atrás que se um artigo recebe várias rejeições o problema deve estar no artigo e não nos revisores que o avaliaram. Curiosamente, esse colega teve uma carreira de grande sucessos, possivelmente com poucas rejeições, e ele agora ocupa o cargo de Editor de um dos principais periódicos de Estatística. Uma outra frase que também procuro seguir é que o revisor (quase) sempre tem razão. Se ele reclama de algum trecho do artigo que julgamos estar correto, é porque nós não soubemos explicá-lo bem. As exceções envolvem avaliações que levam em conta fatores outros que os meramente científicos. Não há como evitar esse problema mas uma busca de periódicos devem direcionar nossa escolha para periódicos mais afeitos ao tipo de contribuição que ele traz.

Isso nos leva a uma última recomendação, embora o artigo seja nosso, publica-lo significa literalmente torná-lo público. Às vezes, um pequeno detalhe nos é muito caro (talvez pelas horas consumidas para verificá-lo) para os outros é só isso, um detalhe. Devemos escrever um artigo pensando muito mais em um legado para os outros do que em um desabafo de cunho pessoal. Esse último serve para romances e biografias, não para produções científicas. Assim, o trabalho deve ter uma apresentação impessoal, seguindo uma cronologia logicamente (e não pessoalmente) orientada e mostrando todas as suas virtudes e sua contextualização no cenário atual da Ciência, e não no cenário pessoal de seu(s) autor(es). 

Finalmente, não custa dizer que esse texto está muito longe de exaurir todas as informações necessárias. Nem tampouco se propõe a ser a última referência no assunto. Existe uma enormidade de sites na internet que podem complementar as informações aqui contidas. Eu mesmo tenho várias experiências pessoais (tanto agradáveis quanto desagradáveis) que poderiam enriquecer a compreensão. A experiência adquirida só me mostrou que as exigências fazem parte da nossa atividade de investigação. Editor/revisores querem ter o máximo possível de evidências para tomar sua decisão da forma mais correta possível. Claramente, o erro tipo I aqui é aceitar um artigo errado e tem prevalência sobre o erro tipo II de rejeitar um artigo potencialmente promissor. É com esse rigor que a Ciência se desenvolve. Quanto mais cedo nos acostumarmos a isso, mais suave será nossa passagem pela difícil mas prazerosa carreira acadêmica.

terça-feira, 30 de outubro de 2018

Questionamentos de estudantes de Estatística e Atuária

https://www.facebook.com/sestat.ufrj/

A 7a Semana de Estatística e Atuária da UFRJ foi o tema de nossa postagem da semana passada. Ela foi encerrada com um debate com profissionais do mercado e professores dos cursos de graduação em Estatística e Atuária, ilustrado na foto acima. A organização compilou algumas das perguntas que foram formuladas pelos alunos para esse debate. Acho que oferecem um rico panorama das dúvidas e visões que os alunos tem sobre os cursos de Estatística e Atuária no pais. Nas próximas semanas tentarei respondê-las na medida do possível. Abaixo eu as transcrevo, na ordem que eu as recebi, para que todos os leitores possam ter um referencial de reflexão do onde os alunos percebem que a área está, para onde eles entendem que ela pode ir e que caminhos ela deve percorrer até chegar lá. Ei-las:

1. Uma preocupação: terminar o doutorado, sem experiência de mercado e já na casa dos 30. Será que o mercado será um pouco resistente a esse profissional? 

2. Atualmente, tem-se passado a sensação de que estamos vivendo um “boom” de métodos de previsão e modelagem (ou apenas algoritmos). Entretanto, muito se lê sobre técnicas que não passaram por demonstrações matemáticas de sua funcionalidade. Entretanto, elas cumprem seu papel e respondem as perguntas que são feitas. A dúvida é, até onde vai a necessidade do formalismo em relação ao uso dos métodos? 

3. Uma das corridas atuais em relação à computação é para a eficiência computacional do que está sendo feito. Tenta-se fazer as coisas de forma rápida e automática. Na inferência bayesiana, em muitos cenários nos deparamos com modelos que ficam até dias rodando. Devemos começar a pensar em aproximação, para chegarmos em resultados mais rápidos?

4. Vejo diariamente ofertas de emprego para cientista de dados. Em todos os cantos lemos que é uma profissão expoente e que existem muito mais vagas que profissionais. Entretanto, paralelo a isso, vejo muitos profissionais de áreas correlatas, desempregados. Na medida do possível, o que pode ser feito para melhorar essa relação? A sensação que fica é de que as empresas querem um profissional e no mercado existe outro. Claro, uma saída óbvia, é o empenho do profissional para a adequação, mas as empresas também não deveriam estar mais dispostas a acreditar no potencial de evolução do profissional dentro da empresa? 

5. Estatístico pode ser considerado cientista de dados? Por que? 

6. Por que quem não é formado em estatística pode dar aula de estatística em faculdades particulares? 

7. Os professores já estão aptos a ensinar os alunos as disciplinas de "ciências de dados"? 

8. Enquanto o curso de estatística forma 2 alunos, a computação (de forma generalizada) forma 200 a 300. Seremos engolidos? Como evitar isso? 

9. Será que a solução está na reformulação dos cursos de estatística ou na melhora da comunicação entre academia e mercado? 

10. Quando entramos na graduação, fazemos um curso de análise exploratória de dados e já aprendemos, mesmo sem muita base, como manipular um banco de dados. É válido ter uma matéria de último período de análise exploratória de dados, agora com a formação em rumo de ser concluída? 

11. Vejo muitos alunos saírem da graduação com muita insegurança. Quais medidas podem ser tomadas para amenizar esses problemas? 

12. Se as técnicas utilizadas (em aprendizado de máquina) são as que já conhecemos, por que outros profissionais dominaram essa área? É um problema de não sabermos vender nosso trabalho? 

13. O diploma de graduação em estatística e atuária se faz realmente necessário para a prática das profissões? Vocês acreditam que a busca por conhecimento de maneiras alternativas e a vivência prática no ramo de atuação podem substituir o requisito acadêmico? Quão importante é o currículo acadêmico em comparação com o portifólio de projetos já feitos? 

14. O mercado de trabalho para Ciências Atuariais valoriza (leia-se, provê maiores remunerações) a profissionais que tenham Mestrado stricto sensu ou Doutorado em Matemática, Estatística, Finanças ou áreas correlatas -- ou prioriza e reconhece mais profissionais que possuam MBA, encarando o Mestrado e Doutorado como uma formação exclusiva para viés acadêmico? 

15. A disponibilidade de dados, atualmente, é muito maior que há 20 ou 30 anos. Também, a capacidade de processamento dos computadores aumentou significativamente. Ainda, os softwares utilizados para análise de dados estão cada vez mais difundidos, populares e acessíveis, com uma ampla gama de bibliotecas, pacotes, módulos etc prontos e disponíveis em prateleiras. Os Senhores encaram esse cenário como um potencial risco para o Estatístico, o qual poderá ser suplantado por Engenheiros, Físicos, Economistas etc que possuam um pouco de aptidão com tais ferramentas computacionais? 

16. Comparando o currículo de duas graduações em Ciências Atuariais (UFRJ x UFRGS), nota-se uma imensa diferença no enfoque das formações. A UFRJ preza por uma formação essencialmente matemática, havendo uma disciplina isolada para Direito, uma para Economia, outra para Administração e outra para Contabilidade, totalizando 16 créditos obrigatórios. Já a UFRGS possui uma quantidade bastante inferior de disciplinas de Matemática e Estatística, oferecendo, em contrapartida, 64 créditos obrigatórios dentre disciplinas associadas à Economia, Contabilidade e Direito. Gostaria que os presentes discutissem as diferentes oportunidades que se abrem para tais profissionais no mercado de trabalho, considerando a distinta formação acadêmica, bem como os desafios (ou dificuldades) para os egressos dessas faculdades em função das lacunas de um e outro. 

17. Contabilizando os trabalhos apresentados na SIAC da UFRJ, em 2017 e 2018, não houve nenhum trabalho apresentado na área de Atuária; para Estatística, foram 2 e 5 trabalhos em 2017 e 2018, respectivamente, na Sessão de Estatística. Em contrapartida, nota-se que a palavra-chave "Estatística", ao navegar no caderno de resumos da SIAC, permeia dezenas de trabalhos nas Engenharias, cursos da Saúde, Física, Química, Geotecnologias, Economia etc, dando indícios de um aparente "distanciamento" entre os alunos de Atuária e Estatística contra as demais formações e também de que os profissionais dessas áreas, cada vez mais, utilizam-se de ferramental que seria expertise do Estatístico e Atuário. Como os Senhores avaliam esse cenário? De que forma o IM pode firmar sua posição e aumentar sua integração com os demais institutos da UFRJ? 

18. Nos cursos de Engenharia e Computação, é usual haver incentivo e formação complementar direcionada ao empreendedorismo, incubação de empresas, empresa júnior etc, com uma relação entre academia e mercado de trabalho. Para Ciências Atuariais, aparentemente o aluno encontra-se em uma "ilha de conhecimento acadêmico", sendo que tal inserção dá-se praticamente por iniciativas individuais, quando um aluno busca um estágio. De que forma esse hiato (se é que ele mesmo existe) pode ser superado, no curso de Ciências Atuariais?

19. Na última SESTAT, houve algumas apresentações sobre um novo perfil de profissional: Data Scientist. Esse profissional seria composto pela interseção de 3 "conjuntos" de profissionais: um Matemático/Estatístico, um "Algorítmico-Lógico"/Programador e um profissional que entende de Negócios/Administração. Muito se falou da imensa dificuldade em se encontrar profissionais com tal perfil. Em paralelo, sabe-se que muitos profissionais advindos de outras formações (Engenheiros, Físicos, Economistas, Cientistas da Computação etc) têm ocupado tais posições. Que formação adicional um estudante de Estatística e Atuária precisa buscar para ocupar tais posições? 

20. As empresas do setor elétrico, petroquímico, mineração, papel e celulose e de telecomunicações geralmente possuem convênios e projetos com cursos de Engenharia, possibilitando que alunos de graduação e pós-graduação dessas áreas desenvolvam-se e atuem em estudos fortemente aplicados ao mercado enquanto ainda estão na universidade. Exemplos notáveis são: Petrobras, Vale, Braskem, Votorantim, Odebrecht, Klabin etc. Tal fato também funciona como um excelente "cartão de visitas" para o estudante. No entanto, esse fenômeno aparentemente não é observado entre as Seguradoras, Resseguradoras, Fundos de Pensão, Bancos, Corretoras de Valores etc com as graduações em Ciências Atuariais e em Estatística. Que iniciativas poderiam ser realizadas nesse sentido para criação (ou fortalecimento) dessa relação?