terça-feira, 3 de junho de 2014

Como estatísticos encontraram o voo 447 da Air France dois anos depois que ele caiu no Atlântico


A revista eletrônica MIT Technology Review publicou na semana passada (em 27/05/2014) o texto abaixo com o título acima (traduzidos com a ajuda do Google Translate) repercutindo o interessante trabalho de estatísticos em um importante trabalho, associado a um acidente que anteontem completou 5 anos de ocorrência. Nada mais justo que receba espaço aqui nesse blog. Vamos a ele...

===================================================================
"Nas primeiras horas da manhã de 1 de Junho de 2009, o voo AF447 da Air France, com 228 passageiros e tripulantes a bordo, desapareceu durante uma tempestade sobre o Atlântico durante um voo de Rio de Janeiro para Paris."  Assim começaram Lawrence Stone e seus colegas de Metron Soluções Científicas em Reston, Virginia, a descrever o seu papel na descoberta dos destroços quase dois anos após a perda da aeronave.

Stone e cia são os estatísticos que foram trazidos para reexaminar a evidência depois de quatro buscas intensivas não terem conseguido encontrar a aeronave. O que é interessante sobre esta história é que a análise deles apontou para um local não muito longe da última posição conhecida, em uma área que tinha sido quase certamente procurada logo após o desastre. Os destroços foram encontrados em quase exatamente onde eles previram a uma profundidade de 14.000 pés depois de apenas uma semana de pesquisa adicional.

Hoje, Stone e cia explicam como eles fizeram isso. Sua abordagem era usar uma técnica conhecida como inferência Bayesiana, que leva em conta todas as informações antes conhecido sobre o local do acidente, bem como a evidência dos esforços de busca sem sucesso. O resultado é uma distribuição de probabilidade para a localização dos destroços .

Inferência Bayesiana é uma técnica estatística que os matemáticos usam para determinar alguma distribuição de probabilidade subjacente baseado em uma distribuição observada . Em particular, os estatísticos usam esta técnica para atualizar a probabilidade de uma hipótese particular à medida que eles se reúnem evidências adicionais.

No caso da voo AF447, a distribuição subjacente era a probabilidade de encontrar os destroços em um determinado local. Isso depende de uma série de fatores, como a última localização GPS transmitida pelo avião, até onde a aeronave pode ter viajado depois disso e também a localização de corpos encontrados na superfície uma vez que a sua taxa de deriva na água tinham sido tomados em conta.

Tudo isso é o que os estatísticos chamam de "priori". Dá uma certa distribuição de probabilidade para a localização dos destroços.

No entanto, uma série de pesquisas que contou com esta informação não tinha conseguido encontrar os destroços. Portanto, a questão que Stone e cia tinham que responder era como essa evidência deve ser usado para modificar a distribuição de probabilidade.

Isto é o que os estatísticos chamam a distribuição a posteriori. Para calculá-la, Stone e cia tiveram que levar em conta o fracasso de quatro pesquisas diferentes depois que o avião caiu. A primeira foi a incapacidade de encontrar os restos ou corpos durante seis dias depois que o avião desapareceu em junho de 2009; em seguida, houve o fracasso de pesquisas acústicas em julho de 2009 para detectar os pings de balizas de localização subaquática no gravador de dados de vôo e gravador de voz do cockpit; a seguir, outra pesquisa em agosto de 2009 não conseguiu encontrar qualquer coisa usando sonar side-scanner; e, finalmente, havia uma outra busca sem sucesso usando sonar side-scanner em abril e maio de 2010.

As buscas tiveram lugar em áreas diferentes, às vezes sobrepostas, distando até 40 milhas náuticas da última posição conhecida do avião. Estas áreas foram calculadas com base em quão longe detritos e corpos se afastaram devido a vento e correntes. E a busca que ouviu os pings acústicos de gravadores de dados da aeronave quase certamente cobriu o local onde os destroços foram finalmente encontrados.

Isso é um ponto importante. Uma análise diferente poderia ter excluído este local com base no que já tinha sido coberto. Mas Stone e cia. optaram por incluir a possibilidade de que as balizas acústicas podem ter falhado, uma decisão crucial que levou diretamente à descoberta dos destroços. Na verdade, parece provável que as balizas falharam e que esta foi a principal razão pela qual a busca demorou tanto.

O ponto chave, é claro, é que a inferência Bayesiana, por si só não pode resolver estes problemas. Em vez disso, os estatísticos mesmos desempenharam um papel crucial na avaliação da evidência, decidindo o que ela significava e como incorporá-lo de forma adequada para o modelo Bayesiano.

O resultado final, neste caso, pelo menos, foi a descoberta dos destroços junto com o gravador de dados de voo e gravador de voz do cockpit, que forneceram evidências vitais sobre os momentos finais da aeronave (embora ainda há alguma controvérsia sobre o que exatamente causou o desastre). Isso também levou à descoberta de muitos mais corpos que foram, então, reunidos com as famílias enlutadas.

Esta história da pesquisa estatística para a aeronave desaparecida é extremamente relevante agora devido à busca permanente do vôo MH370 da e Malaysia Airlines, que desapareceu a caminho de Kuala Lumpur para Pequim em 8 de março. Nada foi visto ou ouvido falar dele novamente.

A lição da busca pelo vôo AF447 é que inferência bayesiana é uma ferramenta poderosa em pesquisas deste tipo, mas que a forma como é aplicada é fundamental também. Em outras palavras, os estatísticos vão ter de desempenhar um papel importante nessa busca também. 

Vamos torcer para que as premissas utilizadas para atualizar pesquisas futuras para o vôo MH 370 sejam em última análise tão bem sucedidos quanto aquelas que Stone e cia empregaram em 2011. 
===================================================================

O artigo contendo os achados de Stone e cia é Search for the Wreckage of Air France Flight AF 447, escrito por Lawrence D. Stone, Colleen M. Keller, Thomas M. Kratzke e Johan P. Strumpfer, e foi publicado no importante periódico Statistical Science em 2014, vol. 29, pag 69–80. A figura acima foi reproduzida desse artigo.

Nenhum comentário:

Postar um comentário