terça-feira, 3 de fevereiro de 2015

Krigagem



O título dessa postagem se refere a uma técnica muito comumente utilizada em Estatística Espacial. Trata-se da técnica que fornece a predição ótima de uma medição de um novo local baseada em medições realizadas em locais conhecidos. A descrição acima é propositalmente vaga porque a técnica pode ser apresentada com esse grau de generalidade. Essa técnica pode ser usada para fazer predições pontuais e obter sua respectiva medição de incerteza como também para obter toda a distribuição preditiva da medição nova (e não apenas sua média e variância). Vale dizer que as duas formas acima coincidem quando a distribuição conjunta dos dados é normal ou Gaussiana.

No caso da primeira opção (predição pontual e sua variância) é muito difícil resolver o problema de predição ótima de uma forma geral. O que se procurou fazer foi obter predições lineares, isto é, que fossem dadas por uma combinação linear das medições já realizadas. Assim, os preditores são chamado de melhores preditores lineares (best linear predictors). Algumas vezes é acrescentada à predição a condição de ausência de vício. Assim, teríamos os melhores preditores lineares não-viciados (best linear unbiased predictors, cuja sigla é BLUP).

Na prática, essa predição é realizada para toda a região de interesse, gerando mapas como a figura acima, extraída de um trabalho que realizei sobre ocorrência de chuva em Minas Gerais. No caso, esse mapa representa um dos 2 fatores espaciais julgados relevantes para caracterizar o padrão de chuva nesse estado. Ele basicamente contrasta a Zona da Mata do estado contra o resto do estado. O 2o fator contrasta a região montanhosa do sudoeste contra o restante do estado.

Aonde essa idéia é importante? Em várias áreas, entre as quais podemos incluir Meteorologia, Agricultura e Mineralogia. E foi justamente nessa última área que essas predições se desenvolveram. O contexto prático foi a exploração de um reservatório de um produto com apelo econômico. Mais especificamente, minas de ouro na África do Sul. O problema prático é onde instalar a próxima mina de ouro em uma região contendo um reservatório de ouro com algumas minas já em produção. O problema é relevante pois instalar uma mina custa caro e não se deseja instalar uma mina em regiões com menor potencial de ouro.

A prática recorrente em meados do século passado era usar alguma métrica simples como a média das minas mais próximas para predizer o potencial de um dado local para a nova mina. Um geólogo chamado Danie Gerhardus Krige percebeu a partir de sua dissertação de mestrado que havia espaço para ganhos substanciais se se pudesse levar em conta a estrutura do problema, isto é, as relações de dependência espacial entre as minas. É razoável esperar que minas próximas tenham comportamento mais similar que minas mais distantes. 

Muito do trabalho de pesquisa que se seguiu ao trabalho de Krige foi devotado a construir formas razoáveis para representação dessa dependência espacial e identificar bem essas formas. Idéias simplistas do tipo "média de todas as minas vizinhas", que eram anteriormente usadas, se mostraram ineficientes e foram rapidamente abandonadas. Uma discussão detalhada dessas formas é mais técnica e foge ao escopo desta postagem, podendo ser deixada para uma postagem seguinte. O fato é que esse trabalho de Krige deu origem a uma linha de trabalho conhecida como Geoestatística, que foi toda desenvolvida pelos geólogos e mineralogistas, com pouca participação de estatísticos. 

Alguns dos exponentes dessa linha ficavam situados na Escola de Minas de Fontainebleau, na França. Um dos nomes mais importantes foi o de George Matheron. Foi ele quem formalizou, deu sustentação teórica e ajudou a divulgar as idéias originadas por Krige. Foi inclusive ele quem criou o termo kriging (em inglês) para se referir à técnica de obtenção do BLUP (ou SLUP, sigla de spatial linear unbiased prediction), baseado no termo krigeage proposto por em francês por Pierre Carlier. No Brasil, é mais utilizada a palavra krigagem, apresentada no título desta postagem. Outra expressão usada indistantamente a krigagem é interpolação espacial (spatial interpolation).

Pode surpreender a muitos que técnicas relativamente simples de Estatística tenham sido propostas e prosperassem em um meio não estatístico. Na realidade, idéias muito similares foram desenvolvidas em Estatística e mesmo em outras áreas. Mas como a maior necessidade veio da Mineralogia, essa área se apropriou naturalmente da Geoestatística e da krigagem. Apenas mais recentemente (a partir da década de 80) é que começou o interesse dos estatísticos nessa área ao perceberem aplicações importantes dessas técnicas em outras áreas da Ciência.

Muito importante para esse avanço foi o lançamento do livro do livro Statistics for Spatial Data, do estatístico australiano Noel Cressie em 1991. Cressie é um dos pesquisadores mais ativos da Estatística com importantes contribuições metodológicas e aplicadas. Além disso, ele acompanhou de perto a genese dessa área, a partir de contatos pessoais e profissionais com Matheron e Krige. Um pouco mais de detalhe da história da krigagem está registrado no artigo escrito por Cressie em 1990 no periódico Mathematical Geology.

2 comentários:

  1. Nos anos 1980/81 fazia consultoria para uma firma de mineração e ficava com inveja dos consultores canadenses desta mesma firma. eles ganhavam por dia
    US$ 500,00 mais despesas para fazer Krigeagem.
    Nada mais era que : predição de mínimos quadrados ponderados com restrição.Na epoca so haviam os livros do Matheron (frances) e Michel David ( canadense francês ) voltados para mineração e difíceis para um estatístico.
    A salvação foi o livro pioneiro para estatísticos do Brian Ripley -1981- Spatial Statistics Wiley (agora em 2a edição 2004)
    Como resultado escrevemos eu e Annibal Parracho Sant Anna - um artigo "Entendendo Kigagem" nas Atas do SINAPE de 1984

    ResponderExcluir
  2. Esqueci de mencionar que na época esta mesma firma trouxe o Dani Krige ao Brasil. Eu não pude levar ele a UFRJ pois a vinda era sigilosa e mostraria que eles estavam procurando ouro. Em 1982 em visita ao Imperial College Brian Ripley comentou comigo que as aplicações em Petróleo também eram sigilosas e ninguém publicava aplicações nestas áreas.
    No Brasil na época havia um português que estudou com Matheron e trabalhava em MG aplicando esta técnica.

    ResponderExcluir