terça-feira, 14 de março de 2017

Extremos - parte II

 Fonte: arquivo pessoal

Na postagem inicial sobre o assunto destacamos o resultado provado por J. Pickands. Esse resultado, também atribuido a A. Balkema e L. de Haan, descreveu de forma surpreendentemente precisa o comportamento da cauda da distribuição. Com isso, podemos adquirir precisão sobre os eventos mais extremos (descritos como a cauda da distribuição) sem impor restrições sobre os dados. Assim, não se torna mais necessário assumir hipóteses de difícil verificação, como supor que os dados tem estrutura Gaussiana.

A questão remanescente então é entender quão extremo deve ser o dado para ser considerado extremo. Em linguagem mais técnica, a partir de que ponto pode-se assumir que se entrou no comportamento limite descrito pelo resultado de Pickands. A estratégia utilizada no século passado foi propor argumento heurísticos, alguns baseados em propriedades gráficas, para determinar o ponto de corte, que aqui chamaremos de limiar, a partir do qual está a cauda da distribuição. 

Essa determinação está longe de ser precisa e, mesmo sendo consistente, pode se comportar muito mal para problemas reais onde a quantidades de dados pode não ser tão grande quanto o necessário. Além disso, essa determinação do ponto de corte por métodos gráficos está longe de ser uma tarefa simples, como ilustra a figura acima. Outro ponto relevante é que todas as técnicas usam apenas os dados tomados a partir desse limiar e esse valor precisa ser conhecido sem sê-lo. Ou seja, parece haver um grau desnecessário de arbitrariedade.

Assim, desde o início deste século, técnicas mais robustas tem sido propostas, boa parte delas baseadas em uma especificação de modelos. Com isso, diferentes técnicas de determinação da cauda podem ser testadas e comparadas. Entretanto, a dificuldade aqui é que, se por um lado tem-se uma determinação precisa do comportamento da cauda, por outro lado não existe nenhum resultado geral sobre como se comporta a parte central dos dados, ou a não-cauda.

A proposta que fizemos a partir de uma tese de doutorado foi deixar a estrutura mais flexível possível para a não-cauda. Isso foi possibilitado pelo uso de uma mistura de distribuições Gama, que possui boas propriedades teóricas. Com isso, a determinação do limiar pode ser feita de forma precisa e a incerteza inerente a esse processo de escolha é incorporada ao processo de estimação.

Estimação de quantis elevados ou níveis de retorno (além do máximo dos dados observados) pode ser facilmente realizada e as incertezas associadas a essas estimações são facilmente reportadas. Embora mais trabalhoso computacionalmente, esse procedimento apresenta bons resultados com superioridade em relação aos procedimentos gráficos.

Além disso, ele se presta de forma relativamente natural a várias extensões. Exemplos incluem modelos para extremos com estrutura de regressão (dependência em variáveis explicativas), com estrutura de dependência temporal ou espacial e também extensões para extremos multivariados.


Nenhum comentário:

Postar um comentário