terça-feira, 1 de dezembro de 2015

Análise de sobrevivência - parte I

Bastos e Gamerman (2005)

O título se refere a uma área bastante ativa da Estatística. Essa área cuida do tratamento de dados até a ocorrência de um dado desfecho. Esse desfecho pode ser basicamente qualquer evento bem definido mas é comumente tomado como a morte ou retorno da doença de um paciente. Embora não seja uma área prazeirosa de atuação pelo tipo de dado que utiliza, é uma área extremamente importante exatamente pelo mesmo motivo. É em análise de sobrevivência que se procura determinar o padrão de ocorrência de doenças para poder melhor caracterizá-la e quem sabe identificar padrões que permitam aumentar o tempo até a ocorrência de eventos negativos.

O nível de generalidade em que a área foi caracterizada acima não dá a ela nenhuma especificidade com fenômenos ligados à saúde. Existem outros campos onde tempos até a ocorrência de desfechos são observados. Os mais comuns são a área industrial, onde se procura estudar o tempo que um determinado equipamento permanece em funcionamento (nesse caso, o desfecho é a falha do equipamento) e a área econômica (onde o desfecho pode ser o momento da demissão de um empregado ou o momento que um empréstimo deixa de ser pago pelo cliente do banco).

Existem muitas similaridades nesse tipo de dado de diferentes campos do saber mas também algumas diferenças. Por exemplo, no estudo da confiabilidade de equipamentos e da duração do emprego, a ocorrência do desfecho não implica na extinção do objeto de observação, como a morte do paciente. Além disso, uma prática comum em equipamentos inanimados é submetê-los a condições mais adversas para acelerar a observação de uma falha. Ensaios acelerados são realizados com o objetivo de otimizar o tempo necessário para a realização do estudo. Em estudos de sobrevivência, o objetivo é o oposto: deseja-se prolongar ao máximo a sobrevida de um paciente em tratamento.

Uma especificidade da área de sobrevivência é a presença de dados observados de forma incompleta. Usualmente chamada de censura, essa característica está associada a pacientes que se desligam de forma autônoma do processo de observação durante o tratamento antes que o desfecho possa ser observado (censura à direita), pacientes que entram no estudo depois de inciada a contagem do tempo (censura à esquerda) ou ambos os casos.

A área recebeu um grande impulso teórico com a publicação do artigo de E. L. Kaplan e Paul Meier nos anos 1950. Nesse artigo, eles mostraram como obter o estimador de máxima verossimilhança da distribuição dos dados, mesmo na presença de censura, e sem impor nenhuma restrição à essa distribuição, isto é, uma abordagem não-paramétrica. Esse trabalho é um dos artigos mais citados da área de Estatística, o que releva um pouco da sua importância. É raro encontrar um trabalho de sobrevivência que não faça uso do estimador de Kaplan-Meier, mesmo que como análise exploratória preliminar. A figura acima mostra esses estimadores para 2 situações diferentes de salário em uma análise do tempo de duração do desemprego.

O artigo de Kaplan-Meier foi estendido no anos 1970 em um trabalho de David Cox para incluir a influência de variáveis explicativas no tempo de sobrevida. Esse trabalho foi um grande avanço pois permitiu que formas de controle e quantificação das análises de sobrevida fossem estabelecidas. Agora se podia medir quanto que o acréscimo de anos de vida ou a mudança de tratamento impactava na sobrevida dos pacientes. O trabalho de Cox permanece muito utilizado e até hoje é o ponto de partida para estudos de sobrevida de pacientes levando em conta as suas características individuais. 

Essa postagem é motivada pela realização da 4a edição do Workshop em Análise de Sobrevivência e Aplicações durante esta semana. Tive o prazer de ser convidado para participar desta edição e apresentar meu trabalho de pesquisa recente nessa área. Além disso, trata-se de uma área muito querida para mim pois meu trabalho de doutoramento foi nessa área, baseado no trabalho de Cox. Assim, convido a todos para participar desse evento, bem como se informar mais sobre essa interessante área de trabalho. Na próxima postagem sobre esse tema, detalharei um pouco mais o que Cox propôs, o que funciona nele e o que se pode fazer nos casos em que não funciona.


3 comentários:

  1. Perigo será se, algum politico da área da saúde resolve usar esse estudo pra determinar qual paciente deverá receber o medicamento mais caro, o equipamento mais sofisticado....Dai, moiô!!!!

    ResponderExcluir
  2. Ola Professor,

    Muito boa postagem, otima escolha de tema!

    Notei alguns "typos" no post:

    > primeiro paragrafo: "..até a ocorrência *de* um dado desfecho."
    > quinto paragrafo: "...para 2 situações diferentes de saláriO em uma análise..."

    Cordialmente,

    Luiz

    ResponderExcluir