USO DAS DISTRIBUIÇÕES POISSON, BINOMIAL NEGATIVA, POISSON-LINDLEY E POISSON-LINDLEY-GENERALIZADA PARA DADOS DE CONTAGEM

Autores

  • Caroline Gomes Duarte
  • Silvia Maria de Freitas

Resumo

Uma distribuição de probabilidade é um modelo matemático que fornece as probabilidades de ocorrência de diferentes resultados possíveis em um experimento, ou seja, descreve o comportamento de uma variável aleatória em termos de probabilidades de eventos. Consequentemente, pode modelar incertezas e relatar fenômenos em diversas áreas. Existem três tipos de distribuições de probabilidade associadas às variáveis aleatórias: para variáveis discretas, contínuas e mistas. As variáveis discretas são utilizadas quando o conjunto de resultados é finito ou enumerável, o que ocorre quando os dados assumem valores inteiros. Geralmente, são dados provenientes de processos de contagens, sendo usual utilizar, uma abordagem inicial usando um modelo com distribuição Poisson. Em tais modelos, a característica de superdispersão tende a surgir, fazendo com que a variabilidade nominal dos dados seja superior à estipulada pelo modelo. Um dos motivos que pode causar a presença de superdispersão é o excesso de zeros no conjunto. Dessa forma, a busca por distribuições, alternativas à de Poisson, é preponderante para uma melhoria do ajuste de um modelo mais adequado ao fenômeno de contagem com tais características. Portanto, o objetivo principal deste trabalho é apresentar algumas distribuições discretas que acomodem melhor dados de contagem inflacionados de zeros. No trabalho são apresentados os modelos para variáveis discretas: Poisson e Binomial Negativa; e para as distribuições compostas: Poisson-Lindley e Poisson-Lindley-Generalizada. O trabalho tem como alvo descrever o modelo probabilístico das distribuições, com as respectivas características e propriedades, apresentando casos particulares associados à distribuição Poisson-Lindley-Generalizada, exemplificando, através de conjuntos de dados descritos na literatura e de dados reais, como cada distribuição se comporta na qualidade do ajuste de cada modelo. O trabalho foi desenvolvido com o apoio computacional do software R.

Downloads

Não há dados estatísticos.

Publicado

2019-01-01

Edição

Seção

XXXVIII Encontro de Iniciação Científica