EXPLORANDO A CONSTRUÇÃO DA DISTRIBUIÇÃO DE FREQUÊNCIA DE DADOS ATRAVÉS DA BIBLIOTECA “FDTH” DO SOFTWARE R

Autores

  • Emerson Manoel Santos de Aguiar
  • Silvia Maria de Freitas

Resumo

Na exposição de dados quantitativos contínuos, é comum se ter como principais ferramentas a distribuição de frequências dos dados em intervalos de classe e sua representação gráfica através do histograma – cuja noção foi introduzida por Karl Pearson em 1895. Uma informação imprescindível que deve ser especificada na construção de ambas ferramentas é a quantidade de classes. Esta pode ser determinada, de forma mais simples, por regras matemáticas práticas, baseadas apenas na quantidade de observações do conjunto de dados. Regras desta natureza, que são amplamente utilizadas em livros-texto de estatística e softwares em geral, são a regra de Sturges, de 1926, e a regra da raiz quadrada. Porém, a literatura Estatística apresenta outras regras que consideram não apenas a quantidade de observações, mas também a variabilidade existente nos dados. Uma proposta por Scott (1979) utiliza, como medida de variabilidade, o desvio-padrão e a amplitude dos dados. Outra, proposta por Freedman e Diaconis (1981) utiliza, além da amplitude, a distância interquartílica. Assim, este trabalho objetiva verificar como se dá a escolha da quantidade de classes para diferentes quantidades de observações e variabilidades diversas, utilizando as regras de Scott e a de Freedman-Diaconis, em diferentes cenários de dados com distribuição simétrica e assimétrica. A exploração é feita utilizando-se o software R, através da função fdt, para a escolha dos métodos, com conjuntos de dados reais, descritos na literatura, e de dados simulados. Os resultados indicam que a quantidade de classes aumenta rapidamente quando são aumentadas a quantidade e a variabilidade dos dados. Porém, ao aumentar a quantidade de classes demasiadamente, se perde o principal objetivo da análise, que é resumir a informação existente no conjunto de dados. Conclui-se que as regras de escolha são de natureza apenas auxiliar e que regras mais simples como a da raiz quadrada podem ser utilizadas sem prejuízos.

Publicado

2021-01-01

Edição

Seção

XXIX Encontro de Iniciação à Docência