EXPLORANDO A CONSTRUÇÃO DA DISTRIBUIÇÃO DE FREQUÊNCIA DE DADOS ATRAVÉS DA BIBLIOTECA “FDTH” DO SOFTWARE R
Resumo
Na exposição de dados quantitativos contínuos, é comum se ter como principais ferramentas a distribuição de frequências dos dados em intervalos de classe e sua representação gráfica através do histograma – cuja noção foi introduzida por Karl Pearson em 1895. Uma informação imprescindível que deve ser especificada na construção de ambas ferramentas é a quantidade de classes. Esta pode ser determinada, de forma mais simples, por regras matemáticas práticas, baseadas apenas na quantidade de observações do conjunto de dados. Regras desta natureza, que são amplamente utilizadas em livros-texto de estatística e softwares em geral, são a regra de Sturges, de 1926, e a regra da raiz quadrada. Porém, a literatura Estatística apresenta outras regras que consideram não apenas a quantidade de observações, mas também a variabilidade existente nos dados. Uma proposta por Scott (1979) utiliza, como medida de variabilidade, o desvio-padrão e a amplitude dos dados. Outra, proposta por Freedman e Diaconis (1981) utiliza, além da amplitude, a distância interquartílica. Assim, este trabalho objetiva verificar como se dá a escolha da quantidade de classes para diferentes quantidades de observações e variabilidades diversas, utilizando as regras de Scott e a de Freedman-Diaconis, em diferentes cenários de dados com distribuição simétrica e assimétrica. A exploração é feita utilizando-se o software R, através da função fdt, para a escolha dos métodos, com conjuntos de dados reais, descritos na literatura, e de dados simulados. Os resultados indicam que a quantidade de classes aumenta rapidamente quando são aumentadas a quantidade e a variabilidade dos dados. Porém, ao aumentar a quantidade de classes demasiadamente, se perde o principal objetivo da análise, que é resumir a informação existente no conjunto de dados. Conclui-se que as regras de escolha são de natureza apenas auxiliar e que regras mais simples como a da raiz quadrada podem ser utilizadas sem prejuízos.Publicado
2021-01-01
Edição
Seção
XXIX Encontro de Iniciação à Docência
Licença
Autores que publicam nesta revista concordam com os seguintes termos:
a. Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License que permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial nesta revista.
b. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.