Você sabia que os dados obtidos em uma pesquisa precisam ser devidamente organizados para que os resultados sejam claros e precisos? Muitos pesquisadores e estudantes não prestam atenção nesse importante detalhe que interfere diretamente nos resultados de uma pesquisa. Nesta aula veremos como um conjunto de dados de uma determinada amostra pode ser organizado de forma adequada com o intuito de proporcionar informações relevantes e claras para o pesquisador. Uma das técnicas mais eficientes na estatística descritiva, para organizar os dados e apresentar resultados claros, é a distribuição de frequência.
Ao final desta aula, você será capaz de:
Quando se investiga uma variável (qualitativa ou quantitativa), o principal objetivo do pesquisador é conhecer a distribuição dessa variável por meio dos possíveis valores dela. Nessa perspectiva, a distribuição de frequências se apresenta como uma das principais maneiras de se representar um conjunto de valores. Trata-se de uma série estatística específica em que os dados se encontram dispostos em classes ou categorias juntamente com suas respectivas frequências. Neste caso, todos os elementos da tabela (tempo, local e fenômeno) são fixos, entretanto, os dados relacionados aos fenômenos são apresentados de acordo com sua magnitude.
Dois conceitos são importantes quando se estuda as distribuições de frequência, os dados brutos e o rol. Os dados brutos se referem ao conjunto dos dados numéricos obtidos após a crítica dos valores coletados e que não foram numericamente organizados. Os valores a seguir poderiam ser os dados brutos de um conjunto de dados: 25, 23, 28, 30, 24, 20, 35.
Já o rol é o arranjo dos dados brutos em ordem de frequência crescente ou decrescente, ou seja, é a tabela obtida após a ordenação dos dados. Os dados brutos citados anteriormente ficariam assim em forma de rol: 20, 23, 24, 25, 28, 30, 35. A contagem dos valores do rol para a tabela de frequências deve ser feita cuidadosamente, visto que um erro na contagem pode gerar análises equivocadas e valores errados de todas os resultados da tabela.
Assista o vídeo do link a seguir para saber mais sobre os conceitos de dados brutos e a importância do rol para os diferentes tipos de distribuição de frequência. Disponível em: <https://www.youtube.com/watch?v=QZGQk56aHOw>. Acesso em: 26 abr. 2019.

As distribuições de frequência podem ser divididas em dois tipos: sem intervalos de classe e com intervalos de classe.
Esta distribuição de frequência engloba a simples condensação dos dados de acordo com as repetições de seus valores. Geralmente é utilizada para variáveis qualitativas ou quantitativas discretas com poucos valores diferentes. Um exemplo pode ser a quantidade de demissões em pequenas empresas em uma cidade no ano de 2018.
Tabela 1 -Número de demissões em pequenas empresas da cidade “X” em 2018
Fonte:Elaborado pelo autor.
Nota:
Xi = são as categorias em que o fato se subdivide.
fi = é a frequência absoluta, isto é, o número de vezes que cada uma das categorias ocorre.
N = soma dos fi = total de elementos observados na população.
n = soma dos fi = total de elementos observados na amostra.
Quando o tamanho da amostra é elevado, é mais viável efetuar o agrupamento dos valores em vários intervalos de classe. É muito utilizada para variáveis quantitativas contínuas ou discretas com muitos valores diferentes. Um exemplo pode ser a nota da disciplina de Estatística de 50 estudantes de uma faculdade.
X = rol de notas dos 50 estudantes da faculdade.
A partir destes dados, o pesquisador deve organizar os dados em um rol para facilitar a contagem dos valores e a posterior distribuição de frequência. Assim, os dados brutos apresentados ficariam da seguinte forma quando organizados em rol:
X = rol de notas dos 50 estudantes da faculdade.
Com os dados organizados em rol, faz-se a contagem dos valores e os dados são expressos pela seguinte tabela:
Tabela 2 - Notas finais dos estudantes da disciplina de Estatística –2009
Fonte: Elaborada pelo autor.
Nota: fi = frequência absoluta das classes.
O símbolo que representa o intervalo de classes possui informações importantes a respeito do intervalo, conforme mostra a figura abaixo:

Assista ao vídeo do link a seguir para saber mais sobre os intervalos de classes e adiantar o estudo a respeito dos elementos de uma distribuição de frequência com classes. Disponível em: <https://www.youtube.com/watch?v=SFWw6PiMxRw>. Acesso em: 26 abr. 2016.

As classes correspondem aos grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da variável. Uma classe é representada pelo símbolo “i” (i = 1, 2, 3, 4, 5...) e o total de classes da distribuição de frequências é representado pelo símbolo “k”. Se levarmos em consideração o exemplo apontado na Tabela 2, podemos dizer que a distribuição é formada por oito classes (k = 8) e o intervalo 4,0 ⊢ 5,0 representa a quinta classe (i = 5).
Conforme ilustrado na Figura 1, quando o símbolo do intervalo de classes está fechado à esquerda e aberto à direita, significa que o número à esquerda pertence à classe e o número à direita não pertence. Quando o símbolo está fechado à direita e à esquerda, significa que tanto o número à esquerda quanto o número à direita fazem parte da classe.
O limite de classes representa os extremos de cada classe de uma distribuição de frequência, sendo que o menor valor é o limite inferior (li) e o maior valor é o limite superior da classe (ls). A partir do exemplo da Tabela 2, destacam-se os seguintes limites da segunda classe \((i = 2): li_{2} =1,0 e ls_{2} = 2,0\).
A amplitude de um intervalo de classe (h) é a diferença entre os limites superior e inferior da classe. O cálculo da amplitude é realizado a partir da seguinte fórmula:
\[h = ls - li\]
A amplitude da classe apresentada acima (i = 2) é 1,0, pois é calculado a diferença entre o limite superior (ls = 2,0) e o limite inferior (li = 1,0).
Uma distribuição de frequência com intervalos de classe sempre terá a mesma amplitude para todas as classes. Note que para todos os intervalos do exemplo da Tabela 2 a amplitude é 1,0.

Já a amplitude total da distribuição de frequência é a diferença entre o valor máximo e o valor mínimo da amostra. Para isso, é só identificar o menor e o maior valor do rol. Note que o menor valor da amostra do exemplo da Tabela 2 é 0,5 e o maior valor é 7,9. Logo, a amplitude total é 7,4.
O ponto médio de uma classe é o ponto que divide o intervalo de classe em duas partes iguais, e que pode ser calculado a partir da fórmula abaixo:
\[xi=\frac{li=ls}{2}\]
Vamos calcular o ponto médio da sétima classe (i = 7) do exemplo apresentado na Tabela 2. Assim, temos: li = 6,0 e ls = 7,0 e o cálculo do ponto médio fica da seguinte forma:
\[xi = 6,0 + 7,0 / 2\]
\[xi = 13,0 / 2\]
\[xi = 6,5\]
Definir o número de classe em uma distribuição de frequências é uma etapa importante, visto que ao adotar poucas classes, você perderá detalhe de informação, enquanto que se você utilizar um número muito grande de classes, pode ser que alguma das classes apresente frequência nula ou muito baixa.
Existem vários critérios e fórmulas que podem ser utilizados para determinar o número de classes em uma distribuição de frequências, porém todos eles servem apenas como uma indicação, uma vez que o pesquisador é o responsável por tal definição.
Uma solução é a definição a partir do tamanho da amostra, adotando o seguinte critério:
\[n\le 25\to K=5\]
\[n>25\to K\sqrt{n}\]
Para este critério, se a amostra for de 22 sujeitos, o número de classe é 5. No entanto, se a amostra for de 125 sujeitos, número de classe para a distribuição de frequência é calculado por meio da seguinte fórmula:
\[K\sqrt{125}\]
\[K=11,18, arredondando:\]
\[K=11\]
Outra solução é utilizar a Fórmula de Sturges, que estabelece que o número de classes a partir da seguinte fórmula:
\[K = 1 + 3,3 log~n \]
\[onde n = tamanho da amostra\]
No mesmo exemplo utilizado anteriormente para uma amostra de 125 sujeitos, teríamos o seguinte cálculo:
\[K = 1 + 3,3 log(125)\]
\[K = 1 + 3,3 (2,09)\]
\[K = 1 + 6,90\]
\[K = 7,90, arredondando:\]
\[K = 8 classes\]
Assista ao vídeo do link a seguir para saber mais sobre a aplicação da fórmula de Sturges para determinar o número de de classes em uma distribuição de frequência. Disponível em: <https://www.youtube.com/watch?v=J8W2Kj5xnsU>. Acesso em: 26 abr. 2019.

Apesar de ser um bom parâmetro para o cálculo do número de classes, a fórmula de Sturges propõe um número demasiado de classes para uma amostra pequena e, relativamente, poucas classes quando a amostra é muito grande.

A amplitude do intervalo de classes (Ai) se refere ao comprimento de cada classe. O cálculo da amplitude do intervalo é feito por meio da fórmula abaixo:
\[Ai=\frac{H}{K}\]
Ao considerar novamente o exemplo da Tabela 2 nesta aula, vimos que o menor valor é 0,5 e o maior valor é 7,9 e a amplitude total é 7,4. Utilizando a fórmula de Sturges, teríamos sete classes (k = 7). Assim, a fórmula da amplitude ficaria da seguinte forma:
\[Ai = 7,4 / 7\]
\[Ai = 1,05\]
Logo o intervalo de cada classe seria 1,0.
A frequência absoluta (fi) é o número de ocorrências para cada uma das classes, obtida por meio da contagem no rol. A soma das frequências simples representa o total dos dados da distribuição.
A frequência relativa (fri) é a divisão da frequência simples com a soma das frequências da classe, que fornece o percentual de cada classe em relação ao número total de observações. A soma das frequências relativas varia entre 0,0% e 100%.
A frequência simples acumulada (faci) corresponde à soma das frequências até a classe indicada, enquanto que a frequência relativa acumulada (fraci) se refere à divisão da frequência acumulada da classe pela frequência total da amostra.
Para mais informações sobre distribuição de frequência e a utilização dos diferentes tipos de frequência para a organização e apresentação de dados estatísticos, leia o livro Estatística Fácil, de Antônio Arnot Crespo.

Nesta aula percebemos que a organização dos dados por meio da distribuição de frequências facilita o entendimento dos dados estatísticos de uma pesquisa, evidenciando ser uma ferramenta importante para ser utilizada em trabalhos científicos sempre que o objetivo for organizar e sintetizar dados de uma pesquisa.
Destaca-se que muitos conceitos devem ser levados em consideração para elaborar uma distribuição de frequências de forma correta, como os intervalos, limites e amplitudes de classe, os métodos para determinar o número de classes e os tipos de frequências. Os diferentes tipos de frequências são medidas úteis para a apresentação dos dados de forma objetiva e simples, favorecendo a compreensão dos dados da pesquisa.
Nesta aula, você teve a oportunidade de:
Aula Concluída!
Avançar