Fechar X

Notas

Aula 04


Selecione a seta para iniciar o conteúdo

Introdução

O termo “média” é um dos mais utilizados no dia a dia pelas pessoas. Todos os dias  utilizamos este termo em frases, como: “eu durmo em média 8 horas por noite” ou “eu pratico, em média, 30 minutos de atividade física por dia”. Em todas essas situações utilizamos a média aritmética, entretanto, veremos nessa aula que também existem a média ponderada, a média harmônica, a média geométrica, além da mediana e da moda.

Sempre que quisermos representar e caracterizar um determinado conjunto de dados que seja constituído de variáveis quantitativas, nós utilizaremos uma dessas medidas, as quais são chamadas de “Medidas de Tendência Central”. Além disso, é possível verificar as diferenças e a homogeneidade entre os valores de variáveis quantitativas por meio da utilização das “Medidas de Dispersão”, que são medidas complementares às medidas de tendência central.

Ao final desta aula, você será capaz de:

  • reconhecer as principais medidas de tendência central e dispersão;
  • compreender a utilização de cada medida de tendência central e dispersão;
  • aplicar as principais medidas de tendência central e dispersão.

Medidas de Tendência Central

Após abordar a sintetização dos dados sob a forma de tabelas, gráficos e distribuições de frequências, vamos aprender a calcular as medidas que possibilitam representar um conjunto de dados de uma variável quantitativa. As principais medidas de tendência central são as Médias, a Moda e a Mediana.

Médias

As médias são as medidas de tendência central mais utilizadas para representar dados quantitativos. No entanto, é importante saber que existem diferentes tipos de média, como a média aritmética simples, a média aritmética ponderada, a média harmônica e a média geométrica (DANCEY; REIDY; ROWE, 2017). Embora seja amplamente utilizada, a média é uma medida de tendência central que, por uniformizar os valores de um conjunto de observações, não representa bem os conjuntos de valores extremos, ou seja, com valores muito altos ou muito baixos.

Atenção

Quando valores extremos e discrepantes influenciarem o valor da média, é possível utilizar outras medidas de tendência central, como a mediana. Mais a frente, nesta aula, você verá de forma detalhada estes conceitos.

Média Aritmética Simples

A média aritmética é a medida de tendência central mais frequente nas representações de um conjunto de observações. A média simples de um conjunto de observações corresponde à soma de todos os dados da amostra dividida pelo número de elementos da amostra, conforme demonstra a fórmula a seguir:

\[Media=\frac{soma~dos~dados~(valores~observados)}{n\acute{u}mero~total~de~observações}\]

Exemplo prático: a partir da Tabela 1, calcule a média aritmética da massa corporal dos estudantes de enfermagem de uma faculdade.

Alunos (massa corporal) Frequência
55 2
60 2
65 2
70 1
75 1
Total 8

Tabela 1 - Massa corporal dos estudantes de enfermagem de uma faculdade
Fonte: Elaborado pelo autor.

Resolução:

\[m\acute{e}dia=\frac{55+55+60+60+65+65+70+75}{8}\]

\[m\acute{e}dia=\frac{505}{8}\]

\[média=63,125\]

Média Aritmética Ponderada

A média ponderada é utilizada quando se pretende sintetizar valores que têm diferentes graus de importância. Este tipo de média é obtido pela soma de todos os valores do conjunto de observações multiplicado pelos seus respectivos pesos ou ponderações (p) dividida pelo somatório dos pesos ou ponderações (p), conforme a fórmula a seguir:

\[Mp=\frac{{{a}_{1}}{{p}_{1}}+{{a}_{2}}{{p}_{2}}+{{a}_{3}}{{p}_{3}}+.......{{a}_{n}}{{p}_{n}}}{{{p}_{1}}+{{p}_{2}}+{{p}_{3}}+.......{{p}_{n}}}\]

Exemplo prático: o professor da disciplina de epidemiologia de uma faculdade aplicou duas avaliações nos alunos, entretanto, a primeira avaliação tinha peso 3 e a segunda avaliação tinha peso 2. A média mínima para ser aprovado é 6,0. Um dos alunos tirou 5,5 na primeira avaliação e 7,0 na segunda avaliação. Sabendo dessas informações, é possível afirmar que o aluno foi aprovado sem a necessidade de exame final?

Resolução:

\[m\acute{e}dia=\frac{5,5.3+7,0.2}{5}\]

\[m\acute{e}dia=\frac{30,5}{5}\]

\[média=6,1\]

A média ponderada do aluno foi 6,1, sendo aprovado na disciplina sem a necessidade de exame final.

Média Harmônica

A média harmônica corresponde ao inverso da média aritmética dos inversos e é calculada a partir da seguinte fórmula:

\[Mh=\frac{n(n\acute{u}merodeelementosdaamostra)}{1/{{a}_{1}}+1/{{a}_{2}}+1/{{a}_{3}}+...1/{{a}_{n}}}\]

Exemplo prático: determine a média harmônica da idade dos estudantes de enfermagem de uma faculdade.

Idade dos alunos Identificação
25 A
22 B
31 C

Tabela 2 - Idade dos estudantes de enfermagem de uma faculdade
Fonte: Elaborada pelo autor.

Resolução:

\[m\acute{e}dia=\frac{3}{1/25+1/22+1/31}\]

\[m\acute{e}dia=\frac{3}{0,04+0,045+0,032}\]

\[média=3/0,117\]

\[média=25,64\]

SAIBA MAIS

Assista ao vídeo do link a seguir para saber mais sobre os diferentes tipos de médias e ver mais exemplos de cálculo de cada uma delas. Disponível em: <https://www.youtube.com/watch?v=7SeCSogbDQc>. Acesso em: 26 abr. 2019.

Mediana

A mediana é uma medida de tendência central que corresponde ao valor localizado no centro de um conjunto de dados organizado de forma crescente ou decrescente. Quando o total de observações é ímpar, a mediana é exatamente o valor único no centro dos conjuntos de dados. Todavia, quando o total de observações é par, a mediana é a média aritmética simples dos dois valores centrais.

Exemplo prático 1: identifique a mediana do conjunto de dados a seguir: 12, 10, 15, 25, 20, 8, 15.

Resolução:

O primeiro passo é ordenar os dados em rol:  8, 10, 12, 15, 15, 20, 25.

O segundo passo é destacar o valor central do conjunto de dados:

8, 10, 12, 15, 15, 20, 25.

Logo, a mediana é 15.

Exemplo prático 2: agora determine a mediana do seguinte conjunto de dados: 20, 12, 12, 18, 16, 13, 13, 15,

Resolução:

O primeiro passo é ordenar os dados em rol: 12, 12, 13, 13, 15, 16, 18, 20.  

O segundo passo é destacar os valores centrais (metade à esquerda, metade à direita): 12, 12, 13, 13, 15, 16, 18, 20.

O terceiro passo é efetuar a média aritmética: 13 + 15 / 2 = 28 / 2 = 14.

Logo, a mediana do conjunto de dados é 14.

SAIBA MAIS

Além da mediana, que é uma medida tanto de tendência quanto de posição, existem outras medidas importantes, como o quartil, o decil e o percentil. Para saber mais sobre estas medidas, leia o livro Estatística Fácil, de Antônio Arnot Crespo.

Moda

A moda se refere ao valor que ocorre com maior frequência em conjunto de dados. Esta medida estatística remete ao conceito de moda representado na Figura 1, já que é algo que mais se repete em um determinado conjunto, entretanto, é uma medida pouco utilizada no cenário científico. A moda pode ser utilizada com dados quantitativos e qualitativos. É importante ressaltar que a moda não existe em conjuntos de dados que nenhum dado se repete.

Figura 1 - Moda
Fonte: Katya Ulitina / 123RF.

Exemplo prático, identifique a moda no conjunto de dados apresentado a seguir: 20, 30, 40, 80, 10, 10, 20, 30, 20.

Resolução:

O primeiro passo é ordenar os dados em rol: 10, 10, 20, 20, 20, 30, 30, 40, 80.

O segundo passo é destacar os valores que mais se repetem: 10, 10, 20, 20, 20, 30, 30, 40, 80.

Logo, a moda do conjunto de dados é 20.

SAIBA MAIS

Alguns conjuntos de dados apresentam mais de uma moda, podendo ser bimodal, quando possui duas modas, e plurimodal, quando possui mais de duas modas. Preste atenção no conjunto de dados a seguir, que possui três modas:

(1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5) → Mo = 3, Mo = 4 e Mo = 5 (valores mais frequentes).

Quando é Melhor utilizar a Média, a Mediana e a Moda?

Nota-se que a média, a mediana e a moda são medidas de tendência central que possuem vantagens e desvantagens, conforme mostra ao quadro a seguir:

Medida Definição Vantagens Desvantagens
Média Soma dos valores dividida pela quantidade de casos. É atraente e reflete cada valor do conjunto de dados. Os valores extremos afetam seu valor.
Mediana Valor localizado no centro do conjunto de dados. Sofre menor influência dos valores extremos. Mais difícil de ser identificada em grandes conjuntos de dados.
Moda Valor que mais se repete no conjunto de dados. Maior frequência de valores concentrados no mesmo ponto. Não tem utilidade na análise estatística.

Quadro 1 - Vantagens e desvantagens da utilização da média, mediana e moda
Fonte: Elaborado pelo autor.

Concluindo, a média deve ser utilizada quando existe uma forte concentração dos dados na região central da série, enquanto a mediana deve ter a preferência do pesquisador quando os dados estão concentrados no início ou no final do conjunto de dados. Já a moda pode ser apenas em conjuntos de dados em que a frequência de um determinado valor é muito superior à frequência dos outros valores.  

Exemplo prático:

Calcule a média aritmética simples, a mediana e a moda do conjunto de dados a seguir: 10, 8, 15, 13, 20, 20, 38, 23, 20, 40.

O primeiro passo é ordenar os dados em rol: 8, 10, 13, 15, 20, 20, 20, 23, 38, 40.

Vamos calcular a média:

Média  = 18 + 10 + 13 + 15 + 20 + 20 + 20 + 23 + 38 + 30 / 10

Média = 20,7

Agora, vamos identificar a mediana: 18, 10, 13, 15, 20, 20, 20, 23, 38, 30

Como ao dividir o conjunto de dados em duas partes iguais, a mediana fica entre os dois valores 20.

Logo, a mediana é 20.

Como a moda é o valor que mais se repete, a moda do conjunto de dados é 20.

(18, 10, 13, 15, 20, 20, 20, 23, 38, 30)

SAIBA MAIS

Vimos que a média, a mediana e a moda são fundamentais para representar os valores de um conjunto de dados, entretanto, cada uma tem vantagens e desvantagens. Considerando o exercício prático anterior, qual medida de tendência central é a mais adequada para representar este conjunto de dados?

Medidas de Dispersão

Embora a média, a mediana e a moda proporcionem informações relevantes a respeito de um conjunto de dados, essas medidas de tendência central não são suficientes para resumir o conjunto de dados de uma forma geral. A partir de agora vamos apresentar as medidas que indicam o quanto os dados estatísticos variam em torno da região central, que são as medidas de dispersão ou variabilidade (DANCEY; REIDY; ROWE, 2017).

Considere a situação abaixo para perceber que uma medida de tendência central, neste caso, a média, não é suficiente para descrever satisfatoriamente o conjunto de dados. Temos a idade de dois grupos de pessoas (A e B):

A = 25 29 31 34 35

B = 15 23 32 36 48  

Ambos os grupos apresentaram a mesma média aritmética: 30,8. No entanto, analisando os dados de cada grupo, percebe-se que a idade das pessoas do grupo A varia apenas de 25 a 35 anos, enquanto a idade do grupo B varia de 15 a 48 anos, revelando que a idade do grupo A é mais homogênea do que a idade do grupo B.

Esta situação evidencia a importância de medidas que indiquem a variabilidade dos dados de uma amostra, uma vez que utilizando apenas a média, os dois grupos apresentaram um perfil de idade semelhante. Diante disso, veremos algumas das principais medidas de dispersão e que permitem identificar as diferenças existentes entre os dois grupos, tais como: a amplitude, o desvio, a variância, o desvio-padrão e o coeficiente de variação.

SAIBA MAIS

Além dessas medidas de dispersão que veremos nesta aula, existem outras medidas que também são importantes, como o desvio-médio, entretanto, não é muito utilizada quanto às medidas estudadas nesta aula. Para saber mais sobre esta medida, assista ao vídeo no link disponível em: <https://www.youtube.com/watch?v=S-NnnCnjeSI>. Acesso em: 26 abr. 2019.

Amplitude Total

Como a próprio nome diz, a amplitude total se refere à diferença entre o maior valor e o menor valor do conjunto de observações. Apesar de ser uma medida simples e fácil de ser calculada, a amplitude total é relativamente imprecisa em relação à variação no interior do conjunto de dados, uma vez que considera apenas os valores extremos (mínimo e máximo).

Exemplo: Calcule a amplitude total do conjunto de dados a seguir: 60, 80, 70, 62, 85, 57.

O primeiro passo é organizar os dados em rol e identificar o valor mínimo e máximo: 57, 60, 62, 70, 80, 85.

Amplitude = 85 - 57

Amplitude = 28.

Desvio

O desvio de um conjunto de dados numéricos é obtido por meio da diferença entre cada um dos valores e a média aritmética da amostra. Considere a tabela a seguir acerca das idades dos estudantes de enfermagem de uma faculdade para calcular o desvio da amostra.

Idade dos alunos Estudante

25

A

22

B

31

C

26

D

20

E

30

F

Tabela 3 - Idade dos estudantes de enfermagem de uma faculdade
Fonte: Elaborada pelo autor.

Média aritmética =  25 + 22 + 31 + 28 + 20 + 30 / 2

Média aritmética = 26

Para encontrar o desvio do conjunto de dados, é preciso fazer o seguinte cálculo:

D1 = 25 - 26 = -1

D2 = 22 - 26 = -4

D3 = 31 - 26 = 5

D4 = 28 - 26 = 2

D5 = 20 - 26 = -6

D6 = 30 - 26 = 4

Soma dos desvios = 0

Note que a soma dos desvios é igual a zero (0) e esta medida é útil para se ter uma orientação a respeito dos valores que estão acima da média (desvios com sinal positivo) e os valores que estão abaixo da média (desvios com sinal negativo)

Variância e Desvio-padrão

As medidas de dispersão mais utilizadas nos procedimentos estatísticos e com maior grau de confiabilidade são a variância \((s^{2})\) e o desvio-padrão (s), uma vez que ambas analisam a variabilidade dos dados de uma amostra levando em consideração todos os valores do conjunto de dados.

A variância de uma amostra é obtida pela soma dos quadrados dos desvios da amostra em relação à média dos desvios, com posterior divisão pelo número de elementos da amostra (n) subtraído da unidade, conforme a fórmula abaixo:

\[s=\sqrt{{{s}^{2}}}\]

Portanto, o desvio-padrão do exemplo anterior éobtido a partir da seguinte fórmula:

\[s=\sqrt{19,6}\]

\[s=\sqrt{4,43}\]

Segue abaixo algumas observações importantes a respeito da variância e do desvio-padrão:

  • Quando os valores da amostra são repetidos, a variância será zero;
  • A variância é fundamental na estatística inferencial, entretanto, não tem muita utilidade na estatística descritiva;
  • Quando os valores da amostra estão espalhados, a variância será um valor elevado e que indica uma grande dispersão dos dados em relação à média;
  • Quanto menor o desvio-padrão, mais próximos estão os valores da média;
  • Quanto maior o desvio-padrão, mais distantes estão os valores da média.

Coeficiente de Variação

O coeficiente de variação (CV) é uma medida relativa de variabilidade que permite identificar a dispersão dos valores do conjunto de dados em relação à média aritmética. Este coeficiente é obtido pela divisão do desvio-padrão pela média multiplicado por 100, conforme mostra a fórmula a seguir:

\(CV=\frac{Desvio~Padrão~Amostral}{Média~Amostral}\times 100%\) \(\to CV=\frac{S}{\underline{x}} \times100%\)

Considerando o exemplo anterior, o coeficiente de variação é obtido da seguinte forma:

\[CV = 4,43 / 26 x 100 =\]

\[CV = 0,17 x 100 = 17%\]

A principal utilid.ade do coeficiente de variação é permitir a comparação da dispersão de diferentes conjuntos de dados, sendo que quanto menor for o coeficiente de variação, mais homogêneos são os valores da amostra.

SAIBA MAIS

Para saber mais sobre as medidas de dispersão estudadas nesta aula, leia o artigo científico abaixo:

Fonte: BASTOS, J. L. D.; DUQUIA, R. P. Medidas de dispersão: os valores estão próximos entre si ou variam muito. Scientia Medica, v. 17, n. 1, p. 40-44, 2007. Acesso em: 26 abr. 2019.

QUESTÃO OBJETIVA

Um indivíduo realizou diversas provas até ser aprovado em um concurso público. As notas do indivíduo em suas provas de concurso foram as seguintes: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Sabendo de tais informações, a nota média, a nota mediana e a nota modal desse indivíduo, são respectivamente:

a) 7,9; 7,8; 7,2.

A média é 7,9 (8,4 + 9,1 + 7,2 + 6,8 + 8,7 + 7,2 = 47,4 / 6 = 7,9). Para calcular a mediana é necessário ordenar os dados de forma crescente: 6,8; 7,2; 7,2; 8,4; 8,7; 9,1. O valor do meio da série está entre 7,2 e 8,4, que é 7,8. A moda é o valor que mais se repete, que é 7,2.

b) 7,2; 7,8; 7,9.

7,2; 7,8; 7,9: a média é 7,9 e não 7,2. A moda é 7,2 e não 7,9.

c) 7,8; 7,8; 7,9.

7,8; 7,8; 7,9: a média é 7,9 e não 7,2. A moda é 7,2 e não 7,9.

d) 7,2; 7,8; 7,9.

7,2; 7,8; 7,9: a média é 7,9 e não 7,2 A moda é 7,2 e não 7,9.

e) 7,8; 7,9; 7,2.

- 7,8; 7,9; 7,2: a média é 7,9 e não 7,2. A mediana é 7,8 e não 7,9.

QUESTÃO OBJETIVA

Das diversas medidas de dispersão apresentadas nesta aula, a amplitude e o desvio são medidas muito utilizadas nas mais diversas pesquisas. A respeito destas medidas, assinale a alternativa correta:

a) O desvio é uma medida de dispersão calculada sobre cada um dos valores de um conjunto de informações.

O desvio-padrão é calculado a partir de cada valor do conjunto de dados para se obter a medida de variabilidade da amostra.

b) A amplitude é uma medida de tendência central obtida a partir dos valores do conjunto de observações.

A amplitude é uma medida de tendência central obtida a partir dos valores do conjunto de observações: a amplitude não é uma medida de tendência central.

c) O desvio se refere a uma medida de dispersão utilizada para identificar a dispersão total de conjunto de dados.

O desvio se refere a uma medida de dispersão utilizada para identificar a dispersão total de conjunto de dados: o desvio é uma medida de dispersão para cada elemento do conjunto de dados.

d) A amplitude é uma medida de dispersão que corresponde ao valor localizado no centro do conjunto de dados.

A amplitude é uma medida de dispersão que corresponde ao valor localizado no centro do conjunto de dados: a amplitude se refere à diferença entre o maior valor e o menor valor do conjunto de observações.

e) Pode-se dizer que o desvio e a amplitude são medidas de dispersão utilizadas para identificar a mesma variabilidade de um conjunto de dados.

Pode-se dizer que o desvio e a amplitude são medidas de dispersão utilizadas para identificar a mesma variabilidade de um conjunto de dados: embora ambas sejam medidas de variabilidade, cada medida identifica a dispersão dos dados de forma diferente.

Fechamento

Nesta aula vimos que existem medidas adequadas para representar os valores de um conjunto de dados, que são as medidas de tendência central e as medidas de dispersão. A medida de tendência central mais utilizada pelos estatísticos é a média aritmética, entretanto, as outras medidas também são úteis em alguns casos. Além disso, percebemos que as medidas de tendência central não são capazes de revelar a totalidade das informações a respeito de um conjunto de dados, e que medidas de dispersão, como a variância, o desvio-padrão e o coeficiente de variação são úteis para apontar o grau de variabilidade dos valores de um conjunto de dados. Tanto as medidas de tendência central quanto as medidas de dispersão são amplamente utilizadas durante o processo de análise de dados estatísticos.

Nesta aula, você teve a oportunidade de:

  • reconhecer as principais medidas de tendência central e dispersão;
  • compreender a utilização de cada medida de tendência central e dispersão;
  • aplicar as principais medidas de tendência central e dispersão em diferentes situações.

Vídeo

Para complementar o seu aprendizado, assista o vídeo a seguir:

Aula Concluída!

Avançar