Fechar X

Notas

Aula 03


Selecione a seta para iniciar o conteúdo

Introdução

Nesta aula avançaremos nos testes de hipóteses que permitem comparar grupos independentes e dependentes. Nós já vimos os testes t que podem ser utilizados para a comparação de um grupo único, dois grupos independentes e dois grupos dependentes. Mas, e se o objetivo for comparar a nota de uma prova entre os estudantes solteiros, casados e divorciados (três grupos independentes)? Ou se desejar analisar uma variável quantitativa de uma amostra em três momentos distintos? Quais testes eu posso utilizar? Nesses casos, nós vamos utilizar a Análise de Variância (ANOVA) para 1 Fator ou a ANOVA de Medidas Repetidas, que são testes paramétricos considerados como uma extensão do teste t. As ANOVAs também possuem seus equivalentes não paramétricos, que serão vistos na próxima aula juntamente com os outros testes não paramétricos.

Ao final desta aula, você será capaz de:

  • identificar os testes utilizados para comparar os valores de uma variável quantitativa de mais de dois grupos;
  • identificar os testes utilizados para comparar os valores de uma variável quantitativa de uma amostra em mais de dois momentos distintos;
  • interpretar a lógica dos testes e a forma de interpretação dos resultados.

Considerações Gerais Sobre a ANOVA

Assim como nos testes t, a ANOVA analisa as diferenças entre as médias dos grupos, determinando a média geral e verificando a sua diferença de cada média individual (DANCEY; REIDY; ROWE, 2017). Por esse motivo, a ANOVA é considerada uma extensão do teste t e apresentaria resultados semelhantes ao do teste t em uma comparação com duas condições (grupos ou momentos). A principal diferença da ANOVA para os testes t é que ela verifica as diferenças entre três ou mais grupos (amostras independentes) e entre três ou mais momentos (amostra dependente). Ao comparar três ou mais grupos ou momentos de uma só vez, ANOVA é mais robusta que o teste t e reduz as chances de erro tipo.

SAIBA MAIS

A Análise de Variância (ANOVA) verifica as diferentes fontes de variação que podem ocorrer em um conjunto de dados de uma variável quantitativa, ou seja, ela verifica em qual dos grupos (três ou mais) ou momentos (três ou mais) a variância é maior.

Fonte: Dancey, Reidy e Rowe (2017).

Existem dois tipos básicos de ANOVA: a ANOVA independente, conhecida como Anova 1 fator, e a ANOVA relacionada, chamada de Anova de Medidas Repetidas. O teste não paramétrico para a ANOVA 1 fator é o teste de Kruskal-Wallis, enquanto o teste não paramétrico para a Anova de Medidas Repetidas é o Teste de Friedman, os quais serão vistos juntamente com os demais testes não paramétricos.

Na ANOVA 1 fator, os participantes são avaliados somente em uma condição, ou seja, entre participantes ou entre um delineamento independente. Essa condição é representada por um delineamento de um fator com pelo menos três níveis (DANCEY; REIDY; ROWE, 2017). É um delineamento de um fator, pois apenas uma variável entra na análise e tem três níveis porque cada participante aparece somente em um nível. A Tabela 1 ilustra um delineamento de um fator, que é a nota da prova, com três níveis, que são os grupos (solteiros, casados e divorciados).

Nota dos Solteiros
Nota dos Casados
Nota dos Divorciados
I1
I7
I13
I2
I8
I14
I3
I9
I15
I4
I10
I16
I5
I11
I17
I6
I12
I18

Tabela 1 - Delineamento de 1 fator (nota da prova) com três níveis (estudantes solteiros, casados e divorciados) independentes
Nota: I = indivíduo.
Fonte: Elaborada pelo autor.

Na ANOVA de medidas repetidas, os participantes são avaliados em todas as condições em um delineamento intraparticipantes. Essa condição é representada por um delineamento de um fator com pelo menos três níveis ou condições de medidas repetidas (DANCEY; REIDY; ROWE, 2017). É um delineamento de um fator, pois apenas uma variável entra na análise e tem três níveis (momentos) porque cada participante apresenta um valor em um nível. A Tabela 2 ilustra um delineamento de um fator, que é a nota da prova de um grupo de alunos, com três níveis, que são os momentos (1º bimestre, 2º bimestre e 3º bimestre).

Nota do 1º bimestre
Nota do 2º bimestre
Nota do 3º bimestre
I1
I1
I1
I2
I2
I2
I3
I3
I3
I4
I4
I4
I5
I5
I5
I6
I6
I6

Tabela 2 - Delineamento de 1 fator (nota da prova) com três níveis (1º bimestre, 2º bimestre e 3º bimestre) dependentes
Nota: I = indivíduo.
Fonte: Elaborada pelo autor.

Os delineamentos da ANOVA independente e relacionada estão ilustrados na Figura 1, na qual primeiramente se pretende comparar a nota da prova entre três grupos independentes e depois se pretende comparar a nota da prova de uma amostra em três momentos distintos.

Figura 1 - Delineamentos da ANOVA independente e relacionada
Fonte: Elaborada pelo autor.

Nesses casos, as hipóteses da pesquisa tanto na ANOVA independente quanto na ANOVA relacionada ficariam da seguinte forma:

  • H\(_0\): a média da nota da prova é estatisticamente igual entre três grupos ou momentos
  • H\(_1\): a média da nota da prova não é estatisticamente igual entre três grupos ou momentos.

Por ser um teste de hipótese mais complexo e robusto do que os testes t, a ANOVA (independente e relacionada) requer uma lógica mais complexa para o cálculo da diferença entre os grupos ou momentos. A ANOVA analisa a igualdade das variâncias dos dados comparando dois componentes, a variância intergrupos e intragrupos, verificando se a variância entre os grupos é semelhante à variância dentro dos grupos (BARROS et al., 2012).

Variância Entre os Grupos (intergrupos)

A variância entre os grupos se refere à diferença entre cada indivíduo em comparação à média de todas as observações (grupos). Assim, quando as médias dos grupos são diferentes, pode-se dizer que a variação entre os grupos é alta, enquanto que, se não existir diferença entre as médias dos grupos, não existe variação. Esta variação pode ser ilustrada a partir do exemplo da média da nota da prova dos solteiros, casados e divorciados na Tabela 3, que variaram entre 5,3 e 8,3. Pode-se dizer que a variação entre os grupos é uma variação entre as colunas da Tabela 3.

Nota dos Solteiros
Nota dos Casados
Nota dos Divorciados
I1 = 7,0
I7 = 8,5
I13 = 5,0
I2 = 7,5
I8 = 8,5
I14 = 5,5
I3 = 7,0
I9 = 8,5
I15 = 6,0
I4 = 6,5
I10 = 8,0
I16 = 4,5
I5 = 7,0
I11 = 8,0
I17 = 5,0
I6 = 6,0
I12 = 8,5
I18 = 6,0
Média = 6,8
Média = 8,3
Média = 5,3

Tabela 3 - Nota da prova dos alunos solteiros, casados e divorciados
Nota: I = Indivíduo.
Fonte: Elaborada pelo autor.

Variância Intragrupos (Dentro dos Grupos)

A variância intragrupos se refere às diferenças e variações dentro dos grupos, ou seja, às diferenças entre cada participante em comparação à média do grupo que faz parte. Essa variação pode ser considerada como a variação dentro de cada coluna da tabela. Ao analisar os dados da Tabela 3, perceba que as notas do grupo 2 (casados) têm pequena variação interna, já que todos os indivíduos tiveram nota entre 8,0 e 8,5. Em contrapartida, o grupo 3 (divorciados) apresenta uma variação maior, entre 3,5 e 6,5.

Calculando as Variâncias e o Teste F

Para descobrir se existe diferença entre as médias de dois ou mais grupos ou momentos, a ANOVA executa os seguintes cálculos:

  • Média de cada um dos três ou mais grupos ou momentos.
  • Média geral da amostra (soma das médias de cada grupo ou momento e divisão pela quantidade de grupos ou momentos).
  • Em cada grupo é calculada a variação total de cada indivíduo em comparação à média do grupo (variação intragrupos).
  • A variação da média de cada grupo em relação à média geral (variação entre os grupos).

Percebe-se que todos os cálculos na ANOVA envolvem a média das observações. Assim, a variância total de um grupo revela a distância entre a média geral e o valor mais distante, conforme ilustra a Figura 2. A variância total é particionada devido à diferença entre a variância entre os grupos e a variância intragrupos (DANCEY; REIDY, 2019).

Figura 2 - Simulação de três grupos mostrando a decomposição da variância e as distâncias da média geral das observações
Fonte: Dancey e Reidy (2019, p. 305).

Para verificar as diferenças entre as variâncias intergrupos e intragrupos, utiliza-se o teste \(F\). O valor obtido no teste \(F\) é comparado com os valores críticos da distribuição de \(F\) (BARROS et al., 2012). Assim, o resultado da ANOVA pode ser representado pela razão entre a variância intergrupos e a variância intragrupos, conforme a equação abaixo:

\[F~=~Vari\hat{a}ncia~intergrupos~/~Vari\hat{a}ncia~intragrupos\]

Se o valor de F calculado for maior do que o F tabelado, deve-se rejeitar a H\(_0\), ao passo que se o valor de F calculado for menor do que o F tabelado, deve-se aceitar a H\(_0\).

SAIBA MAIS

Para saber como calcular o valor do teste F manualmente e verificar se existe diferença entre grupos independentes, assista ao vídeo do link a seguir:

<https://www.youtube.com/watch?v=9DMKUL3QYpI>. Acesso em: 29 abr. 2019.

O ideal em um estudo que se pretende comparar três ou mais grupos ou momentos é que a variância dentro dos grupos seja mínima para que o valor do teste F seja alto. Ainda, quando a variância entre os grupos é maior do que a variância dentro dos grupos, o valor do teste F será alto e a probabilidade de rejeitar a hipótese nula também é maior (DANCEY; REIDY, 2019).

A Figura 2 demonstra que existe uma sobreposição entre os grupos 2 e 3, indicando que eles não apresentam valores muito diferentes, enquanto que o grupo 1 não apresenta nenhuma sobreposição com os grupos 2 e 3. Além disso, a distância das médias dos grupos 2 e 3 é pequena quando comparada à distância entre a média do grupo 1 e a média geral.

Dessa forma, quanto maior for a variância entre os grupos em relação à variância média intragrupos, maior será o valor de F e a diferença entre os grupos. A Figura 3 ilustra situações de grande sobreposição (pequena diferença) e pequena sobreposição (grande diferença) entre os grupos.

Figura 3 - Representação de grande sobreposição e pequena sobreposição entre três grupos
Fonte: Elaborada pelo autor.

Embora a ANOVA e o cálculo do teste F sejam possíveis de serem realizados manualmente, os softwares estatísticos efetuam a ANOVA independente (1 Fator) e a ANOVA dependente (Medidas repetidas) rapidamente e sem a necessidade de cálculos manuais.

SAIBA MAIS

Para ver como efetuar a ANOVA de um fator para três grupos independentes no software SPSS, assista ao vídeo do link a seguir: <https://www.youtube.com/watch?v=EsPAX1Au8yc>. Acesso em: 29 abr. 2019.

SAIBA MAIS

Para ver como efetuar a ANOVA de medidas repetidas para três momentos no software SPSS, assista ao vídeo do link a seguir:

<https://www.youtube.com/watch?v=x0AZr9-U7Ss>. Acesso em: 29 abr. 2019.

Comparações Múltiplas

A ANOVA indica se existe alguma diferença entre as médias dos três grupos ou momentos, entretanto, não indica entre quais grupos foi encontrada a diferença significativa. Para isso, é necessário escolher um dos procedimentos de comparações múltiplas, chamados de Post-Hoc.

A escolha destes testes de comparações múltiplas deve levar em consideração o tamanho da amostra, número de grupo ou momentos, e o balanceamento entre a ocorrência do erro tipo I e tipo II. Os testes de Post-Hoc são similares ao teste t, mas são mais robustos por reduzirem a ocorrência do erro tipo I. Os principais Post-Hoc são o teste de Scheffé, o teste de Tukey e o teste de Bonferroni, os quais devem ser devem ser utilizados em algumas situações particulares (BARROS et al., 2012), como:

  • Teste de Tukey: amostras com mesmo tamanho e variâncias semelhantes.
  • Teste de Scheffé: é mais conservador e é indicado quando se tem muitos grupos.
  • Teste de Bonferroni: mais indicado quando se tem menor quantidade de grupos.

SAIBA MAIS

Para verificar mais características dos testes de comparações múltiplas, leia o texto do link a seguir: <http://www.portalaction.com.br/anova/teste-de-comparacoes-multiplas>. Acesso em: 29 abr. 2019.

QUESTÃO OBJETIVA

Um pesquisador pretende comparar três diferentes tipos de tratamento para uma determinada doença. Para isso, ele aloca aleatoriamente 100 participantes em cada uma das três condições. Como ele é um pesquisador cuidadoso, ele verificou por meio do histograma e do teste de Kolmogorov-Smirnov que os dados apresentaram uma distribuição normal. Para analisar as diferenças entre as três condições, qual é o teste mais adequado?

ANOVA de 1 fator.

Justificativa da correta: a ANOVA 1 fator é o teste paramétrico que compara as médias entre três ou mais grupos independentes em um nível (fator).

Teste t.

Teste t -> compara as médias de dois grupos.

Correlação linear simples.

Correlação linear simples -> analisa a associação entre duas variáveis quantitativas.

ANOVA de medidas repetidas.

ANOVA de medidas repetidas -> compara as médias de uma amostra em diferentes (mais de dois) momentos.

Curva de Gauss.

Curva de Gauss -> utilizada para analisar a distribuição normal.

QUESTÃO OBJETIVA

A ANOVA é o teste estatístico mais apropriado quando se quer comparar as médias de três ou mais grupos ou momentos. Para se chegar ao resultado da ANOVA, é necessário calcular o valor do teste F. Qual é a equação para se obter o valor do teste F?

Variância entre os grupos / variância intragrupos.

Justificativa da correta: a equação do teste F é a razão da variância entre os grupos pela variância dentro dos grupos.

Variância dentro dos grupos / variância intragrupos.

Variância dentro dos grupos / variância intragrupos -> a variância dentro dos grupos e a variância intragrupos são os mesmos valores. O correto é a razão da variância entre os grupos pela variância dentro dos grupos.

Variância entre os grupos x variância intragrupos.

Variância entre os grupos x variância intragrupos -> o teste F não se obtém por meio da multiplicação da variância entre os grupos e a variância intragrupos, mas sim pela razão das duas.

Variância entre os grupos + variância intragrupos.

Variância entre os grupos + variância intragrupos -> o teste F não se obtém por meio da soma da variância entre os grupos e a variância intragrupos, mas sim pela razão das duas.

Variância entre os grupos - variância intragrupos.

Variância entre os grupos - variância intragrupos -> o teste F não se obtém por meio da subtração da variância entre os grupos e a variância intragrupos, mas sim pela razão das duas.

Fechamento

Nesta aula aprendemos sobre o teste que é considerado a extensão do teste t, a ANOVA, que é o teste paramétrico que deve ser utilizado sempre que desejamos comparar três ou mais grupos ou momentos. Quando se quer comparar as médias entre três grupos independentes, deve-se utilizar a ANOVA 1 fator, ao passo que, quando se quer comparar as médias de uma amostra em três ou mais momentos, deve-se utilizar a ANOVA de medidas repetidas. Ambos os testes requerem o pressuposto da distribuição normal dos dados. No entanto, a ANOVA não indica entre quais grupos foi encontrada diferença nas médias, sendo necessário aplicar um teste de comparações múltiplas, os Post-Hoc. Os testes não paramétricos da ANOVA 1 fator e da ANOVA de Medidas Repetidas são o teste de Kruskal-Wallis e o Teste de Friedman.

Nesta aula, você teve a oportunidade de:

  • reconhecer a ANOVA de 1 Fator como o teste adequado para comparar os valores de uma variável quantitativa em mais de dois grupos;
  • reconhecer a ANOVA de Medidas Repetidas como o teste adequado para comparar os valores de uma variável quantitativa de uma amostra em mais de dois momentos distintos;
  • interpretar a lógica dos testes na forma de interpretação dos resultados.

Vídeo

Para complementar o seu aprendizado, assista o vídeo a seguir:

Aula Concluída!

Avançar