Nesta aula avançaremos nos testes de hipóteses que permitem comparar grupos independentes e dependentes. Nós já vimos os testes t que podem ser utilizados para a comparação de um grupo único, dois grupos independentes e dois grupos dependentes. Mas, e se o objetivo for comparar a nota de uma prova entre os estudantes solteiros, casados e divorciados (três grupos independentes)? Ou se desejar analisar uma variável quantitativa de uma amostra em três momentos distintos? Quais testes eu posso utilizar? Nesses casos, nós vamos utilizar a Análise de Variância (ANOVA) para 1 Fator ou a ANOVA de Medidas Repetidas, que são testes paramétricos considerados como uma extensão do teste t. As ANOVAs também possuem seus equivalentes não paramétricos, que serão vistos na próxima aula juntamente com os outros testes não paramétricos.
Ao final desta aula, você será capaz de:
Assim como nos testes t, a ANOVA analisa as diferenças entre as médias dos grupos, determinando a média geral e verificando a sua diferença de cada média individual (DANCEY; REIDY; ROWE, 2017). Por esse motivo, a ANOVA é considerada uma extensão do teste t e apresentaria resultados semelhantes ao do teste t em uma comparação com duas condições (grupos ou momentos). A principal diferença da ANOVA para os testes t é que ela verifica as diferenças entre três ou mais grupos (amostras independentes) e entre três ou mais momentos (amostra dependente). Ao comparar três ou mais grupos ou momentos de uma só vez, ANOVA é mais robusta que o teste t e reduz as chances de erro tipo.
A Análise de Variância (ANOVA) verifica as diferentes fontes de variação que podem ocorrer em um conjunto de dados de uma variável quantitativa, ou seja, ela verifica em qual dos grupos (três ou mais) ou momentos (três ou mais) a variância é maior.
Fonte: Dancey, Reidy e Rowe (2017).

Existem dois tipos básicos de ANOVA: a ANOVA independente, conhecida como Anova 1 fator, e a ANOVA relacionada, chamada de Anova de Medidas Repetidas. O teste não paramétrico para a ANOVA 1 fator é o teste de Kruskal-Wallis, enquanto o teste não paramétrico para a Anova de Medidas Repetidas é o Teste de Friedman, os quais serão vistos juntamente com os demais testes não paramétricos.
Na ANOVA 1 fator, os participantes são avaliados somente em uma condição, ou seja, entre participantes ou entre um delineamento independente. Essa condição é representada por um delineamento de um fator com pelo menos três níveis (DANCEY; REIDY; ROWE, 2017). É um delineamento de um fator, pois apenas uma variável entra na análise e tem três níveis porque cada participante aparece somente em um nível. A Tabela 1 ilustra um delineamento de um fator, que é a nota da prova, com três níveis, que são os grupos (solteiros, casados e divorciados).
Tabela 1 - Delineamento de 1 fator (nota da prova) com três níveis (estudantes solteiros, casados e divorciados) independentes
Nota: I = indivíduo.
Fonte: Elaborada pelo autor.
Na ANOVA de medidas repetidas, os participantes são avaliados em todas as condições em um delineamento intraparticipantes. Essa condição é representada por um delineamento de um fator com pelo menos três níveis ou condições de medidas repetidas (DANCEY; REIDY; ROWE, 2017). É um delineamento de um fator, pois apenas uma variável entra na análise e tem três níveis (momentos) porque cada participante apresenta um valor em um nível. A Tabela 2 ilustra um delineamento de um fator, que é a nota da prova de um grupo de alunos, com três níveis, que são os momentos (1º bimestre, 2º bimestre e 3º bimestre).
Tabela 2 - Delineamento de 1 fator (nota da prova) com três níveis (1º bimestre, 2º bimestre e 3º bimestre) dependentes
Nota: I = indivíduo.
Fonte: Elaborada pelo autor.
Os delineamentos da ANOVA independente e relacionada estão ilustrados na Figura 1, na qual primeiramente se pretende comparar a nota da prova entre três grupos independentes e depois se pretende comparar a nota da prova de uma amostra em três momentos distintos.

Nesses casos, as hipóteses da pesquisa tanto na ANOVA independente quanto na ANOVA relacionada ficariam da seguinte forma:
Por ser um teste de hipótese mais complexo e robusto do que os testes t, a ANOVA (independente e relacionada) requer uma lógica mais complexa para o cálculo da diferença entre os grupos ou momentos. A ANOVA analisa a igualdade das variâncias dos dados comparando dois componentes, a variância intergrupos e intragrupos, verificando se a variância entre os grupos é semelhante à variância dentro dos grupos (BARROS et al., 2012).
A variância entre os grupos se refere à diferença entre cada indivíduo em comparação à média de todas as observações (grupos). Assim, quando as médias dos grupos são diferentes, pode-se dizer que a variação entre os grupos é alta, enquanto que, se não existir diferença entre as médias dos grupos, não existe variação. Esta variação pode ser ilustrada a partir do exemplo da média da nota da prova dos solteiros, casados e divorciados na Tabela 3, que variaram entre 5,3 e 8,3. Pode-se dizer que a variação entre os grupos é uma variação entre as colunas da Tabela 3.
Tabela 3 - Nota da prova dos alunos solteiros, casados e divorciados
Nota: I = Indivíduo.
Fonte: Elaborada pelo autor.
A variância intragrupos se refere às diferenças e variações dentro dos grupos, ou seja, às diferenças entre cada participante em comparação à média do grupo que faz parte. Essa variação pode ser considerada como a variação dentro de cada coluna da tabela. Ao analisar os dados da Tabela 3, perceba que as notas do grupo 2 (casados) têm pequena variação interna, já que todos os indivíduos tiveram nota entre 8,0 e 8,5. Em contrapartida, o grupo 3 (divorciados) apresenta uma variação maior, entre 3,5 e 6,5.
Para descobrir se existe diferença entre as médias de dois ou mais grupos ou momentos, a ANOVA executa os seguintes cálculos:
Percebe-se que todos os cálculos na ANOVA envolvem a média das observações. Assim, a variância total de um grupo revela a distância entre a média geral e o valor mais distante, conforme ilustra a Figura 2. A variância total é particionada devido à diferença entre a variância entre os grupos e a variância intragrupos (DANCEY; REIDY, 2019).

Para verificar as diferenças entre as variâncias intergrupos e intragrupos, utiliza-se o teste \(F\). O valor obtido no teste \(F\) é comparado com os valores críticos da distribuição de \(F\) (BARROS et al., 2012). Assim, o resultado da ANOVA pode ser representado pela razão entre a variância intergrupos e a variância intragrupos, conforme a equação abaixo:
\[F~=~Vari\hat{a}ncia~intergrupos~/~Vari\hat{a}ncia~intragrupos\]
Se o valor de F calculado for maior do que o F tabelado, deve-se rejeitar a H\(_0\), ao passo que se o valor de F calculado for menor do que o F tabelado, deve-se aceitar a H\(_0\).
Para saber como calcular o valor do teste F manualmente e verificar se existe diferença entre grupos independentes, assista ao vídeo do link a seguir:
<https://www.youtube.com/watch?v=9DMKUL3QYpI>. Acesso em: 29 abr. 2019.

O ideal em um estudo que se pretende comparar três ou mais grupos ou momentos é que a variância dentro dos grupos seja mínima para que o valor do teste F seja alto. Ainda, quando a variância entre os grupos é maior do que a variância dentro dos grupos, o valor do teste F será alto e a probabilidade de rejeitar a hipótese nula também é maior (DANCEY; REIDY, 2019).
A Figura 2 demonstra que existe uma sobreposição entre os grupos 2 e 3, indicando que eles não apresentam valores muito diferentes, enquanto que o grupo 1 não apresenta nenhuma sobreposição com os grupos 2 e 3. Além disso, a distância das médias dos grupos 2 e 3 é pequena quando comparada à distância entre a média do grupo 1 e a média geral.
Dessa forma, quanto maior for a variância entre os grupos em relação à variância média intragrupos, maior será o valor de F e a diferença entre os grupos. A Figura 3 ilustra situações de grande sobreposição (pequena diferença) e pequena sobreposição (grande diferença) entre os grupos.

Embora a ANOVA e o cálculo do teste F sejam possíveis de serem realizados manualmente, os softwares estatísticos efetuam a ANOVA independente (1 Fator) e a ANOVA dependente (Medidas repetidas) rapidamente e sem a necessidade de cálculos manuais.
Para ver como efetuar a ANOVA de um fator para três grupos independentes no software SPSS, assista ao vídeo do link a seguir: <https://www.youtube.com/watch?v=EsPAX1Au8yc>. Acesso em: 29 abr. 2019.

Para ver como efetuar a ANOVA de medidas repetidas para três momentos no software SPSS, assista ao vídeo do link a seguir:
<https://www.youtube.com/watch?v=x0AZr9-U7Ss>. Acesso em: 29 abr. 2019.

A ANOVA indica se existe alguma diferença entre as médias dos três grupos ou momentos, entretanto, não indica entre quais grupos foi encontrada a diferença significativa. Para isso, é necessário escolher um dos procedimentos de comparações múltiplas, chamados de Post-Hoc.
A escolha destes testes de comparações múltiplas deve levar em consideração o tamanho da amostra, número de grupo ou momentos, e o balanceamento entre a ocorrência do erro tipo I e tipo II. Os testes de Post-Hoc são similares ao teste t, mas são mais robustos por reduzirem a ocorrência do erro tipo I. Os principais Post-Hoc são o teste de Scheffé, o teste de Tukey e o teste de Bonferroni, os quais devem ser devem ser utilizados em algumas situações particulares (BARROS et al., 2012), como:
Para verificar mais características dos testes de comparações múltiplas, leia o texto do link a seguir: <http://www.portalaction.com.br/anova/teste-de-comparacoes-multiplas>. Acesso em: 29 abr. 2019.

Um pesquisador pretende comparar três diferentes tipos de tratamento para uma determinada doença. Para isso, ele aloca aleatoriamente 100 participantes em cada uma das três condições. Como ele é um pesquisador cuidadoso, ele verificou por meio do histograma e do teste de Kolmogorov-Smirnov que os dados apresentaram uma distribuição normal. Para analisar as diferenças entre as três condições, qual é o teste mais adequado?
ANOVA de 1 fator.
Justificativa da correta: a ANOVA 1 fator é o teste paramétrico que compara as médias entre três ou mais grupos independentes em um nível (fator).
Teste t.
Teste t -> compara as médias de dois grupos.
Correlação linear simples.
Correlação linear simples -> analisa a associação entre duas variáveis quantitativas.
ANOVA de medidas repetidas.
ANOVA de medidas repetidas -> compara as médias de uma amostra em diferentes (mais de dois) momentos.
Curva de Gauss.
Curva de Gauss -> utilizada para analisar a distribuição normal.
A ANOVA é o teste estatístico mais apropriado quando se quer comparar as médias de três ou mais grupos ou momentos. Para se chegar ao resultado da ANOVA, é necessário calcular o valor do teste F. Qual é a equação para se obter o valor do teste F?
Variância entre os grupos / variância intragrupos.
Justificativa da correta: a equação do teste F é a razão da variância entre os grupos pela variância dentro dos grupos.
Variância dentro dos grupos / variância intragrupos.
Variância dentro dos grupos / variância intragrupos -> a variância dentro dos grupos e a variância intragrupos são os mesmos valores. O correto é a razão da variância entre os grupos pela variância dentro dos grupos.
Variância entre os grupos x variância intragrupos.
Variância entre os grupos x variância intragrupos -> o teste F não se obtém por meio da multiplicação da variância entre os grupos e a variância intragrupos, mas sim pela razão das duas.
Variância entre os grupos + variância intragrupos.
Variância entre os grupos + variância intragrupos -> o teste F não se obtém por meio da soma da variância entre os grupos e a variância intragrupos, mas sim pela razão das duas.
Variância entre os grupos - variância intragrupos.
Variância entre os grupos - variância intragrupos -> o teste F não se obtém por meio da subtração da variância entre os grupos e a variância intragrupos, mas sim pela razão das duas.
Nesta aula aprendemos sobre o teste que é considerado a extensão do teste t, a ANOVA, que é o teste paramétrico que deve ser utilizado sempre que desejamos comparar três ou mais grupos ou momentos. Quando se quer comparar as médias entre três grupos independentes, deve-se utilizar a ANOVA 1 fator, ao passo que, quando se quer comparar as médias de uma amostra em três ou mais momentos, deve-se utilizar a ANOVA de medidas repetidas. Ambos os testes requerem o pressuposto da distribuição normal dos dados. No entanto, a ANOVA não indica entre quais grupos foi encontrada diferença nas médias, sendo necessário aplicar um teste de comparações múltiplas, os Post-Hoc. Os testes não paramétricos da ANOVA 1 fator e da ANOVA de Medidas Repetidas são o teste de Kruskal-Wallis e o Teste de Friedman.
Nesta aula, você teve a oportunidade de:
Aula Concluída!
Avançar