Fechar X

Notas

Aula 05


Selecione a seta para iniciar o conteúdo

Introdução

Imagine que um pesquisador pretende comparar as médias do nível de ansiedade de homens e mulheres com diagnóstico de câncer, entretanto, ao analisar o principal pressuposto para a utilização dos testes de comparação de médias (testes t e ANOVA), ele percebe que o conjunto de dados possui muitos valores extremos e que a distribuição dos dados é assimétrica, fugindo da distribuição normal. E agora? O que se deve fazer já que não é recomendado utilizar um teste para comparação de médias? Nesse caso e em todas as situações em que este pressuposto básico não é atendido, deve-se adotar a estatística não paramétrica, a qual possui testes alternativos para todos os testes paramétricos vistos nas aulas anteriores desta Unidade. Nessa aula, veremos os testes “U” de Mann-Whitney, Wilcoxon, Kruskal-Wallis, Friedman e a Correlação de Spearman.

Ao final desta aula, você será capaz de:

  • compreender as características e aplicabilidade da estatística não paramétrica;
  • identificar os testes não paramétricos alternativos para os testes paramétricos;
  • compreender a interpretação dos testes não paramétricos.

Estatística não Paramétrica

Embora a estatística paramétrica seja mais poderosa e robusta do que a estatística não paramétrica, os testes paramétricos requerem alguns pressupostos específicos, sendo o principal deles a distribuição normal do conjunto de dados. Em alguns casos, este pressuposto é violado, fazendo com que sejam adotados testes não paramétricos.

A Estatística não paramétrica representa um conjunto de testes de hipóteses apropriados para pesquisas nas quais não se conhece muito bem a distribuição da população e seus parâmetros, ou seja, quando os dados de conjunto de observações não atendem o pressuposto da distribuição normal (DANCEY; REIDY; ROWE, 2017). A aplicação dos testes não paramétricos possui vantagens e desvantagens para a análise de um conjunto de dados, as quais estão listadas no Quadro 1.

Vantagens Desvantagens
Os testes não paramétricos podem ser aplicados a diferentes situações, uma vez que não requerem populações com distribuição normal. A estatística não paramétrica pode perder informações durante os cálculos matemáticos, uma vez que os dados numéricos são frequentemente reduzidos a uma forma qualitativa (postos).
Diferentemente dos testes paramétricos, os testes não paramétricos podem ser aplicados em variáveis qualitativas. Os testes não paramétricos são menos robustos do que os testes paramétricos e requerem amostras maiores para aumentar a probabilidade de rejeitar a hipótese nula.
A estatística não paramétrica utiliza cálculos matemáticos mais simples e de fácil compreensão.  

Quadro 1 - Vantagens e desvantagens da utilização da estatística não paramétrica
Fonte: Elaborada pelo autor.

Como nas situações em que os dados não apresentam distribuição normal o valor da média é distorcido pelos valores extremos do conjunto de dados, quando utilizamos os testes não paramétricos é recomendada a utilização da mediana como medida de tendência central para representar os dados.

SAIBA MAIS

Para ver mais aplicações e características da estatística não paramétrica, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=RRx-S4aDLPY>. Acesso em: 29 abr. 2019.

Nos tópicos a seguir abordaremos os testes não paramétricos para cada um dos testes paramétricos vistos nas aulas anteriores desta Unidade, começando pelos testes não paramétricos para o teste t.

Alternativas não Paramétricas ao Teste t

Os testes “U” de Mann-Whitney e Wilcoxon são os testes equivalentes não paramétricos dos testes t independente e dependente. O teste “U” de Mann-Whitney é apropriado para duas amostras independentes (dois grupos), enquanto o teste de Wilcoxon é utilizado quando se têm os mesmos participantes ou participantes emparelhados em duas condições ou dois momentos (DANCEY; REIDY; ROWE, 2017).

Diferentemente do teste t independente, o teste “U” não se baseia nos valores médios e seu cálculo é mais simples, sendo obtido por meio da comparação da soma dos postos (posições) que os valores do conjunto de dados ocupam em cada um dos dois grupos (BARROS et al., 2012).

SAIBA MAIS

Para saber como é calculado o ranking dos postos nos testes “U” de Mann-Whitney e Wilcoxon, leia os capítulos 10 e 11 do livro:

BARROS et al. Análise de dados em saúde. 3. ed. Londrina/PR: Midiograf, 2012.

Considere uma situação na qual um pesquisador pretende comparar densidade óssea entre crianças com desnutrição e crianças sem desnutrição. Ao verificar que os dados não apresentaram distribuição normal, o pesquisador teve que recorrer ao teste não paramétrico “U” de Mann-Whitney. As hipóteses estatísticas nula e alternativa são formuladas no mesmo raciocínio dos testes paramétricos, sendo a hipótese nula sempre conservadora:

  • H\(_0\): os dois grupos têm a mesma distribuição.
  • H\(_1\): os dois grupos não têm a mesma distribuição.

SAIBA MAIS

Para ver como efetuar o teste não paramétrico “U” de Mann-Whitney para comparar dois grupos no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=SJT-k6VaHiU>. Acesso em: 29 abr. 2019.

O teste de Wilcoxon é o equivalente não paramétrico do teste t dependente e também utiliza o ranking dos postos para se calcular a estatística do teste. No entanto, este teste determina a diferença entre as medidas de cada par de observações, e estas diferenças são classificadas de acordo com o sinal (positivo ou negativo) e ordenadas pela magnitude. Por último, os escores são transformados pelo valor do posto que ocupam no ordenamento dos desvios (BARROS et al., 2012).

Considere uma situação na qual um pesquisador pretende comparar o percentual de gordura de uma amostra de crianças antes e depois de um programa de oito semanas de alimentação saudável. Ao verificar que os dados não apresentaram distribuição normal, o pesquisador teve que recorrer ao teste não paramétrico de Wilcoxon. As hipóteses estatísticas nula e alternativa são formuladas no mesmo raciocínio dos testes paramétricos, ficando da seguinte forma:

  • H\(_0\): a mediana das diferenças entre as observações é igual a zero.
  • H\(_1\): a mediana das diferenças entre as observações não é igual a zero.

SAIBA MAIS

Para ver como efetuar o teste não paramétrico de Wilcoxon para comparar dois momentos no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=VOVEESAEGnA>. Acesso em: 29 abr. 2019.

Alternativas não Paramétricas à ANOVA

Os testes de Kruskal-Wallis e Friedman são os testes equivalentes não paramétricos da ANOVA 1 fator e da ANOVA de medidas repetidas. O teste de Kruskal-Wallis é apropriado para três amostras independentes (três grupos), enquanto o teste de Friedman é utilizado quando se tem os mesmos participantes ou participantes emparelhados em três condições ou três momentos.

O teste de Kruskal-Wallis é uma extensão do teste “U” de Mann-Whitney e não considera as distribuições dos valores, mas sim o posicionamento das observações em cada grupo, as quais são comparadas por meio da soma dos postos. As principais condições em que o teste de Kruskal-Wallis é utilizado são quando os dados não apresentam distribuição normal, com amostras reduzidas e com variáveis em escala ordinal (DANCEY; REIDY; ROWE, 2017).

SAIBA MAIS

Para saber como é calculada manualmente a equação matemática do teste de Kruskal-Wallis, leia o capítulo 12 do livro:

BARROS et al. Análise de dados em saúde. 3. ed. Londrina-PR: Midiograf, 2012.

Considere uma situação na qual um professor pretende comparar o nível de conhecimento em bioestatística de estudantes do primeiro, segundo e terceiro anos de uma faculdade. Além de ter uma amostra reduzida, os dados apresentaram uma distribuição assimétrica, impossibilitando a aplicação da ANOVA 1 fator. Dessa forma, é necessário aplicar o teste não paramétrico de Kruskal-Wallis. As hipóteses estatísticas nula e alternativa são formuladas no mesmo raciocínio dos testes paramétricos, ficando da seguinte forma:

  • H\(_0\): os três grupos têm a mesma distribuição dos valores.
  • H\(_1\): os três grupos não têm a mesma distribuição dos valores.

SAIBA MAIS

Para ver como efetuar o teste não paramétrico de Kruskal-Wallis para comparar três ou mais grupos no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=LROp-jeaa7g>. Acesso em: 29 abr. 2019.

O teste de Friedman é utilizado nos casos em que os dados não atendem os pressupostos para a utilização da ANOVA de medidas repetidas. Este teste é uma extensão do teste de Wilcoxon, entretanto, analisa as diferenças entre os mesmos participantes ou o emparelhamento dos participantes em três ou mais condições (momentos). Assim como o teste de Kruskal-Wallis, o teste de Friedman não considera as distribuições dos valores, mas sim o posicionamento das observações em cada grupo, as quais são comparadas por meio da soma dos postos (DANCEY; REIDY; ROWE, 2017).

Considere uma situação na qual um professor pretende comparar o nível de conhecimento em bioestatística de uma amostra de estudantes de uma faculdade em três condições (momentos): começo do ano, meio do ano e fim do ano. Considerando que os dados não apresentaram distribuição normal, não é recomendada a aplicação da ANOVA de medidas repetidas, sendo necessária a utilização do teste não paramétrico de Friedman. As hipóteses estatísticas nula e alternativa são formuladas no mesmo raciocínio dos testes paramétricos, ficando da seguinte forma:

  • H\(_0\): as três condições têm a mesma distribuição dos valores.
  • H\(_1\): as três condições não têm a mesma distribuição dos valores.

SAIBA MAIS

Para ver como efetuar o teste não paramétrico de Friedman para comparar três ou mais momentos no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=MHLoWbQ09qQ>. Acesso em: 29 abr. 2019.

Alternativa à Correlação de Pearson

Em algumas situações não é recomendado empregar a correlação de Pearson, uma vez que podem levar a interpretações errôneas a respeito da relação entre as variáveis do conjunto de observações investigado (BARROS et al., 2012). As principais situações em que a correlação de Pearson (r) não deve ser empregada estão apontadas na Figura 1.

Figura 1 - Situações nas quais se deve evitar o uso da correlação de Pearson
Fonte: Elaborada pelo autor.

A Figura 2 ilustra as situações apontadas na Figura 1 no diagrama de dispersão para facilitar a compreensão das situações em que não se deve utilizar a correlação de Pearson.

Figura 2 - Diagramas que ilustram relação não linear (a), presença de valores extremos (b) e presença de subgrupos (c).
Fonte: Barros et al. (2012, p.187).

Nesses casos deve-se empregar a correlação de Spearman (p), que é o equivalente não paramétrico da correlação de Pearson (r). Embora ambos os testes sejam similares e interpretados de forma semelhante, a correlação de Spearman é uma medida de correlação não linear e deve ser empregada nas situações listadas na Figura 3.

Figura 3 - Situações nas quais se deve utilizar a correlação de Spearman
Fonte: Elaborada pelo autor.

O cálculo da correlação de Spearman é obtido por meio transformação dos escores brutos de uma variável, os quais devem ser substituídos pelo valor da sua posição (posto) no conjunto de dados. A mesma operação deve ser realizada com a outra variável. Em seguida, as mesmas operações matemáticas da correlação de Pearson devem ser empregadas para a correlação de Spearman (BARROS et al., 2012). Dessa forma, pode-se dizer que a correlação de Spearman é uma correlação linear entre os postos das duas variáveis.

As hipóteses estatísticas nula e alternativa da correlação de Spearman são formuladas no mesmo raciocínio da correlação de Pearson, ficando da seguinte forma:

  • H\(_0\): o coeficiente de correlação é igual a zero.
  • H\(_1\): o coeficiente de correlação é não igual a zero.

SAIBA MAIS

Para ver como efetuar a Correlação de Pearson (paramétrica) e Spearman (não paramétrica) para associar duas variáveis quantitativas no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=9a1ova9v03Y&t=379s>. Acesso em: 29 abr. 2019.

QUESTÃO OBJETIVA

Considere uma situação na qual um pesquisador pretende analisar a diferença do estado de humor dos funcionários de uma empresa do começo do expediente de trabalho (8h00min) para o final do expediente (17h0min). Para isso, ele aplicou um questionário no grupo de funcionários em dois momentos distintos, o qual forneceu um escore de humor para cada funcionário em cada momento (início e fim do expediente). Lembre-se de que, ao analisar a distribuição dos dados, o pesquisador percebeu que os dados fugiam da curva da distribuição normal. Qual o teste estatístico apropriado para esta situação?

Teste de Wilcoxon

Justificativa da correta: o teste de Wilcoxon é o teste não paramétrico para comparar a mesma amostra em duas condições (momentos).

Teste “U” de Mann-Whitney.

Teste “U” de Mann-Whitney -> teste não paramétrico para comparar duas amostras independentes.

Teste t independente.

Teste t independente -> teste paramétrico para comparar duas amostras independentes.

Teste t dependente.

Teste t dependente -> teste paramétrico para comparar a mesma amostra em duas condições (momentos)

Anova de Medidas Repetidas.

Anova de Medidas Repetidas -> teste paramétricos para comparar a mesma amostra em três ou mais condições (momentos).

QUESTÃO OBJETIVA

Para verificar a diferença nos valores de duas condições de delineamento entre participantes (amostras independentes), com dados organizados em postos, qual é o teste mais apropriado?

“U” de Mann-Whitney.

Justificativa da correta: o teste “U” de Mann-Whitney compara duas amostras independentes utilizando a organização dos dados em postos, uma vez que é um teste não paramétrico.

Kruskal-Wallis.

Kruskal-Wallis -> utiliza a organização em postos, mas é indicado para a comparação de delineamentos com três ou mais condições (amostras independentes).

Wilcoxon.

Wilcoxon -> utiliza a organização em postos, mas é indicado para a comparação de delineamentos com duas condições nas quais façam parte os mesmos participantes ou que estejam emparelhados (amostras dependentes).

Correlação de Spearman.

Correlação de Spearman -> analisa a relação entre duas variáveis.

Teste t independente.

Teste t independente -> comparar duas condições independentes por meio dos valores das médias de cada grupo.

Fechamento

A estatística não paramétrica é uma alternativa interessante nos casos em que os dados apresentem uma distribuição assimétrica e que fuja da distribuição normal, o que impossibilita a utilização dos testes paramétricos. Embora sejam úteis nesses casos e também possuam cálculos matemáticos mais simples e não exijam grandes amostras, os testes não paramétricos são menos poderosos e robustos do que os testes paramétricos, além de tornarem possível a perda de informação durante os cálculos, uma vez que os dados numéricos são frequentemente reduzidos a uma forma qualitativa (postos). Os testes não paramétricos vistos nesta aula foram o teste “U” de Mann-Whitney (equivalente ao teste t independente), Wilcoxon (equivalente ao teste t dependente), Kruskal-Wallis (equivalente à Anova de 1 fator), Friedman (equivalente à Anova de medidas repetidas) e Correlação de Spearman (equivalente à Correlação de Pearson).

Nesta aula, você teve a oportunidade de:

  • compreender as características, vantagens e desvantagens da estatística não paramétrica;
  • identificar os testes não paramétricos alternativos para os testes paramétricos;
  • compreender a interpretação dos testes não paramétricos.

Atividade Complementar

Para complementar o aprendizado e aprofundar o conhecimento em relação aos testes paramétricos e não paramétricos discutidos ao longo desta Unidade, você pode ler o livro Descobrindo a estatística usando o SPSS, que consta na lista de referências ao final da Unidade. Durante a leitura, atente-se aos procedimentos necessários para efetuar cada um dos testes paramétricos e não paramétricos no software SPSS. Alguns dos testes abordados ao longo do livro são apresentados no vídeo do link a seguir, que também demonstra como efetuar testes estatísticos no SPSS.

Fonte: <https://www.youtube.com/watch?v=y4S_xEZ-8PM>. Acesso em: 29 abr. 2019.

Ao assistir ao vídeo e durante a leitura, atente-se aos pressupostos para a utilização dos testes paramétricos e não paramétricos e ao passo a passo para efetuar cada teste.

Teoria e Prática

Você sabia que pessoas calmas têm menor risco de ter demência durante a velhice? Esta é uma informação importante, considerando que vivemos em uma sociedade em que as pessoas vivem uma rotina de trabalho estressante e que afeta diretamente a saúde física e mental. Mas uma informação como essa não é obtida sem a condução de uma pesquisa e a utilização da estatística descritiva e inferencial.

Para se chegar a esta conclusão, um grupo de pesquisadores conduziu um experimento com 506 idosos que não sofriam de demência ao serem examinados inicialmente. O grupo recebeu questionários para apurar detalhes sobre sua personalidade e estilo de vida. Após acompanhar estes idosos por seis anos, o estudo concluiu que pessoas mais calmas e relaxadas têm 50% menor risco de desenvolver demência em comparação às pessoas com tendência a se estressar.

Estudo de caso

De acordo com a Organização Mundial de Saúde (OMS), o estresse é considerado o mal do século XXI, atingindo 90% da população mundial. Trabalho, problemas pessoais, relacionamentos amorosos, finanças, mudanças no estilo de vida, falta de tempo livre para o lazer e para a família são os principais fatores que desencadeiam o estresse. Para criar políticas públicas que auxiliem no combate ao estresse, uma equipe de pesquisadores procurou compreender a relação do estresse com alguns fatores do cotidiano diário das pessoas, como a carga-horária de trabalho, o número de filhos, a renda mensal e as horas destinadas às atividades de lazer. Para se chegar a uma conclusão de que estas variáveis apresentam relação com o estresse das pessoas, a condução de uma pesquisa utilizando a estatística inferencial é fundamental, pois um teste de hipótese poderá proporcionar informações a respeito dos principais fatores que favorecem ou evitam o desencadeamento do estresse.

O pesquisador tem um problema a ser estudado (relação do estresse com fatores do cotidiano) e, após obter os dados de uma amostra por meio de um questionário, deve ser empregado um teste de hipóteses, no caso uma regressão linear, para verificar os possíveis fatores preditores do estresse. Com estas conclusões, é possível desenvolver políticas públicas e criar estratégias para reduzir o estresse na população.

Vídeo

Para complementar o seu aprendizado, assista o vídeo a seguir:

Aula Concluída!

Avançar