Aula 05

Estatística não Paramétrica

Embora a estatística paramétrica seja mais poderosa e robusta do que a estatística não paramétrica, os testes paramétricos requerem alguns pressupostos específicos, sendo o principal deles a distribuição normal do conjunto de dados. Em alguns casos, este pressuposto é violado, fazendo com que sejam adotados testes não paramétricos.

A Estatística não paramétrica representa um conjunto de testes de hipóteses apropriados para pesquisas nas quais não se conhece muito bem a distribuição da população e seus parâmetros, ou seja, quando os dados de conjunto de observações não atendem o pressuposto da distribuição normal (DANCEY; REIDY; ROWE, 2017). A aplicação dos testes não paramétricos possui vantagens e desvantagens para a análise de um conjunto de dados, as quais estão listadas no Quadro 1.

Vantagens	Desvantagens
Os testes não paramétricos podem ser aplicados a diferentes situações, uma vez que não requerem populações com distribuição normal.	A estatística não paramétrica pode perder informações durante os cálculos matemáticos, uma vez que os dados numéricos são frequentemente reduzidos a uma forma qualitativa (postos).
Diferentemente dos testes paramétricos, os testes não paramétricos podem ser aplicados em variáveis qualitativas.	Os testes não paramétricos são menos robustos do que os testes paramétricos e requerem amostras maiores para aumentar a probabilidade de rejeitar a hipótese nula.
A estatística não paramétrica utiliza cálculos matemáticos mais simples e de fácil compreensão.

Quadro 1 - Vantagens e desvantagens da utilização da estatística não paramétrica
Fonte: Elaborada pelo autor.

Como nas situações em que os dados não apresentam distribuição normal o valor da média é distorcido pelos valores extremos do conjunto de dados, quando utilizamos os testes não paramétricos é recomendada a utilização da mediana como medida de tendência central para representar os dados.

SAIBA MAIS

Para ver mais aplicações e características da estatística não paramétrica, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=RRx-S4aDLPY>. Acesso em: 29 abr. 2019.

Nos tópicos a seguir abordaremos os testes não paramétricos para cada um dos testes paramétricos vistos nas aulas anteriores desta Unidade, começando pelos testes não paramétricos para o teste t.

Alternativas não Paramétricas ao Teste t

Os testes “U” de Mann-Whitney e Wilcoxon são os testes equivalentes não paramétricos dos testes t independente e dependente. O teste “U” de Mann-Whitney é apropriado para duas amostras independentes (dois grupos), enquanto o teste de Wilcoxon é utilizado quando se têm os mesmos participantes ou participantes emparelhados em duas condições ou dois momentos (DANCEY; REIDY; ROWE, 2017).

Diferentemente do teste t independente, o teste “U” não se baseia nos valores médios e seu cálculo é mais simples, sendo obtido por meio da comparação da soma dos postos (posições) que os valores do conjunto de dados ocupam em cada um dos dois grupos (BARROS et al., 2012).

SAIBA MAIS

Para saber como é calculado o ranking dos postos nos testes “U” de Mann-Whitney e Wilcoxon, leia os capítulos 10 e 11 do livro:

BARROS et al. Análise de dados em saúde. 3. ed. Londrina/PR: Midiograf, 2012.

Considere uma situação na qual um pesquisador pretende comparar densidade óssea entre crianças com desnutrição e crianças sem desnutrição. Ao verificar que os dados não apresentaram distribuição normal, o pesquisador teve que recorrer ao teste não paramétrico “U” de Mann-Whitney. As hipóteses estatísticas nula e alternativa são formuladas no mesmo raciocínio dos testes paramétricos, sendo a hipótese nula sempre conservadora:

H\(_0\): os dois grupos têm a mesma distribuição.
H\(_1\): os dois grupos não têm a mesma distribuição.

SAIBA MAIS

Para ver como efetuar o teste não paramétrico “U” de Mann-Whitney para comparar dois grupos no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=SJT-k6VaHiU>. Acesso em: 29 abr. 2019.

O teste de Wilcoxon é o equivalente não paramétrico do teste t dependente e também utiliza o ranking dos postos para se calcular a estatística do teste. No entanto, este teste determina a diferença entre as medidas de cada par de observações, e estas diferenças são classificadas de acordo com o sinal (positivo ou negativo) e ordenadas pela magnitude. Por último, os escores são transformados pelo valor do posto que ocupam no ordenamento dos desvios (BARROS et al., 2012).

Considere uma situação na qual um pesquisador pretende comparar o percentual de gordura de uma amostra de crianças antes e depois de um programa de oito semanas de alimentação saudável. Ao verificar que os dados não apresentaram distribuição normal, o pesquisador teve que recorrer ao teste não paramétrico de Wilcoxon. As hipóteses estatísticas nula e alternativa são formuladas no mesmo raciocínio dos testes paramétricos, ficando da seguinte forma:

H\(_0\): a mediana das diferenças entre as observações é igual a zero.
H\(_1\): a mediana das diferenças entre as observações não é igual a zero.

SAIBA MAIS

Para ver como efetuar o teste não paramétrico de Wilcoxon para comparar dois momentos no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=VOVEESAEGnA>. Acesso em: 29 abr. 2019.

Alternativas não Paramétricas à ANOVA

Os testes de Kruskal-Wallis e Friedman são os testes equivalentes não paramétricos da ANOVA 1 fator e da ANOVA de medidas repetidas. O teste de Kruskal-Wallis é apropriado para três amostras independentes (três grupos), enquanto o teste de Friedman é utilizado quando se tem os mesmos participantes ou participantes emparelhados em três condições ou três momentos.

O teste de Kruskal-Wallis é uma extensão do teste “U” de Mann-Whitney e não considera as distribuições dos valores, mas sim o posicionamento das observações em cada grupo, as quais são comparadas por meio da soma dos postos. As principais condições em que o teste de Kruskal-Wallis é utilizado são quando os dados não apresentam distribuição normal, com amostras reduzidas e com variáveis em escala ordinal (DANCEY; REIDY; ROWE, 2017).

SAIBA MAIS

Para saber como é calculada manualmente a equação matemática do teste de Kruskal-Wallis, leia o capítulo 12 do livro:

BARROS et al. Análise de dados em saúde. 3. ed. Londrina-PR: Midiograf, 2012.

Considere uma situação na qual um professor pretende comparar o nível de conhecimento em bioestatística de estudantes do primeiro, segundo e terceiro anos de uma faculdade. Além de ter uma amostra reduzida, os dados apresentaram uma distribuição assimétrica, impossibilitando a aplicação da ANOVA 1 fator. Dessa forma, é necessário aplicar o teste não paramétrico de Kruskal-Wallis. As hipóteses estatísticas nula e alternativa são formuladas no mesmo raciocínio dos testes paramétricos, ficando da seguinte forma:

H\(_0\): os três grupos têm a mesma distribuição dos valores.
H\(_1\): os três grupos não têm a mesma distribuição dos valores.

SAIBA MAIS

Para ver como efetuar o teste não paramétrico de Kruskal-Wallis para comparar três ou mais grupos no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=LROp-jeaa7g>. Acesso em: 29 abr. 2019.

O teste de Friedman é utilizado nos casos em que os dados não atendem os pressupostos para a utilização da ANOVA de medidas repetidas. Este teste é uma extensão do teste de Wilcoxon, entretanto, analisa as diferenças entre os mesmos participantes ou o emparelhamento dos participantes em três ou mais condições (momentos). Assim como o teste de Kruskal-Wallis, o teste de Friedman não considera as distribuições dos valores, mas sim o posicionamento das observações em cada grupo, as quais são comparadas por meio da soma dos postos (DANCEY; REIDY; ROWE, 2017).

Considere uma situação na qual um professor pretende comparar o nível de conhecimento em bioestatística de uma amostra de estudantes de uma faculdade em três condições (momentos): começo do ano, meio do ano e fim do ano. Considerando que os dados não apresentaram distribuição normal, não é recomendada a aplicação da ANOVA de medidas repetidas, sendo necessária a utilização do teste não paramétrico de Friedman. As hipóteses estatísticas nula e alternativa são formuladas no mesmo raciocínio dos testes paramétricos, ficando da seguinte forma:

H\(_0\): as três condições têm a mesma distribuição dos valores.
H\(_1\): as três condições não têm a mesma distribuição dos valores.

SAIBA MAIS

Para ver como efetuar o teste não paramétrico de Friedman para comparar três ou mais momentos no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=MHLoWbQ09qQ>. Acesso em: 29 abr. 2019.

Alternativa à Correlação de Pearson

Em algumas situações não é recomendado empregar a correlação de Pearson, uma vez que podem levar a interpretações errôneas a respeito da relação entre as variáveis do conjunto de observações investigado (BARROS et al., 2012). As principais situações em que a correlação de Pearson (r) não deve ser empregada estão apontadas na Figura 1.

Figura 1 - Situações nas quais se deve evitar o uso da correlação de Pearson
Fonte: Elaborada pelo autor.

A Figura 2 ilustra as situações apontadas na Figura 1 no diagrama de dispersão para facilitar a compreensão das situações em que não se deve utilizar a correlação de Pearson.

Figura 2 - Diagramas que ilustram relação não linear (a), presença de valores extremos (b) e presença de subgrupos (c).
Fonte: Barros et al. (2012, p.187).

Nesses casos deve-se empregar a correlação de Spearman (p), que é o equivalente não paramétrico da correlação de Pearson (r). Embora ambos os testes sejam similares e interpretados de forma semelhante, a correlação de Spearman é uma medida de correlação não linear e deve ser empregada nas situações listadas na Figura 3.

Figura 3 - Situações nas quais se deve utilizar a correlação de Spearman
Fonte: Elaborada pelo autor.

O cálculo da correlação de Spearman é obtido por meio transformação dos escores brutos de uma variável, os quais devem ser substituídos pelo valor da sua posição (posto) no conjunto de dados. A mesma operação deve ser realizada com a outra variável. Em seguida, as mesmas operações matemáticas da correlação de Pearson devem ser empregadas para a correlação de Spearman (BARROS et al., 2012). Dessa forma, pode-se dizer que a correlação de Spearman é uma correlação linear entre os postos das duas variáveis.

As hipóteses estatísticas nula e alternativa da correlação de Spearman são formuladas no mesmo raciocínio da correlação de Pearson, ficando da seguinte forma:

H\(_0\): o coeficiente de correlação é igual a zero.
H\(_1\): o coeficiente de correlação é não igual a zero.

SAIBA MAIS

Para ver como efetuar a Correlação de Pearson (paramétrica) e Spearman (não paramétrica) para associar duas variáveis quantitativas no software SPSS, assista ao vídeo disponível em: <https://www.youtube.com/watch?v=9a1ova9v03Y&t=379s>. Acesso em: 29 abr. 2019.

Notas

Introdução

Estatística não Paramétrica

SAIBA MAIS

Alternativas não Paramétricas ao Teste t

SAIBA MAIS

SAIBA MAIS

SAIBA MAIS

Alternativas não Paramétricas à ANOVA

SAIBA MAIS

SAIBA MAIS

SAIBA MAIS

Alternativa à Correlação de Pearson

SAIBA MAIS

QUESTÃO OBJETIVA

QUESTÃO OBJETIVA

Fechamento

Atividade Complementar

Teoria e Prática

Estudo de caso

Vídeo