Aula 01

Hipóteses Nula e Alternativa

A estatística inferencial permite ao pesquisador estabelecer inferências sobre uma população a partir dos dados da amostra. Para isso, é necessário testar quanta evidência estes dados demonstram contra uma suposição específica em relação a uma determinada variável. O processo para confirmar se as hipóteses formuladas a respeito dos dados são verdadeiras ou falsas é chamado de teste de hipóteses ou teste de significância.

SAIBA MAIS

Quando se fala em teste de hipóteses, é fundamental compreender o conceito de hipótese de pesquisa. A hipóteses se refere à previsão de como duas variáveis podem se relacionar entre si, ou como uma variável pode se comportar de forma diferente entre dois grupos.

Fonte: Dancey, Reidy e Rowe (2017).

De acordo com Barros et al. (2012), o teste de hipóteses ocorre por meio dos procedimentos apontados no Quadro 1:

Estabelecimento das hipóteses nula (H0) e alternativa (H1) da pesquisa.

Coleta dos dados do fenômeno investigado na amostra selecionada.

Cálculo do teste estatístico para a H0.

Comparação do valor do teste estatístico com os valores de uma distribuição de probabilidade já conhecida.

Compreensão do valor da significância (p).

Quadro 1 - Procedimentos para a realização dos testes de hipóteses
Fonte: Barros et al. (2012).

A hipótese nula (H\(_0\)) corresponde a uma afirmação conservadora a respeito do fenômeno que está sendo investigado, isto é, se uma variável está sendo comparada entre dois grupos, a H\(_0\) diz que não existe diferença entre os grupos em relação a esta variável (DANCEY; REIDY; ROWE, 2017). Ainda, na análise da relação entre duas variáveis independentes a H0 é de que não existe relação entre as variáveis. Vamos tomar como exemplo a comparação da média da idade entre homens e mulheres de uma empresa, na qual a H\(_0\) será de que não existe diferença na idade entre os homens e as mulheres da empresa.

Já a hipótese alternativa (H\(_1\)) é uma hipótese estabelecida como alternativa para a H\(_0\). Assim, a H\(_1\) sempre será de que existe diferença entre os grupos comparados ou de que existe relação entre duas variáveis analisadas. Isso acontece quando existe evidência suficiente de que a H\(_0\) não é verdadeira, a qual é rejeitada e a H\(_1\) se torna a resposta para o fenômeno que está sendo pesquisado (BARROS et al., 2012).

Para exemplificar as duas hipóteses, vamos considerar uma situação hipotética que pretende comprar as notas de uma prova de homens e mulheres. As hipóteses do estudos ficariam da seguinte forma:

Figura 1 - H\(_0\) e H\(_1\) da situação hipotética
Fonte: Elaborada pelo autor.

Pode-se dizer que os testes de hipóteses podem ser considerados como uma competição entre as hipóteses: a hipótese da pesquisa (H\(_1\) - existe diferença nas notas entre os homens e as mulheres) e a H\(_0\) (não existe diferença na nota entre os grupos). Se o pesquisador concluir que a hipótese nula deve ser rejeitada, pode-se dizer que a probabilidade de obter os resultados encontrados se a hipótese nula fosse verdadeira é tão pequena que é mais viável aceitar a hipótese alternativa. Logo, na situação hipotética da Figura 1, se a hipótese nula for rejeitada, isso significa que os dados evidenciaram diferença na nota da prova entre os homens e as mulheres

O teste estatístico utilizado é que determinará a probabilidade de observar o padrão dos dados se a hipótese nula for verdadeira. Nesse tipo de situação nunca se sabe se existem diferenças entre os grupos nem a distância entre as médias dos grupos. Com isso, as diferenças podem ocorrer em qualquer direção, isto é, tanto os homens quanto as mulheres podem ter maior nota na prova. Nessa perspectiva, a utilização de um teste bicaudal é importante, uma vez que analisa qualquer posição da curva de probabilidade (BARROS et al., 2012).

Nível de Significância

Após saber que o teste de hipóteses é o processo estatístico para descobrir se a hipótese nula é verdadeira ou falsa, um ponto fundamental é compreender a probabilidade que deve ser calculada no teste de hipótese para que se chegue à conclusão de que a hipótese nula deve ser rejeitada ou aceita. Para isso, os dados coletados das amostras são analisados por meio de equações matemáticas que fornecem o valor do teste estatístico e a probabilidade de a hipótese nula ser aceita ou rejeitada.

Após a determinação do valor do teste utilizado, este é comparado com uma distribuição teoricamente conhecida na população, a qual permite identificar o valor entre \(0~e~1\), que indica o valor exato da probabilidade de os resultados encontrados na amostra serem idênticas à distribuição da população (BARROS et al., 2012).

De acordo com Dancey, Reidy e Rowe (2017), não existe um valor definitivo para o cálculo dos testes de hipóteses, entretanto, existe um consenso na literatura científica que uma probabilidade de \(5%\) é suficientemente pequena para servir de ponto de corte. Isto significa que, se a hipótese nula for verdadeira, a probabilidade de um determinado efeito é menor do que \(5%\), ou seja, se a pesquisa for conduzida 20 vezes, somente uma vez uma diferença ou relacionamento tão grande quanto a que foi observada surgirá no caso de a hipótese nula for verdadeira. Essa probabilidade de corte associada aos testes estatísticos é denominada nível de significância e representada pelo alfa (\(\alpha \)).

SAIBA MAIS

Alfa (α) representa o critério de significância fixado nos testes estatísticos e se refere à probabilidade utilizada como ponto de corte em um teste de hipótese. Se o resultado do teste for abaixo desse ponto de corte, é possível assumir que o resultado é improvável para que a hipótese alternativa seja aceita, logo, a hipótese nula será verdadeira.

Fonte: Dancey, Reidy e Rowe (2017).

Atualmente, os pesquisadores frequentemente têm utilizado os termos significativo e não significativo ao realizar testes de hipóteses. Isso significa que, quando a hipótese nula é falsa e que a probabilidade de obter um efeito seja menor do que \(5%\), o resultado é considerado como significativo, enquanto que, nos casos em que a probabilidade for maior do que \(5%\), o resultado é considerado não significativo.

Quando se pretende relatar o valor exato da probabilidade de um teste estatístico, é utilizado o valor de \(p\), que é um valor entre \(0~e~1\), e deve sempre estar associado aos testes realizados. Considerando um nível de significância de \(5%\), se o valor de \(\rho \) for menor que \(5%\) \((p~

SAIBA MAIS

O valor de \(p~\)de um determinado teste estatístico corresponde à probabilidade exata de se encontrar a diferença observada ou uma diferença ainda maior quando a hipótese nula é verdadeira.

Fonte: Dancey, Reidy e Rowe (2017).

Barros et al. (2012) apontam quatro considerações importantes a respeito do valor de p:

Na área da saúde, um nível de significância de \(5%\) \((p~
Quanto menor o valor de p, maior a evidência para se rejeitar a hipótese nula.
Quando o valor de \(p\) é maior ou igual a \(0,05,\) não há evidência suficiente para rejeitar a hipótese nula.
Investigações que exigem evidências mais fortes e precisas dos resultados adotam um valor de \(p\) mais rigoroso, como \(1%~(\rho ~

Atenção

Embora se saiba que, quanto menor o valor de p, maior a evidência para se rejeitar a hipótese nula, deve-se tomar cuidado com a interpretação do valor de p, principalmente com a equiparação do nível de significância com o tamanho real do efeito experimental. Alguns estudantes podem associar o nível de significância com a força da relação entre duas variáveis, ou seja, dizer que, quanto menor o valor de p, maior a força a relação entre as variáveis. No entanto, esta afirmação é equivocada, visto que o nível de significância proporciona somente uma indicação da probabilidade de entrar o relacionamento entre as variáveis, por acaso, se a hipótese nula for verdadeira.

Fonte: Dancey, Reidy e Rowe (2017).

Para exemplificar a utilização do valor de \(p\) em um estudo, imagine que um pesquisador comparou a frequência cardíaca de dois grupos (homens e mulheres) após uma sessão de exercício físico de alta intensidade, verificando que a média da frequência cardíaca dos homens foi maior que a média da frequência cardíaca das mulheres. No entanto, após realizar o teste de hipótese adequado, o pesquisador encontrou um valor de \(p~=~0,25\). O que esse valor de p significa?

Este valor de p significa que a chance de essa diferença entre as médias ser devida ao acaso (e não uma diferença real entre os grupos) é de \(25%\), isto é, se o pesquisador afirmar que as diferenças entre as médias ocorreram por causa dos tratamentos, ele tem \(25%\) de chances de estar errado. Em outras palavras, podemos dizer que, se o pesquisador realizar a mesma comparação 100 vezes, ele irá encontrar resultados semelhantes em 75 experimentos.

Nesses casos, um erro que muitos pesquisadores cometem é realizar a seguinte inferência: “Embora não tenha sido encontrada diferença significativa entre os grupos \((p>0,05)\), a média da frequência cardíaca das mulheres foi \(10%\) superior à média da frequência cardíaca dos homens”. Este é um erro grave, pois o pesquisador tem \(25%\) de chances de que essa diferença de \(10%\) entre as médias não seja uma diferença real entre os sexos, e sim de outro fator que não está sendo estudado, sendo que o risco aceitável é de apenas \(5%\). Enfim, o pesquisador estará atribuindo aos sexos uma diferença que tem grandes chances de ser obra do acaso, de ser um falso-positivo.

SAIBA MAIS

Para saber mais sobre o valor de p e as compreensões importantes relacionadas a ele, leia o artigo de Ferreira e Patino O que realmente significa o valor-p?, disponível em: <https://bit.ly/2QjlGXC>. Acesso em: 23 maio 2019.

Erros ao Testar Hipóteses

Quando realizamos testes de hipóteses para estabelecer conclusões a respeito da H\(_0\), é importante lembrar que estas conclusões são obtidas a partir de uma amostra de informações, as quais podem conduzir aos erros nos testes de hipóteses. Os erros de hipóteses podem ser classificados como erro do tipo I e erro do tipo II (BARROS et al., 2012).

O erro do tipo I se refere à probabilidade de o teste estatístico demonstrar uma relação estatisticamente significativa quando na verdade ela não existe (ou que você rejeita a hipótese nula quando ela não deveria ser rejeitada). A probabilidade de este tipo de erro acontecer é chamada de alfa, que é o nível de significância do teste em que será rejeitada (\(p~

O erro do tipo II corresponde à probabilidade de o teste estatístico indicar que não existe diferença estatisticamente significativa quando, na verdade, essa diferença existe. Em outras palavras, é quando se aceita H\(_0\) quando esta é falsa, ou seja, conclui-se que não existe efeito quando, na verdade, existe. A probabilidade de ocorrência do erro do tipo II é denominada beta \(\left( \beta \right)\), que convencionalmente é estabelecida em \(20%~\left( 0,2 \right)\).

Este erro também ocorre em decorrência do poder do teste estatístico, o qual é obtido por meio do seguinte cálculo: \(1~-~\beta \). Em um teste perfeito não existe a possibilidade de o erro do tipo II acontecer, apresentando poder um poder de \(100%\), entretanto, sempre existe a possibilidade de este erro ocorrer. Por isso, um teste adequado deve apontar pelo menos \(80%\) de poder. Existem diversos fatores que influenciam o poder de um teste estatístico, sendo os principais citados no Quadro 2.

Tamanho da amostra	O poder do teste aumenta na medida em que o tamanho da amostra também aumenta. Amostras maiores sempre proporcionam maior chance de encontrar os efeitos de um teste, enquanto que em amostras menores estes efeitos são mais difíceis de serem encontrados.
Variabilidade dos dados	O poder do teste aumenta na mesma proporção que a variabilidade dos dados diminui. Por exemplo, quanto menor for o desvio-padrão dos dados, maior o poder do teste.
Nível de significância	Quanto maior o nível de significância, maior o poder do teste. Por exemplo: a possibilidade de observar um efeito real aumenta quando se adota um nível de significância menor que , em detrimento a um nível de .

Quadro 2 - Fatores que influenciam o poder de um teste
Fonte: Elaborado pelo autor.

O Quadro 3 apresenta os dois tipos de erro em relação à conclusão sobre a H\(_0\):

H₀	Conclusão sobre H₀
H₀	Rejeitar	Aceitar
Verdadeira	Erro do tipo I	Sem erro
Falsa	Sem erro	Erro do tipo II

Quadro 3 - Resumos dos erros do tipo I e II em relação à conclusão sobre H\(_0\)
Fonte: Adaptado de Barros et al. (2012).

SAIBA MAIS

Para saber mais sobre os erros do tipo I e tipo II dos testes estatísticos, assista ao vídeo disponível em: <https://bit.ly/2JC96m2>. Acesso em: 23 maio 2019.

Tipos de Variáveis e Análise Estatística

Dependendo da variável que for investigada, o teste de hipótese selecionado é diferente. Por exemplo: as variáveis quantitativas requerem testes estatísticos diferentes das variáveis qualitativas. Em relação aos dados quantitativos, serão abordadas nas próximas aulas as seguintes situações:

1 grupo comparado a um valor de referência;
2 grupos pareados ou dependentes que podem ser comparados;
3 ou mais grupos independentes que podem ser comparados;
2 variáveis que podem apresentar associação entre si.

QUESTÃO OBJETIVA

Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é verdadeira.

Justificativa da correta: os testes de hipóteses têm como objetivo determinar a probabilidade de observar o padrão dos dados se a hipótese nula for verdadeira.

Determinar a probabilidade de ocorrer os erros do tipo I e II.

Determinar a probabilidade de ocorrer os erros do tipo I e II -> o teste de hipótese não tem como objetivo determinar a probabilidade de ocorrer os erros, mas os erros influenciam a probabilidade de obter um efeito quando a hipótese nula é verdadeira.

Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é falsa.

Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é falsa -> quando a hipótese nula é verdadeira.

Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese alternativa é verdadeira.

Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese alternativa é verdadeira -> o teste de hipóteses determina a probabilidade do efeito a partir da hipótese nula, e não da hipótese alternativa.

Todas as alternativas estão corretas.

Todas as alternativas estão corretas -> alternativas 2, 3 e 4 estão erradas.

QUESTÃO OBJETIVA

Sabe-se que um nível de significância de 5% é suficiente para se rejeitar a hipótese nula e estabelecer que os resultados foram estatisticamente significativos a esse nível de significância. Mas, por qual motivo a maioria dos pesquisadores adota esse nível de significância?

É um ponto de corte tradicional utilizado na área da saúde e que representa um bom balanceamento entre os erros do tipo I e II.

Justificativa da correta: é um valor convencionalmente utilizado na área da saúde e equilibra as chances de ocorrer os erros do tipo I e II.

Os resultados significativos são obtidos mais facilmente.

Os resultados significativos são obtidos mais facilmente - > a chance de ter resultado significativo é de apenas 5%. Os resultados significativos são mais facilmente obtidos quando o nível de significância é maior (p = 0,10, por exemplo).

O nível de significância não influencia a análise dos dados.

O nível de significância não influencia a análise dos dados -> o nível de significância é o ponto de corte que determina a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é verdadeira.

Porque é um valor que representa todo o conjunto de dados.

Porque é um valor que representa todo o conjunto de dados -> o nível de significância é o ponto de corte que determina a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é verdadeira.

Nenhuma das alternativas anteriores.

Nenhuma das alternativas anteriores - > A alternativa “É um ponto de corte tradicional utilizado na área da saúde e que representa um bom balanceamento entre os erros do tipo I e II” está correta.

Notas

Introdução

Hipóteses Nula e Alternativa

SAIBA MAIS

Nível de Significância

SAIBA MAIS

SAIBA MAIS

Atenção

SAIBA MAIS

Erros ao Testar Hipóteses

SAIBA MAIS

Tipos de Variáveis e Análise Estatística

QUESTÃO OBJETIVA

QUESTÃO OBJETIVA

Fechamento

Vídeo