Pense no seguinte objetivo de uma pesquisa: comparar o nível de estresse de homens e mulheres que trabalham em uma empresa. Para se chegar à conclusão de que o nível de estresse é maior entre os homens ou entre as mulheres, é necessário comparar dois grupos extraídos da população e formular hipóteses a respeito da distribuição dos dados em comparação ao comportamento da população. Para isso, é preciso testar uma hipótese por meio de um teste estatístico, o qual, por sua vez, permite verificar se as hipóteses são verdadeiras ou falsas. A partir dos resultados do teste estatístico, as hipóteses são confirmadas ou rejeitadas e, consequentemente, sabe-se se existe alguma diferença no nível de estresse entre os homens e as mulheres. Este procedimento é fundamental para se chegar a alguma conclusão e para pautar as possíveis tomadas de decisão.
Ao final desta aula, você será capaz de:
A estatística inferencial permite ao pesquisador estabelecer inferências sobre uma população a partir dos dados da amostra. Para isso, é necessário testar quanta evidência estes dados demonstram contra uma suposição específica em relação a uma determinada variável. O processo para confirmar se as hipóteses formuladas a respeito dos dados são verdadeiras ou falsas é chamado de teste de hipóteses ou teste de significância.
Quando se fala em teste de hipóteses, é fundamental compreender o conceito de hipótese de pesquisa. A hipóteses se refere à previsão de como duas variáveis podem se relacionar entre si, ou como uma variável pode se comportar de forma diferente entre dois grupos.
Fonte: Dancey, Reidy e Rowe (2017).

De acordo com Barros et al. (2012), o teste de hipóteses ocorre por meio dos procedimentos apontados no Quadro 1:
Quadro 1 - Procedimentos para a realização dos testes de hipóteses
Fonte: Barros et al. (2012).
A hipótese nula (H\(_0\)) corresponde a uma afirmação conservadora a respeito do fenômeno que está sendo investigado, isto é, se uma variável está sendo comparada entre dois grupos, a H\(_0\) diz que não existe diferença entre os grupos em relação a esta variável (DANCEY; REIDY; ROWE, 2017). Ainda, na análise da relação entre duas variáveis independentes a H0 é de que não existe relação entre as variáveis. Vamos tomar como exemplo a comparação da média da idade entre homens e mulheres de uma empresa, na qual a H\(_0\) será de que não existe diferença na idade entre os homens e as mulheres da empresa.
Já a hipótese alternativa (H\(_1\)) é uma hipótese estabelecida como alternativa para a H\(_0\). Assim, a H\(_1\) sempre será de que existe diferença entre os grupos comparados ou de que existe relação entre duas variáveis analisadas. Isso acontece quando existe evidência suficiente de que a H\(_0\) não é verdadeira, a qual é rejeitada e a H\(_1\) se torna a resposta para o fenômeno que está sendo pesquisado (BARROS et al., 2012).
Para exemplificar as duas hipóteses, vamos considerar uma situação hipotética que pretende comprar as notas de uma prova de homens e mulheres. As hipóteses do estudos ficariam da seguinte forma:

Pode-se dizer que os testes de hipóteses podem ser considerados como uma competição entre as hipóteses: a hipótese da pesquisa (H\(_1\) - existe diferença nas notas entre os homens e as mulheres) e a H\(_0\) (não existe diferença na nota entre os grupos). Se o pesquisador concluir que a hipótese nula deve ser rejeitada, pode-se dizer que a probabilidade de obter os resultados encontrados se a hipótese nula fosse verdadeira é tão pequena que é mais viável aceitar a hipótese alternativa. Logo, na situação hipotética da Figura 1, se a hipótese nula for rejeitada, isso significa que os dados evidenciaram diferença na nota da prova entre os homens e as mulheres
O teste estatístico utilizado é que determinará a probabilidade de observar o padrão dos dados se a hipótese nula for verdadeira. Nesse tipo de situação nunca se sabe se existem diferenças entre os grupos nem a distância entre as médias dos grupos. Com isso, as diferenças podem ocorrer em qualquer direção, isto é, tanto os homens quanto as mulheres podem ter maior nota na prova. Nessa perspectiva, a utilização de um teste bicaudal é importante, uma vez que analisa qualquer posição da curva de probabilidade (BARROS et al., 2012).
Após saber que o teste de hipóteses é o processo estatístico para descobrir se a hipótese nula é verdadeira ou falsa, um ponto fundamental é compreender a probabilidade que deve ser calculada no teste de hipótese para que se chegue à conclusão de que a hipótese nula deve ser rejeitada ou aceita. Para isso, os dados coletados das amostras são analisados por meio de equações matemáticas que fornecem o valor do teste estatístico e a probabilidade de a hipótese nula ser aceita ou rejeitada.
Após a determinação do valor do teste utilizado, este é comparado com uma distribuição teoricamente conhecida na população, a qual permite identificar o valor entre \(0~e~1\), que indica o valor exato da probabilidade de os resultados encontrados na amostra serem idênticas à distribuição da população (BARROS et al., 2012).
De acordo com Dancey, Reidy e Rowe (2017), não existe um valor definitivo para o cálculo dos testes de hipóteses, entretanto, existe um consenso na literatura científica que uma probabilidade de \(5%\) é suficientemente pequena para servir de ponto de corte. Isto significa que, se a hipótese nula for verdadeira, a probabilidade de um determinado efeito é menor do que \(5%\), ou seja, se a pesquisa for conduzida 20 vezes, somente uma vez uma diferença ou relacionamento tão grande quanto a que foi observada surgirá no caso de a hipótese nula for verdadeira. Essa probabilidade de corte associada aos testes estatísticos é denominada nível de significância e representada pelo alfa (\(\alpha \)).
Alfa (α) representa o critério de significância fixado nos testes estatísticos e se refere à probabilidade utilizada como ponto de corte em um teste de hipótese. Se o resultado do teste for abaixo desse ponto de corte, é possível assumir que o resultado é improvável para que a hipótese alternativa seja aceita, logo, a hipótese nula será verdadeira.
Fonte: Dancey, Reidy e Rowe (2017).

Atualmente, os pesquisadores frequentemente têm utilizado os termos significativo e não significativo ao realizar testes de hipóteses. Isso significa que, quando a hipótese nula é falsa e que a probabilidade de obter um efeito seja menor do que \(5%\), o resultado é considerado como significativo, enquanto que, nos casos em que a probabilidade for maior do que \(5%\), o resultado é considerado não significativo.
Quando se pretende relatar o valor exato da probabilidade de um teste estatístico, é utilizado o valor de \(p\), que é um valor entre \(0~e~1\), e deve sempre estar associado aos testes realizados. Considerando um nível de significância de \(5%\), se o valor de \(\rho \) for menor que \(5%\) \((p~
O valor de \(p~\)de um determinado teste estatístico corresponde à probabilidade exata de se encontrar a diferença observada ou uma diferença ainda maior quando a hipótese nula é verdadeira.
Fonte: Dancey, Reidy e Rowe (2017).

Barros et al. (2012) apontam quatro considerações importantes a respeito do valor de p:
Embora se saiba que, quanto menor o valor de p, maior a evidência para se rejeitar a hipótese nula, deve-se tomar cuidado com a interpretação do valor de p, principalmente com a equiparação do nível de significância com o tamanho real do efeito experimental. Alguns estudantes podem associar o nível de significância com a força da relação entre duas variáveis, ou seja, dizer que, quanto menor o valor de p, maior a força a relação entre as variáveis. No entanto, esta afirmação é equivocada, visto que o nível de significância proporciona somente uma indicação da probabilidade de entrar o relacionamento entre as variáveis, por acaso, se a hipótese nula for verdadeira.
Fonte: Dancey, Reidy e Rowe (2017).

Para exemplificar a utilização do valor de \(p\) em um estudo, imagine que um pesquisador comparou a frequência cardíaca de dois grupos (homens e mulheres) após uma sessão de exercício físico de alta intensidade, verificando que a média da frequência cardíaca dos homens foi maior que a média da frequência cardíaca das mulheres. No entanto, após realizar o teste de hipótese adequado, o pesquisador encontrou um valor de \(p~=~0,25\). O que esse valor de p significa?
Este valor de p significa que a chance de essa diferença entre as médias ser devida ao acaso (e não uma diferença real entre os grupos) é de \(25%\), isto é, se o pesquisador afirmar que as diferenças entre as médias ocorreram por causa dos tratamentos, ele tem \(25%\) de chances de estar errado. Em outras palavras, podemos dizer que, se o pesquisador realizar a mesma comparação 100 vezes, ele irá encontrar resultados semelhantes em 75 experimentos.
Nesses casos, um erro que muitos pesquisadores cometem é realizar a seguinte inferência: “Embora não tenha sido encontrada diferença significativa entre os grupos \((p>0,05)\), a média da frequência cardíaca das mulheres foi \(10%\) superior à média da frequência cardíaca dos homens”. Este é um erro grave, pois o pesquisador tem \(25%\) de chances de que essa diferença de \(10%\) entre as médias não seja uma diferença real entre os sexos, e sim de outro fator que não está sendo estudado, sendo que o risco aceitável é de apenas \(5%\). Enfim, o pesquisador estará atribuindo aos sexos uma diferença que tem grandes chances de ser obra do acaso, de ser um falso-positivo.
Para saber mais sobre o valor de p e as compreensões importantes relacionadas a ele, leia o artigo de Ferreira e Patino O que realmente significa o valor-p?, disponível em: <https://bit.ly/2QjlGXC>. Acesso em: 23 maio 2019.

Quando realizamos testes de hipóteses para estabelecer conclusões a respeito da H\(_0\), é importante lembrar que estas conclusões são obtidas a partir de uma amostra de informações, as quais podem conduzir aos erros nos testes de hipóteses. Os erros de hipóteses podem ser classificados como erro do tipo I e erro do tipo II (BARROS et al., 2012).
O erro do tipo I se refere à probabilidade de o teste estatístico demonstrar uma relação estatisticamente significativa quando na verdade ela não existe (ou que você rejeita a hipótese nula quando ela não deveria ser rejeitada). A probabilidade de este tipo de erro acontecer é chamada de alfa, que é o nível de significância do teste em que será rejeitada (\(p~
O erro do tipo II corresponde à probabilidade de o teste estatístico indicar que não existe diferença estatisticamente significativa quando, na verdade, essa diferença existe. Em outras palavras, é quando se aceita H\(_0\) quando esta é falsa, ou seja, conclui-se que não existe efeito quando, na verdade, existe. A probabilidade de ocorrência do erro do tipo II é denominada beta \(\left( \beta \right)\), que convencionalmente é estabelecida em \(20%~\left( 0,2 \right)\).
Este erro também ocorre em decorrência do poder do teste estatístico, o qual é obtido por meio do seguinte cálculo: \(1~-~\beta \). Em um teste perfeito não existe a possibilidade de o erro do tipo II acontecer, apresentando poder um poder de \(100%\), entretanto, sempre existe a possibilidade de este erro ocorrer. Por isso, um teste adequado deve apontar pelo menos \(80%\) de poder. Existem diversos fatores que influenciam o poder de um teste estatístico, sendo os principais citados no Quadro 2.
Quadro 2 - Fatores que influenciam o poder de um teste
Fonte: Elaborado pelo autor.
O Quadro 3 apresenta os dois tipos de erro em relação à conclusão sobre a H\(_0\):
Quadro 3 - Resumos dos erros do tipo I e II em relação à conclusão sobre H\(_0\)
Fonte: Adaptado de Barros et al. (2012).
Para saber mais sobre os erros do tipo I e tipo II dos testes estatísticos, assista ao vídeo disponível em: <https://bit.ly/2JC96m2>. Acesso em: 23 maio 2019.

Dependendo da variável que for investigada, o teste de hipótese selecionado é diferente. Por exemplo: as variáveis quantitativas requerem testes estatísticos diferentes das variáveis qualitativas. Em relação aos dados quantitativos, serão abordadas nas próximas aulas as seguintes situações:
A estatística inferencial permite ao pesquisador estabelecer inferências sobre uma população a partir dos dados da amostra. Para isso, é necessário testar quanta evidência estes dados demonstram contra uma suposição específica em relação a uma determinada variável. O processo para confirmar se as hipóteses formuladas a respeito dos dados são verdadeiras ou falsas é chamado de teste de hipóteses. Qual é o raciocínio dos testes de hipóteses?
Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é verdadeira.
Justificativa da correta: os testes de hipóteses têm como objetivo determinar a probabilidade de observar o padrão dos dados se a hipótese nula for verdadeira.
Determinar a probabilidade de ocorrer os erros do tipo I e II.
Determinar a probabilidade de ocorrer os erros do tipo I e II -> o teste de hipótese não tem como objetivo determinar a probabilidade de ocorrer os erros, mas os erros influenciam a probabilidade de obter um efeito quando a hipótese nula é verdadeira.
Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é falsa.
Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é falsa -> quando a hipótese nula é verdadeira.
Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese alternativa é verdadeira.
Determinar a probabilidade de obter um efeito devido ao erro amostral quando a hipótese alternativa é verdadeira -> o teste de hipóteses determina a probabilidade do efeito a partir da hipótese nula, e não da hipótese alternativa.
Todas as alternativas estão corretas.
Todas as alternativas estão corretas -> alternativas 2, 3 e 4 estão erradas.
Sabe-se que um nível de significância de 5% é suficiente para se rejeitar a hipótese nula e estabelecer que os resultados foram estatisticamente significativos a esse nível de significância. Mas, por qual motivo a maioria dos pesquisadores adota esse nível de significância?
É um ponto de corte tradicional utilizado na área da saúde e que representa um bom balanceamento entre os erros do tipo I e II.
Justificativa da correta: é um valor convencionalmente utilizado na área da saúde e equilibra as chances de ocorrer os erros do tipo I e II.
Os resultados significativos são obtidos mais facilmente.
Os resultados significativos são obtidos mais facilmente - > a chance de ter resultado significativo é de apenas 5%. Os resultados significativos são mais facilmente obtidos quando o nível de significância é maior (p = 0,10, por exemplo).
O nível de significância não influencia a análise dos dados.
O nível de significância não influencia a análise dos dados -> o nível de significância é o ponto de corte que determina a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é verdadeira.
Porque é um valor que representa todo o conjunto de dados.
Porque é um valor que representa todo o conjunto de dados -> o nível de significância é o ponto de corte que determina a probabilidade de obter um efeito devido ao erro amostral quando a hipótese nula é verdadeira.
Nenhuma das alternativas anteriores.
Nenhuma das alternativas anteriores - > A alternativa “É um ponto de corte tradicional utilizado na área da saúde e que representa um bom balanceamento entre os erros do tipo I e II” está correta.
Nesta aula vimos os principais conceitos e pressupostos relacionados aos testes de hipóteses e que serão fundamentais para os testes mais específicos que serão apresentados nas próximas aulas desta Unidade. Especificamente, vimos os seguintes aspectos: compreendemos o raciocínio lógico dos testes de hipóteses e da significância estatística; diferenciamos as hipóteses nula e alternativa; compreendemos a interpretação do valor de p para verificar a probabilidade de que o efeito em uma investigação ocorra devido ao erro amostral se a hipótese nula é verdadeira; reconhecemos os erros do tipo I e tipo II e como eles interferem no teste de significância. Além disso, vimos que os testes de significância possuem limitações que devem ser levadas em consideração no momento de estabelecer conclusões a respeito de um fenômeno investigado.
Nesta aula, você teve a oportunidade de:
Aula Concluída!
Avançar