Nesta secção, faremos uma breve reflexão a respeito da escolha do teste t para amostras pareadas, teste t para amostras independentes, teste de Wilcoxon, teste de Mann-Whitney, teste Qui-quadrado e de McNemar.


Na dica anterior, abordamos o tópico sobre inferência estatística e esta pode ser entendida como um método de análise que permite tirar conclusões a respeito das características de uma população. Para isso, é necessário selecionar um modelo estatístico para posteriormente deduzir as proposições a partir do modelo.

Na área da saúde, é muito comum a utilização de comparações entre dois momentos diferentes ou entre dois grupos. Quando estamos diante dessa situação, iremos utilizar o teste t pareado ou o teste t para amostras independentes. Na presença de amostras dependentes, os estudos consistem em realizar mais de uma medida em uma mesma unidade amostral e verificar se houve diferença entre essas medidas, onde a primeira informação será pareada com a segunda informação, com a terceira e assim por diante.

Suponha um estudo onde um grupo de indivíduos foi submetido a uma dieta e deseja-se verificar se houve diferença entre o peso antes e depois da dieta. Nesse caso, como a variável peso é numérica e na presença de distribuição normal dos dados, como o objetivo é verificar se existe diferença significativa dessa variável entre dois grupos de interesse, deve-se utilizar o teste t para amostras pareadas. Agora, caso o estudo tenha utilizado indivíduos com perfis de saúde distintos e aplicado uma mesma dieta para verificar quem se beneficiou mais (exemplo: indivíduos eutróficos e com obesidade), reparem que continuaríamos com dois momentos/ grupos de análise, porém com amostras diferentes. Neste caso, deve-se utilizar o teste t para amostras independentes.

Resumindo, o teste t deve ser utilizado na presença de distribuição normal dos dados, quando se objetiva comparar dois momentos/ grupos para uma variável numérica. De forma que ambos os testes são considerados paramétricos. Dentre os principais testes disponíveis para se testar a normalidade dos dados na maioria dos softwares estatísticos, podemos citar o teste de Shapiro-Wilk e o de Kolmogorov-Smirnov. Já os testes de Wilcoxon e Mann-Whitney se apresentam como alternativas ao teste t pareado e o teste t para amostras independentes, respectivamente. Estes são utilizados nas mesmas situações descritas anteriormente, porém na presença de distribuição não normal dos dados. De forma que ambos os testes são caracterizados como testes não-paramétricos.

Por fim, quando a variável de interesse não é numérica (exemplo: variáveis categóricas do tipo sim e não), deve-se utilizar o teste Qui-Quadrado para amostras independentes e o de McNemar para amostras dependentes. Para melhor entender, suponha agora um estudo onde cães diagnosticados com leishmaniose foram divididos em dois grupos: sintomáticos e assintomáticos. Ambos os grupos são submetidos a um tratamento e depois de 3 meses do início do tratamento eles são reavaliados. Nesse caso, temos que a variável de interesse é categórica com duas categorias, sendo medida duas vezes. O objetivo é verificar se houve diferença significativa entre as classificações nas duas medições em cada um dos grupos separadamente. Como são os mesmos grupos (cães) a serem avaliados em dois momentos diferentes, deve-se optar pelo teste de McNemar. Reparem que por se tratar de uma variável categórica, não há a verificação de normalidade dos dados, devendo só se ater se as amostras são ou não dependentes entre si!


Referência

Oliveira, Bruno. Testes estatísticos para amostras pareadas. 23 de outubro de 2019. Disponível em: <https://operdata.com.br/blog/testes-estatisticos-para-amostras-pareadas/>. Acesso em: 09 de janeiro de 2020.



Por Tainah de Paula
Consultora – CAPCS-UERJ