Aqui, refletiremos sobre este ramo da Estatística que tem como objetivo estudar generalizações sobre uma população através de evidências fornecidas por uma amostra retirada desta população.


A estatística é um elemento de todas as pesquisas clínicas sempre que forem feitas inferências sobre a população com base nas informações obtidas de amostras. Não se pode esperar que uma única observação ou poucas observações representem a população, uma vez que é sabido que existe uma variação associada a cada observação. À medida que o número de observações cresce, temos mais informações sobre a população e assim, contemplamos a variação associada ao dado. Dessa forma, os testes estatísticos permitem verificar hipóteses a respeito da população com um erro associado.

A primeira etapa da análise dos dados envolve a estatística descritiva que representa a descrição das informações contidas nos dados de forma resumida e organizada (para maiores informações ler dica publicada anteriormente). Após a realização desta estatística inicial é realizada a estatística inferencial que permite tirar conclusões sobre as características da população. Esta consiste em selecionar um modelo estatístico que gera os dados para posteriormente deduzir as proposições a partir do modelo. As principais abordagens utilizadas para deduzir essas proposições são realizadas através do teste de hipótese ou estimativa.

A primeira, questiona se um efeito (diferença) está ou não presente, utilizando testes estatísticos para examinar a hipótese nula de que não existe diferença entre as comparações. Essa é a forma tradicional de avaliar o papel do acaso e está associada aos “valores P”. A outra abordagem, denominada estimativa, utiliza métodos estatísticos para estimar a faixa de valores que provavelmente inclui o valor verdadeiro.

Normalmente, as principais conclusões de um ensaio clínico são expressas em termos dicotômicos, como se um novo tratamento é melhor ou não do que o cuidado habitual, e se os resultados são ou não “estatisticamente significativos” (pouco prováveis de decorrerem meramente em função do acaso). Existem quatro possibilidades de relação entre as conclusões estatísticas e os fatos da realidade. Duas dessas quatro possibilidades levam a conclusões corretas: o novo tratamento realmente é melhor e esta é a conclusão do estudo; e os tratamentos realmente apresentam efeitos semelhantes e o estudo conclui que a diferença é improvável.

Existem também duas formas de os resultados estarem errados. O novo tratamento e o costumeiro podem apresentar efeitos semelhantes, mas a conclusão do estudo é que o novo tratamento é mais eficaz. Um erro desse tipo, resulta em uma conclusão “falso-positiva”, chamado de erro do Tipo I ou alpha, ou seja, a probabilidade de dizer que há diferença nos efeitos do tratamento quando, na verdade, não há. Por outro lado, o novo tratamento pode ser mais eficaz, mas o estudo pode concluir que não. Essa conclusão “falso-negativa” chama-se erro do tipo II ou beta, ou seja, a probabilidade de dizer que não há diferença nos efeitos do tratamento quando, na verdade, há.

Não é possível minimizar ambos os erros simultaneamente. Dessa forma, os testes de hipóteses são montados de forma que, fixado o erro tipo I que se está disposto a cometer (normalmente estipulado em 5 % ou também conhecido como P≤0,05), o erro tipo II seja o menor. O que é testado é a hipótese nula, a proposição de que não há diferença verdadeira no desfecho entre os grupos de tratamento. Ao final, rejeita-se a hipótese nula (concluindo que há diferença) ou não (concluindo que não há evidências suficientes para apoiar uma diferença).

A escolha do teste estatístico que será aplicado vai depender de diversos fatores como, por exemplo, do tipo de variável e da sua distribuição, da quantidade de grupos comparados e se estes são ou não dependentes entre si. Este utiliza o teste de hipótese como forma de apresentação dos resultados e são utilizados para estimar a probabilidade de um erro do tipo I. Por outro lado, a estatística sumária vem ganhando maior ênfase nas pesquisas clínicas.

Neste sentido, imagine em uma situação hipotética que um ensaio clínico randomizado apresentou como resultado que “o risco relativo da droga em relação ao placebo foi 0,78”, este número é a estimativa-ponto. Esta é a melhor estimativa da magnitude real do efeito. Porém, devido à variação aleatória, qualquer estudo poderia encontrar um resultado maior ou menor do que o valor verdadeiro. Ou seja, se um novo estudo com as mesmas características fosse realizado novamente, seria pouco provável que a estimativa-ponto fosse exatamente igual ao estudo anterior.

Portanto, é necessária uma medida sumária para a precisão estatística da estimativa-ponto, isto é, uma faixa de valores possíveis para a magnitude real do efeito. A precisão estatística é expressa como um intervalo de confiança (IC) em torno da estimativa-ponto, geralmente estipulado em 95%. O intervalo de confiança de 95% significa que o resultado estará dentro daquele intervalo em 95 dos 100 estudos hipoteticamente realizados, ou seja, no exemplo apresentado anteriormente o risco relativo poderia estar, por exemplo, entre 0,68 e 0,88. O valor de 0,78 é uma medida central, mais próxima da verdade, porém não há garantia de que seja exatamente isso. A garantia é de que o risco relativo não está acima de 0,88, nem abaixo de 0,68. Quanto mais estreito o intervalo de confiança, mais precisa é a estimativa.

Os IC contêm a mesma informação que a significância estatística. Se o valor correspondente a “nenhum efeito” (isto é, um risco relativo de 1 ou uma diferença no tratamento de 0) ficar fora dos IC de 95% para o efeito observado, os resultados são estatisticamente significativos no nível de 0,05, ou seja, rejeita-se a hipótese nula. Se os IC incluírem esses pontos, os resultados não são estatisticamente significativos, ou seja, não se rejeita a hipótese nula. Como pode ser observado no exemplo anterior tanto a estimativa-ponto como os IC não incluíram o risco relativo de 1, indicando diminuição significativa do risco relativo a favor da droga utilizada.

Resumindo, a inferência estatística é feita quando se estabelecem conclusões para a população com base nos dados de uma amostra e no resultado de um teste estatístico. Os IC passaram a ser a forma habitual de relatar os principais resultados dos testes estatísticos em pesquisas clínicas devido às vantagens sobre a abordagem que utiliza o teste de hipótese. Por outro lado, os valores P ainda são utilizados devido à tradição e porque são convenientes quando há relato de muitos resultados e não é viável incluir os IC de todas as variáveis estudadas.


Referência:
Fletcher RH, Fletcher SW. Epidemiologia clínica – elementos essenciais. 4. ed. Porto Alegre: Artmed Editora, 2006.



Por Tainah de Paula
Consultora – CAPCS-UERJ