e de quebra uma análise sobre tamanho de amostra versus PODER do estudo
.
A ressaca é pior se a sequência é vinho ➡ cerveja ou se cerveja ➡ vinho? Saiu publicado esse ano um estudo que investigou exatamente isso. [1]
Voluntários saudáveis foram randomizados para dois grupos:
1. Bebia-se primeiro vinho ➡ cerveja ou
2. Bebia-se primeiro cerveja ➡ vinho
Os dois grupos foram avaliados até atingir um limite de alcoolemia medido por bafômetro (BrAC: breath alcohol concentration). Questionário de sintomas relacionados a ressaca (AHS: acute hangover scale) foi aplicado em seguida. Após 1 semana os grupos inverteram a ordem das bebidas e novamente o AHS foi aplicado. Não se observou diferença em ressaca se começava com vinho ou com cerveja! Mas e aí isso é certeza de que não há uma diferença entre os grupos? Pode ser que estejamos diante de um estudo sem poder para detectar as diferenças e poder tem tudo a ver com tamanho amostral.
Determinar o tamanho ideal da amostra para um estudo garante um PODER adequado para detectar significância estatística. Por isso, é um passo crítico no desenho de um protocolo de pesquisa planejado. Usar muitos participantes em um estudo é caro e expõe mais pessoas ao procedimento. Por outro lado, se o estudo for fraco, ele será estatisticamente inconclusivo e poderá tornar todo o protocolo um fracasso [2].
Comentário metodológico: Teria vários para fazer mas vou escolher um relacionado ao resultado negativo desse estudo ( resultado negativo = não se detectou diferença entre os grupos). Quando se vê um resultado desse tipo onde "não foi observada diferença entre os grupos" a tendência automática é assumir que NÃO EXISTE diferença entre os grupos. No entanto, não necessariamente significam a mesma coisa. Se a diferença de efeito entre os grupos for pequena, pode ser que o seu experimento (estudo) não teve PODER para detectar uma diferença que existe sim!
Nesse estudo, com um tamanho amostral de 31 voluntários por grupo o estudo tinha capacidade de 80% (poder) de detectar uma diferença de 14% (ou mais) no questionário de ressaca (AHS). O design crossover aumenta o poder com um n menor porque reduz a variabilidade já que individuos são os mesmos em momentos de diferentes intervençoes. Quer dizer, se essa diferença for menor que 14% esse estudo não tem poder suficiente para detecta-la. Outro ponto é que mesmo que a diferença entre os grupos seja 14% ou mais, esse estudo "só tem" 80% de poder, não 100%, ou seja mesmo assim, ainda pode haver diferença entre os grupos que não foi detectada! Quer dizer: a ausência de evidência não é evidência da ausência!
Quer ler mais sobre tamanho da amostra e poder? Dá um google em: sample size estimation + power analysis + Suresh KP + 2012 que voce vai encontrar esse artigo aqui, muito bom: PMID: 22870008
Referências:
1. Jöran Köchling, Berit Geis, Stefan Wirth, Kai O Hensel, Grape or grain but never the twain? A randomized controlled multiarm matched-triplet crossover trial of beer and wine, The American Journal of Clinical Nutrition, Volume 109, Issue 2, February 2019, Pages 345–352, https://doi.org/10.1093/ajcn/nqy3092.
2. Suresh K, Chandrashekara S. Sample size estimation and power analysis for clinical research studies. J Hum Reprod Sci. 2012;5(1):7-13.
Declaração de conflito de interesse: nenhum
Projeto Respira Evidência por Leticia Kawano Dourado
Comentários são bem-vindos!
Comments