¿Por qué es importante el tamaño de muestra? ¿Qué factores lo determinan?

Se denomina tamaño de la muestra a la cantidad de observaciones que una muestra posee. El tamaño de muestra está claramente vinculado con el poder de un test estadístico para detectar una diferencia significativa entre dos parámetros, sean medias, proporciones, o medidas de asociación y efecto a las que nos referiremos en próximas entregas. Como dijimos, el poder es la capacidad de un test para encontrar una diferencia significativa (entendida como aquella que arroja al menos un valor de p

Lo ilustraremos con el ejemplo que dimos en una entrega anterior (ver “¿Cuál es la lógica que siguen los tests estadísticos?”) Se determina la creatinina de ingreso a Unidad Coronaria de pacientes con diferentes patologías. Entre los que ingresan por IAM la creatinina inicial es 1,18± 0,45 mg%. Entre los internados por insuficiencia cardíaca, de 1,35 ± 0,32 mg%. ¿Podemos afirmar que los pacientes con insuficiencia cardíaca tienen al ingreso mayor disfunción renal? ¿Es 1,35 mg% “peor” que 1,18mg %? ¿O ambos valores representan “lo mismo”?

Supongamos que el n de observaciones en cada uno de los dos grupos es 30. La utilización de un test estadístico que nos permite comparar medias (el llamado test de t) arrojará para la comparación de las medias citadas, con los correspondientes desvíos standard, un valor de p de 0.09. De acuerdo con los criterios usuales, diremos que no hay significación estadística en la diferencia. Sin embargo, el programa de estadística nos señala que el poder del test para encontrar una diferencia significativa (p<0.05) es, con estos datos, de solo 39%, lo cual implica un error beta de 61%. ¿Cuál es el n necesario para que la diferencia sea significativa con estos valores de media y desvío standard en cada grupo y un poder del 80%? Se requieren 83 observaciones por grupo.

Como corolario: el aumento del tamaño de la muestra aumenta el poder del test para encontrar una diferencia significativa.

Cuatro son los factores que influyen en el tamaño de muestra requerido para encontrar significación estadística:

a) la magnitud de la diferencia entre los parámetros que se comparan. Cuanto menor la diferencia, mayor el poder necesario para encontrar significación, y por ende mayor tamaño de muestra necesario. Por ejemplo, si las medias de ambos grupos fueran 1,18 y 1,25, con iguales desvíos standard en cada grupo a los ya presentados, un error alfa de 0.05 y un poder del 80%, el n necesario sería en cada grupo de 489!

b) la dispersión de los datos. Cuanta mayor dispersión (desvíos standard mayores), más fácil que haya superposición de valores entre las distribuciones de ambos grupos y más difícil entonces que la diferencia sea significativa. Por eso, con mayor dispersión, es necesario más tamaño de muestra para encontrar una diferencia significativa. Por ejemplo, si los desvíos standard en cada grupo fueran un 20% mayores a los presentados (0,54 y 0,38 respectivamente), con medias, error alfa y poder iguales a los ya descriptos, el n necesario en cada grupo sería de 119.

c) el error alfa, o valor de p que juzgamos necesario. Con los datos iniciales, manteniendo el poder en 80% pero trabajando con p= 0.01, hubieran sido necesarias 124 observaciones en cada grupo. Trabajar con mayos especificidad hace necesario un n mayor.

d) Por último, el poder. Si en vez de 80% hubiéramos pretendido 90% (error beta de 10%) hubieran sido necesarias 111 observaciones en cada grupo. Trabajar con mayor sensibilidad hace necesario un n mayor.

Como conclusión, diferentes factores hacen necesario un tamaño de muestra determinado para poder decir que no se ha podido rechazar la hipótesis nula, sin que ello se deba a una muestra insuficiente. Este error se comete muy frecuentemente en los análisis retrospectivos de bases de datos en los que se busca certificar un hallazgo determinado sin haber calculado a priori cuántas observaciones eran necesarias. Se suele concluir en “no hay diferencia…” o “no hay asociación…” cuando lo que no había era tamaño de muestra adecuado.

La determinación “a priori” del tamaño de muestra necesario es una condición esencial para no embarcarse en empresas de investigación irrealizables por no contar con el número necesario de observaciones, tiempo o recursos. Como lectores, debemos estar atentos a que se nos presente un cálculo de tamaño de muestra cuando se nos quiere convencer sobre la certeza de hallazgos negativos.

Dr. Jorge Thierer

 

INSCRIBITE A NUESTRO NEWSLETTER

SAC Móvil

¡Descarga nuestra aplicación para navegar nuestro contenido de una manera más fácil y dinámica!