Estadistica Numero de Pruebas
Estadistica Numero de Pruebas
Estadistica Numero de Pruebas
médica
Correspondencia: José Antonio García García. Dr. Balmis N° 148, Colonia Doctores, Delegación Cuauhtémoc, C.P. 06726, México
D.F., México. Teléfonos: 5004 3842, 5004 3843. Conmutador: 2789 2000, ext. 1164. Correo electrónico:
[email protected]
ISSN en trámite - see front matter © 2013 Facultad de Medicina Universidad Nacional Autónoma de México. Publicado por Elsevier México. Todos los derechos reservados.
218 García-García JA et
al
know how many individuals it is necessary to study in order to estimate a parameter with
the desired degree of confidence, or the number needed in order to detect a certain
difference between the study groups, assuming that exist actually.
The calculation of the sample size is a mathematical function that expresses the
relationship between the variables, amount of participants and statistical power.
A sample from a study should be representative of the population of interest. The main goal
of selecting a sample is to make statistical inferences about the population from which
comes from. The selection must be probabilistic.
Statistical factors that determine the sample size are: assumptions, error alpha, beta error,
statistical power, and variability, losses in the study and size effect.
We review the formulas used for calculating the sample size in the most common situations
in research, as well as the revision of formulas for a faster calculation.
It´s included examples of research in medical education.
Also reviewed are important issues such as: sample size for pilot studies, strategies to
reduce the required number of subjects, and software for the sample size calculation.
Preámbulo
Groso modo, puede considerarse que el objetivo de una
investigación puede ser:
1. Estimación de un parámetro. se pretende hacer inferencias
a valores poblacionales (medias, pro- porciones), a partir
de los resultados en una mues- tra. Por ejemplo, el
porcentaje de estudiantes de pregrado con obesidad o el de
alumnos que son aceptados para hacer una residencia
médica.
2. Contraste de hipótesis. Aquí se tiene como pro- pósito
comparar si las medidas (medias, propor- ciones) de las
muestras son diferentes. Por ejem- plo, evaluar qué
intervención educativa consigue un mayor porcentaje de
éxitos.1,2
Prueba t muestras independientes: cálculo del tamaño de muestra Comparación de 2 proporciones: cálculo del tamaño de muestra
Dos medias: prueba t, muestras independientes (H0: 1 = 2 Dos proporciones: prueba Z (H0: Pi1 = Pi2)
n vs. poder (alfa= 0.05) n vs. poder (alfa= 0.05)
350 50
45
Tamaño de la muestra requerido
300
150 *
30
25
*
(n)
(n)
100 20
0.6 0.7 0.8 0.9 1.0 0.70 0.75 0.80 0.85 0.90 0.95 1.00
Poder estadístico Poder estadístico
Figura 1. Representación gráfica de la función para el cálculo del tamaño de la muestra, tanto para comparar dos medias como dos
pro- porciones. En el eje de las ordenadas se muestra el número de integrantes de la muestra y en el eje de las abscisas el poder
estadístico. La función está representada por la línea, y el asterisco sobre ella representa el valor resultante de la fórmula
matemática correspondiente, obteniendo así el tamaño de la muestra para un poder estadístico del 80%, que es utilizado
habitualmente.
del protocolo, como para el desarrollo de las población es la que se desea investigar y se le denomi-
diferentes fases de la investigación. en este orden de na población de interés, blanco, objeto o diana. Para que
ideas, es exi- gible la misma severidad para estimar el la extrapolación (inferencia estadística) tenga validez, la
tamaño de la muestra en investigación en educación muestra debe ser representativa, y alude a que el
médica, que en otras áreas del conocimiento.5 lo estima- dor muestral de las variables de interés debe
anterior aplica para la mayoría de los estudios tener una distribución similar a las de la población de
contenidos en la brújula o compás de la investigación dónde pro- viene. Para cumplir este supuesto de
en educación médica.6 representatividad es deseable que la muestra sea
probabilística (Figura 2).8 Abraham Flexner, en su
¿En dónde se anota el desarrollo del cálculo trascendental documento, in- cluyó al 100% de la
población diana que fueron todas las escuelas de
del tamaño de la muestra? medicina de estados unidos de Norteamérica y Canadá.
los sitios en donde se desglosa este proceso son: el La muestra fue igual en número a la población,
proto- colo de la investigación, también aparece en las un hecho muy difícil de emular.9
tesis de Maestrías y Doctorados en Ciencias Médicas y de un aspecto diferente de muestreo es el caso de los
la salud y eventualmente en las de licenciatura. Pero no estudios para determinar la eficacia y seguridad de algún
aparece en los artículos publicados, se da como un valor medicamento, comparado con los tratamientos estánda-
entendido que se realizó con rigor metodológico. Lo que res o contra placebo. en ellos, el interés reside en con-
aparece en los artículos científicos es la muestra en el trastar hipótesis sobre una intervención (tratamiento o
estudio, pero no las variables y sus valores que se maniobra) que interesa al investigador. en este caso, el
consideraron para la estimación del número. muestreo suele ser a conveniencia.10
este artículo se enfoca en el diseño y la
Aspectos básicos en el proceso de muestreo. determinación del tamaño de la muestra para obtener
representatividad o validez externa en las conclusiones.
De población a muestra y viceversa
Población (cantidad representada en las fórmulas como
Muestras y proceso de aleatorización en los
N), es el conjunto total de elementos del que se puede
seleccionar la muestra y está conformado por elementos estudios
denominados unidades de muestreo o unidades muestra- Una vez que los sujetos de estudio son seleccionados, se
les, con cierta ubicación en espacio y tiempo. las uni- hace una aleatorización para asignar la intervención que
dades de muestreo pueden ser individuos, familias, recibirá cada uno. en este caso es adecuado que la
univer- sidades, grupos de alumnos, profesores, etc. una aleato- rización se haga por bloques. Si el investigador
muestra (cantidad representada en las fórmulas como n), conoce de antemano la existencia de factores que
no es más que un subconjunto de la población que se modifican la va- riable dependiente, es recomendable
obtiene por un proceso o estrategia de muestreo.4,7 hacer estratos para controlar a la variable confusora,
el objetivo fundamental para seleccionar una que es una variable pre- dictora del cambio en la
muestra es hacer inferencias estadísticas (estimaciones variable dependiente, externa a la relación principal que
de uno o más parámetros acerca de una población de se analiza pero simultáneamente relacionada con la
interés). esta
Cálculo del tamaño de la 221
muestra
variable independiente. Cada estrato
222 García-García JA et
al
en dos grupos balanceados; es decir, con el mismo nú- normal para Z (2
colas) o para Z (1 cola).2,14
mero de participantes. Como variables dependientes se
midieron las actitudes, conocimientos y habilidades 2. Error tipo I o error
auto- reportadas, en ambos grupos.12
en un contraste de hipótesis, al valor (error tipo i) se
le conoce como la probabilidad de que se rechace H 0 (se
Factores para la determinación del tamaño acepte H1) cuando H0 es cierta. es decir, P(aceptar H1 |
de la muestra H0 es cierta) = . Al valor (1 – )*100 se le conoce como
el nivel de confianza de la prueba. El valor de varía
los factores que condicionan el tamaño de muestra, son
dependiendo del nivel de confianza que se quiera de la
de orden logístico o estadístico. entre los primeros se
prueba; el criterio más usado en la literatura biomédica
en- cuentran las limitantes financieras o la disponibilidad
es aceptar un riesgo de < 0.05.4,15
de participantes. los siguientes son los factores de orden
es- tadístico que se desglosarán a continuación:8
1. Hipótesis.
2. error tipo i o error . 3. Error tipo II o error
3. error tipo ii o error . A la probabilidad de que se acepte H0 cuando ésta es
4. Poder estadístico. falsa (H1 es cierta), se le conoce como error tipo ii o
5. variabilidad. error , es decir: P(aceptar H0 | H1 es cierta) = . el
valor de
Realidad en la población
Existen diferencias (H0 falsa) No existen diferencias (H0 cierta)
Hay diferencia significativa
Correcto Error tipo I ()
Resultado de la (se rechaza H0)
investigación No hay diferencia significativa
Error tipo II () Correcto
(se acepta H0)
Cálculo del tamaño de la 223
muestra
proporción de pérdi- das esperadas.2
Tabla 2. Valores frecuentemente utilizados de la distribución
normal para Z.
Z (2 colas) Z (1 cola)
/2
4. Poder estadístico
es la probabilidad de que un estudio de un determinado
tamaño detecte como estadísticamente significativa una
diferencia que realmente existe.
Se define como 1 - . es decir, P(aceptar H1 | H1 es
cierta) = 1 -
su valor depende del error tipo ii que se acepte. si
= 0.2, se tendrá una potencia de 1 - = 0.8. en términos
porcentuales se dice que la prueba tiene una potencia
del 80%, que es el mínimo aceptado en la literatura bio-
médica.
Cuanto menores sean los riesgos calculados para los
errores alfa y beta, mayor será el tamaño muestral re-
querido. Cuanto menor sea la variabilidad, menor será la
muestra estimada. A menor diferencia que se desea de-
tectar, mayor será el número de participantes. 2,16
5. Variabilidad
Es la dispersión esperada de los datos. Se evalúa depen-
diendo de la variable de interés. si éstas son numéricas
continuas (grupo de valores infinitos que incluyen deci-
males), el tamaño de muestra estará determinado por la
variable con el mayor coeficiente de variación (CV) [CV
— —
( Y) = Y(S /Y )], donde S es la desviación estándar y
— Y
Y es
la media. Por otra parte, cuando las variables de interés
son categóricas, por convención se recomienda utilizar la
estimación de la proporción que más se acerque a 0.5,
ya que proporciona el mayor número muestral. Para
deter- minar la variabilidad se debe recurrir a la
literatura pu- blicada de la variable de interés, cuando
el dato no está disponible se usarán datos de pruebas
piloto y en última instancia a estimaciones hechas por
expertos.8,17
sin embargo, existen herramientas estadísticas para ana- grupo con una intervención alternativa, D=(Mc-Me), Mc es
lizar los datos cuando ese supuesto no se cumple. la media del primer grupo y Me es la media del segundo,
S2 es la varianza de ambas distribuciones, que se suponen
1. Cálculo del tamaño de muestra de una iguales, Zes el valor del eje de las abscisas de la función
normal estándar en dónde se acumula la probabilidad de
me- dia (1-). esta fórmula para estimar nc = ne se emplea cuando
El intervalo de confianza para estimar la media pobla- se trata de un contraste de hipótesis bilateral; en caso
cional a partir de una muestra es el siguiente: IC y , de un contraste unilateral, se sustituirá Z por Z .2,10
/2
donde y es la media estimada a partir de la muestra,
s n
blación, p es la proporción estimada del parámetro po- 6. Cálculo para estimar el tamaño de
muestra de la diferencia de dos
blacional y Z es el valor del eje de las abscisas de
2 proporciones p1(1 p1) p2 (1 p2 )
la fórmula es: n n * Z Z , don- 2
2 2
la función normal estándar, en donde se acumula la pro- p
c e
2
p1
babilidad de (1-). el error absoluto () se obtiene de de p1 es la proporción del primer grupo y p2 es la pro-
una muestra piloto o estudios previos. si no puede porción del segundo grupo a comparar y (p1-p2) es la
determi- narse esta proporción, se tomará a p= 0.5, diferencia de las proporciones entre ambos grupos,
porque este Z/2 es el valor del eje de las abscisas de la función
valor garantizará el mayor tamaño de muestra. El nivel
de
confianza (1-)*100 que suele utilizarse en estas pruebas normal estándar en donde se acumula la probabili-
por lo general es del 95%. El intervalo de confianza para dad de (1-) para un contraste de hipótesis bilateral y
una proporción queda definido de la siguiente manera Z es el valor del eje de las abscisas de la función nor-
mal estándar, en donde se acumula la probabilidad de
IC p p Z 2 * (1-).2 un ejemplo es el Reporte Nacional del estatus
p 1 p .10,19
n de la educación Médica en euA.20
11. Box Ge, Hunter Js, Hunter WG. estadística para investigadores.
Diseño, innovación y descubrimiento. 2ª edición. españa: edito- José Antonio García-García, Arturo Reding-
rial Reverté; 2008. p. 133-172.
12. Sánchez-Mendiola M, Kieffer-Escobar LF, Marín-Beltrán S, et al.
Bernal, Juan Carlos López-Alvarenga
Teaching of evidence-based medicine to medical students in
Mexico: a randomized controlled trial. BMC Med Educ 2012;12: Departamento de Bioestadística y Bioinformática,
107. Dirección de Investigación, Hospital General de
13. Landero HR, González RMT. Estadística con SPSS y metodología México “Dr. Eduardo Liceaga”, México D.F., México.
de la investigación. México: Trillas; 2007. p. 67-75.
14. Cobo E, Muñoz P, González JA. Bioestadística para no estadísti- Recepción 7 de junio de 2013; aceptado 13 de agosto de
cos. españa: elsevier; 2007. p. 212-228. 2013
15. Elorza PTH. Estadística para las ciencias sociales, del compor-
tamiento y de la salud. 3ª edición. México: CeNGAGe learning;
2008. p. 319-338.
16. Acock AC. A gentle introduction to stata. 3th edition. Texas:
stata Press; 2012. p.170-177.
17. Hulley sB, Cummings sR, Browner Ws, et al. Design clinical re- Conclusiones
search. 3th edition. Philadelphia, usA: lippincott, Williams & Wi-
lkins; 2007. p. 65-69. la investigación educativa debe tener el mismo rigor me-
todológico que otras áreas científicas, incluido el cálculo
res proponen es: n n , donde del tamaño de la muestra. Hay que practicar una y otra
c e
vez, es decir, ser activos, para poder ser competente en
2
(P P)
e c
P es la proporción media de la proporción de eventos de tra empleando programas en línea. los programas utili- zan
interés del grupo control (c) y en el grupo en diferentes algoritmos matemáticos para efectuar el cálculo,
tratamiento (e), Qc=1-P, Pc es la proporción de eventos y aunque esencialmente utilizan los mismos ele- mentos,
de interés en el puede haber ligeras diferencias en el número de la muestra.
grupo control, Qc=1-Pc, Pe, es la proporción de eventos de Entre los programas más utilizados están EPIDAT®,
interés en el grupo expuesto o en tratamiento, Qe=1-Pe, y G*Power® y epi info®,8 de acceso libre. Hojas de cálculo como
(Pe-Pc) es la diferencia de las proporciones entre el grupo excel®2, también son de utilidad. entre los software de paga
control y la proporción del grupo de expuestos.8,19 destacan stata®,16 sAs®,22 sTATisTiCA®3 y sigma- Plot®,23 por
mencionar sólo algunos. Los dos últimos tie- nen la ventaja
9. Opción rápida y aceptable para el cálculo de poder graficar las funciones de estima- ciones del tamaño
de la muestra.
del tamaño muestral Hay que usarlos críticamente, siendo necesario com-
Existe una fórmula simplificada para el cálculo del tama- prender bien los principios del cálculo.
ño muestral para comparar dos medias, cuando se
acepta un error bilateral alfa del 5% y una potencia del
80%.2 Si se denomina diferencia estandarizada (DE) al
cociente entre las diferencias de medias d y la
desviación estándar s, tenemos: De = d/s, por lo que,
una fórmula abreviada, que sirve para estimar muy
aproximadamente el tamaño de la muestra, es:
n = 16/(De)2
Cuando esta fórmula es utilizada para comparar dos
proporciones,2 la expresión es:
n = 16pmqm/d2
Consideraciones especiales
4. Tamaño de muestra para estudios piloto
se recomienda incluir entre 30 y 50 participantes, los
cua- les deben poseer los atributos que se desean medir
en la población objetivo.21
6. Software de utilidad
el uso de internet facilita obtener el tamaño de mues-
Cálculo del tamaño de la 229
muestra
la conceptualización de cómo estimar la función
mate- mática del tamaño muestral. Al respecto, 18. Sullivan GN, Feinn R. Using effect size - or why the p value is not
Abraham Flex- ner escribió “la medicina moderna, enough. J Grad Med educ 2012;4:279-282.
como toda enseñanza científica, está caracterizada 19. Marrugat J, vila J, Pavesi M, et al. estimación del tamaño de
por la actividad. Las confe- rencias y los libros no son muestra en la investigación clínica y epidemiológica. Med Clin
sustitutos de las experiencias”. 1998;111:267-276.
20. sullivan AM, lakoma MD, Block sD. The status of medical edu-
cation in end-of-life care. A National Report. J Gen intern Med
Contribución de los autores 2003;18:685-695.
21. Babbie e. Fundamentos de la investigación social. 3ª edición.
JAGG, generador de la propuesta, búsqueda, México: Thomson editores; 2000. p. 232-256.
recupera- ción y análisis de la información 22. Consultado el 08 de mayo de 2013. http://www.sas.com/tech-
relacionada con el tema y redacción del manuscrito. nologies/analytics/statistics/stat/index.html
ARB, aportación de ideas para la estructura del 23. Consultado el 02 de mayo de 2013.
docu- mento, redacción del documento. http://www.sigmaplot.com/ products/sigmaplot/sigmaplot-
details.php#sa.
JClA, asesoría continua, aportó comentarios y
revi- sión del manuscrito.
Financiamiento
Ninguno.
Conflicto de intereses
Los autores declaran no tener ningún conflicto de
inte- reses.