INICIO

Cálculo del tamaño muestral

El cálculo del tamaño muestral es el paso que determina cuántas observaciones se necesitan para estimar un parámetro con el nivel de precisión y confianza deseados. Una muestra demasiado pequeña da un intervalo demasiado amplio para ser útil; una demasiado grande malgasta recursos. El objetivo es encontrar el \(n\) mínimo que cumpla los requisitos.

Principio general

Un intervalo de confianza tiene la forma:

\[\text{estimación} \pm \underbrace{z_{\alpha/2} \cdot \text{EE}}_{\text{margen de error } d}\]

El margen de error \(d\) disminuye al crecer \(n\) (ya que \(\text{EE} \propto 1/\sqrt{n}\)). Para lograr un margen de error objetivo \(d\), se despeja \(n\). El tamaño muestral necesario siempre depende de tres cosas:

El nivel de confianza \((1-\alpha)\): mayor confianza requiere \(n\) más grande.
El margen de error \(d\): menor \(d\) requiere \(n\) más grande.
La variabilidad poblacional (\(\sigma\) o \(p\)): poblaciones más variables requieren \(n\) más grande.

Mapa de calor que muestra el tamaño muestral necesario para una media en función del margen de error y el nivel de confianza

El mapa de calor muestra que márgenes de error pequeños con niveles de confianza altos exigen muestras muy grandes. Reducir el margen de error a la mitad cuadruplica el \(n\) necesario.

Tamaño muestral para estimar una media

Para estimar \(\mu\) con margen de error \(d\) al nivel de confianza \(1-\alpha\), cuando \(\sigma\) es conocida:

\[n \geq \left(\frac{z_{\alpha/2} \cdot \sigma}{d}\right)^2\]

Cuando \(\sigma\) es desconocida, sustitúyela por una estimación piloto \(S\) y usa \(t_{\alpha/2, n-1}\) en lugar de \(z_{\alpha/2}\). Como \(t\) depende de \(n\), itera: empieza con \(z\), calcula \(n\), luego comprueba con \(t_{n-1}\) y ajusta si es necesario.

Valores habituales de \(z_{\alpha/2}\):

Nivel de confianza	\(z_{\alpha/2}\)
90%	1,645
95%	1,960
99%	2,576

Tamaño muestral para una media: estudio hospitalario

Un hospital quiere estimar la estancia media para un grupo diagnóstico con una precisión de \(\pm 0{,}5\) días al 95% de confianza. De un estudio piloto, \(S \approx 3{,}1\) días.

\[n \geq \left(\frac{1{,}960 \times 3{,}1}{0{,}5}\right)^2 = \left(\frac{6{,}076}{0{,}5}\right)^2 = 12{,}152^2 \approx 147{,}7 \to 148\]

Se necesitan al menos 148 pacientes. Si el presupuesto solo permite 50 pacientes, el margen de error alcanzable sería:

\[d = 1{,}960 \times \frac{3{,}1}{\sqrt{50}} \approx 0{,}86 \text{ días}\]

El hospital debe decidir si un margen de \(\pm 0{,}86\) días es aceptable.

Tamaño muestral para estimar una proporción

Para estimar \(p\) con margen de error \(d\):

\[n \geq \frac{z_{\alpha/2}^2 \cdot p(1-p)}{d^2}\]

Como \(p\) es desconocida, usa una estimación previa si se dispone de ella. Si no, usa \(p = 0{,}5\), que maximiza \(p(1-p) = 0{,}25\) y da el tamaño muestral más conservador (mayor).

Gráfico de líneas que muestra el tamaño muestral necesario para proporciones para distintos valores de p y margen de error

El gráfico muestra que el \(n\) máximo necesario se produce siempre en \(p = 0{,}5\), y que reducir \(d\) del 5% al 2% aproximadamente cuadruplica el tamaño muestral necesario.

Tamaño muestral para una proporción: control de calidad

Una fábrica quiere estimar su tasa de defectos con una precisión de \(\pm 2\%\) al 95% de confianza. Una auditoría previa encontró una tasa de defectos de aproximadamente el 8%.

Usando la estimación previa \(p = 0{,}08\):

\[n \geq \frac{1{,}960^2 \times 0{,}08 \times 0{,}92}{0{,}02^2} = \frac{3{,}842 \times 0{,}0736}{0{,}0004} = \frac{0{,}2828}{0{,}0004} \approx 707\]

Usando el valor conservador \(p = 0{,}5\):

\[n \geq \frac{1{,}960^2 \times 0{,}25}{0{,}02^2} = \frac{0{,}9604}{0{,}0004} = 2{.}401\]

La estimación previa ahorra 1.694 inspecciones. Cuando \(p\) está lejos de 0,5, usar información previa es eficiente.

Tamaño muestral para comparar dos medias

Para detectar una diferencia de \(\delta = \mu_1 - \mu_2\) con margen de error \(d\) al nivel de confianza \(1-\alpha\), asumiendo tamaños muestrales iguales \(n_1 = n_2 = n\) y varianzas iguales \(\sigma^2\):

\[n \geq 2\left(\frac{z_{\alpha/2} \cdot \sigma}{d}\right)^2\]

Para un contraste de hipótesis que detecte una diferencia \(\delta\) con potencia \(1-\beta\):

\[n \geq \frac{2\sigma^2(z_{\alpha/2} + z_\beta)^2}{\delta^2}\]

donde \(z_\beta\) es el cuantil de la normal estándar para la potencia deseada (por ejemplo, \(z_{0{,}80} = 0{,}842\) para una potencia del 80%, \(z_{0{,}90} = 1{,}282\) para el 90%).

Ensayo clínico: comparación de dos tratamientos

Un ensayo compara la reducción de la presión arterial entre dos fármacos. De datos previos, \(\sigma \approx 12\) mmHg. La diferencia clínicamente relevante es \(\delta = 5\) mmHg. Se diseña el ensayo con un 95% de confianza y un 80% de potencia.

\[n \geq \frac{2 \times 144 \times (1{,}960 + 0{,}842)^2}{25} = \frac{288 \times 7{,}852}{25} = \frac{2{.}261}{25} \approx 91\]

Cada grupo necesita al menos 91 pacientes (182 en total). Para el 90% de potencia:

\[n \geq \frac{2 \times 144 \times (1{,}960 + 1{,}282)^2}{25} = \frac{288 \times 10{,}511}{25} \approx 121 \text{ por grupo}\]

Pasar del 80% al 90% de potencia aumenta el total muestral de 182 a 242.

Consideraciones prácticas

⚠️ El n calculado es un mínimo, no un objetivo

La fórmula da el \(n\) mínimo en condiciones ideales. En la práctica, auméntalo siempre para tener en cuenta:

Abandonos y no respuesta: si se espera un 15% de abandono, divide entre 0,85. Un estudio que necesita 148 observaciones completas requiere inscribir \(148/0{,}85 \approx 175\) participantes.
Comparaciones múltiples: si se contrastan varias hipótesis, el \(\alpha\) efectivo por contraste es menor, lo que requiere \(n\) mayor.
Muestreo por conglomerados: las observaciones dentro de los conglomerados están correlacionadas. Multiplica \(n\) por el efecto de diseño \(\text{DEFF} = 1 + (m-1)\rho\), donde \(m\) es el tamaño del conglomerado y \(\rho\) es la correlación intraclase.
Análisis de subgrupos: si se necesita estimar parámetros dentro de subgrupos, cada subgrupo necesita su propio \(n\) mínimo.

Una buena regla práctica: calcula el \(n\) mínimo, añade un 20% como margen de seguridad y luego revisa la viabilidad.

💡 Qué hacer cuando el n necesario es demasiado grande

Si el tamaño muestral calculado supera el presupuesto o los plazos:

Aumenta \(d\): acepta un margen de error mayor. Duplicar \(d\) divide \(n\) entre cuatro.
Reduce el nivel de confianza: pasar del 99% al 95% reduce \(n\) en aproximadamente un 30%.
Usa una mejor estimación previa de \(p\) o \(\sigma\): un estudio piloto para estimar la variabilidad puede reducir sustancialmente el \(n\) necesario.
Usa un contraste unilateral: si solo importa una dirección, \(z_{\alpha}\) en lugar de \(z_{\alpha/2}\) reduce \(n\).
Acepta menor potencia: reducir la potencia del 90% al 80% ahorra aproximadamente el 25% de las observaciones en un contraste de dos muestras.

Documenta explícitamente cualquier compromiso: los revisores y los organismos reguladores preguntarán.