Calcular la media en estadística
La media es la medida de tendencia central más utilizada, pero existe en varias formas. Este tutorial cubre la media aritmética, ponderada, truncada y geométrica: qué mide cada una, cuándo usarla y cuándo evitarla.
Media aritmética
La media aritmética es lo que la mayoría de personas entiende cuando dicen “promedio”. Se define como la suma de todos los valores dividida entre el número de valores.
Para un conjunto de \(n\) valores \((x_1, x_2, \dots, x_n)\), la media \(\bar{x}\) es:
\[\bar{x} = \frac{\sum_{i = 1}^n x_i}{n},\]
donde \(x_i\) es la observación \(i\) de \(x\).
Propiedades
La media aritmética tiene tres propiedades útiles cuando se trabaja con datos transformados:
- Suma de desviaciones nula: la suma de las desviaciones respecto a la media es siempre cero, \(\sum_{i=1}^n (x_i - \bar{x}) = 0\).
- Traslación: sumar una constante \(c\) a todos los valores desplaza la media en la misma cantidad. Si \(Y = X + c\), entonces \(\bar{y} = \bar{x} + c\).
- Escala: multiplicar todos los valores por una constante \(c\) multiplica la media por esa constante. Si \(Y = cX\), entonces \(\bar{y} = c\bar{x}\).
- Transformación lineal: combinando ambas, si \(Y = aX + b\), entonces \(\bar{y} = a\bar{x} + b\).
El precio de venta de cuatro coches es: 25.000, 32.000, 15.000 y 72.000 USD.
Precio medio:
\[\bar{x} = \frac{25000 + 32000 + 15000 + 72000}{4} = 36{,}000 \text{ USD.}\]
Si todos los precios suben 5.000 USD, ¿cuál es la nueva media?
Por la propiedad de traslación: \(\bar{y} = 36{,}000 + 5{,}000 = 41{,}000\) USD. No hace falta recalcular desde cero.
Si todos los precios suben un 10%, ¿cuál es la nueva media?
Por la propiedad de escala: \(\bar{y} = 36{,}000 \times 1{,}1 = 39{,}600\) USD.
El problema de los valores atípicos
La media aritmética es sensible a los valores extremos. Un único outlier puede arrastrar la media lejos de donde se concentra la mayor parte de los datos.
Figure 1: Un outlier desplaza significativamente la media, mientras la mediana permanece estable
⚠️ Cuándo no usar la media aritmética
Evita la media aritmética cuando:
- Los datos tienen outliers importantes: el salario de un directivo en una muestra de trabajadores hará que la media no represente a ningún empleado típico.
- La distribución está muy sesgada: los precios de la vivienda, los ingresos o la población de las ciudades son ejemplos clásicos. La mediana es una mejor opción.
- La variable es ordinal: promediar puntuaciones de satisfacción (1 = malo, 5 = excelente) asume distancias iguales entre categorías, lo cual no está garantizado.
Media truncada
La media truncada elimina un porcentaje fijo de los valores más bajos y más altos antes de calcular la media. Es una forma sencilla de reducir la influencia de los outliers sin cambiar completamente de medida.
Para calcular la media truncada al \(p\)%: ordena los datos, elimina el \(p\)% de los valores de cada extremo y calcula la media aritmética del resto.
Figure 2: Media truncada al 10%: los dos valores extremos (en rojo) se eliminan antes de promediar
Considera los siguientes 10 valores: (1, 17, 19, 20, 22, 23, 27, 29, 32, 210).
La media aritmética es: \[\bar{x} = \frac{1 + 17 + \cdots + 210}{10} = 40.\]
Con una truncación del 10%, se elimina 1 valor de cada extremo (10% de 10). Ordenando y eliminando los extremos:
1, 17, 19, 20, 22, 23, 27, 29, 32, 210
La media truncada es: \[\bar{x}_t = \frac{17 + 19 + 20 + 22 + 23 + 27 + 29 + 32}{8} = 23{,}625.\]
Los dos outliers (1 y 210) estaban arrastrando la media aritmética hasta 40, muy lejos de donde se concentran la mayoría de los valores.
💡 Uso real de la media truncada
Media ponderada
La media aritmética asume que todas las observaciones tienen la misma importancia. La media ponderada permite que distintos valores contribuyan de forma diferente, según un peso \(w_i\) asignado a cada observación \(x_i\):
\[\bar{x}_w = \frac{\sum_{i=1}^k x_i \cdot w_i}{\sum_{i=1}^k w_i}.\]
Un curso tiene tres evaluaciones con pesos distintos: un examen parcial (20%), un proyecto (20%) y un examen final (60%). Un estudiante obtiene 5, 7 y 8.
\[\bar{x}_w = \frac{5 \cdot 0{,}2 + 7 \cdot 0{,}2 + 8 \cdot 0{,}6}{0{,}2 + 0{,}2 + 0{,}6} = \frac{1 + 1{,}4 + 4{,}8}{1} = 7{,}2.\]
Con una media aritmética simple la nota sería 6,67. La media ponderada refleja que el examen final tiene más peso.
⚠️ Los pesos deben sumar un total con sentido
La fórmula divide entre (\sum w_i), por lo que los pesos no tienen por qué sumar 1 ni 100. Sin embargo, asegúrate de que los pesos reflejan la importancia relativa real. Un error frecuente es usar recuentos como pesos cuando lo que se quiere son pesos proporcionales, o al revés.
Media geométrica
La media geométrica es el promedio adecuado cuando se trabaja con valores que se multiplican entre sí, como tasas de crecimiento, ratios o índices. Se define como la raíz \(k\)-ésima del producto de \(k\) valores:
\[\bar{x}_g = \left(\prod_{i=1}^k x_i\right)^{\frac{1}{k}}.\]
Una fórmula equivalente y a menudo más práctica usa logaritmos:
\[\bar{x}_g = \exp\left(\frac{1}{k} \sum_{i=1}^k \ln(x_i)\right).\]
Una inversión crece un 5%, un 10% y un 20% en tres años consecutivos. ¿Cuál es la tasa de crecimiento anual media?
Se convierten en multiplicadores: \(x = (1{,}05,\ 1{,}10,\ 1{,}20)\).
\[\bar{x}_g = (1{,}05 \times 1{,}10 \times 1{,}20)^{1/3} = 1{,}386^{1/3} \approx 1{,}1154.\]
La tasa de crecimiento anual media es aproximadamente 11,54%.
Para verificarlo: \(1{,}05 \times 1{,}10 \times 1{,}20 = 1{,}386\), y \(1{,}1154^3 \approx 1{,}386\). Correcto.
Usando la media aritmética en su lugar se obtendría \((1{,}05 + 1{,}10 + 1{,}20)/3 = 1{,}1167\), es decir, un 11,67%. La media aritmética sobreestima ligeramente el crecimiento compuesto.
⚠️ La media geométrica requiere valores positivos
La media geométrica solo está definida cuando todos los valores son positivos. Si algún valor es cero o negativo, la fórmula no funciona. Al trabajar con tasas de crecimiento, asegúrate de usar multiplicadores (por ejemplo, 1,05 para un crecimiento del 5%), no porcentajes directos.