Calcular la media en estadística

La media es la medida de tendencia central más utilizada, pero existe en varias formas. Este tutorial cubre la media aritmética, ponderada, truncada y geométrica: qué mide cada una, cuándo usarla y cuándo evitarla.

Media aritmética

La media aritmética es lo que la mayoría de personas entiende cuando dicen “promedio”. Se define como la suma de todos los valores dividida entre el número de valores.

Para un conjunto de \(n\) valores \((x_1, x_2, \dots, x_n)\), la media \(\bar{x}\) es:

\[\bar{x} = \frac{\sum_{i = 1}^n x_i}{n},\]

donde \(x_i\) es la observación \(i\) de \(x\).

Propiedades

La media aritmética tiene tres propiedades útiles cuando se trabaja con datos transformados:

  • Suma de desviaciones nula: la suma de las desviaciones respecto a la media es siempre cero, \(\sum_{i=1}^n (x_i - \bar{x}) = 0\).
  • Traslación: sumar una constante \(c\) a todos los valores desplaza la media en la misma cantidad. Si \(Y = X + c\), entonces \(\bar{y} = \bar{x} + c\).
  • Escala: multiplicar todos los valores por una constante \(c\) multiplica la media por esa constante. Si \(Y = cX\), entonces \(\bar{y} = c\bar{x}\).
  • Transformación lineal: combinando ambas, si \(Y = aX + b\), entonces \(\bar{y} = a\bar{x} + b\).
Ejemplo: calcular la media y sus propiedades

El precio de venta de cuatro coches es: 25.000, 32.000, 15.000 y 72.000 USD.

Precio medio:

\[\bar{x} = \frac{25000 + 32000 + 15000 + 72000}{4} = 36{,}000 \text{ USD.}\]

Si todos los precios suben 5.000 USD, ¿cuál es la nueva media?

Por la propiedad de traslación: \(\bar{y} = 36{,}000 + 5{,}000 = 41{,}000\) USD. No hace falta recalcular desde cero.

Si todos los precios suben un 10%, ¿cuál es la nueva media?

Por la propiedad de escala: \(\bar{y} = 36{,}000 \times 1{,}1 = 39{,}600\) USD.

Example icon

El problema de los valores atípicos

La media aritmética es sensible a los valores extremos. Un único outlier puede arrastrar la media lejos de donde se concentra la mayor parte de los datos.

Un outlier desplaza significativamente la media, mientras la mediana permanece estable

Figure 1: Un outlier desplaza significativamente la media, mientras la mediana permanece estable

⚠️ Cuándo no usar la media aritmética

Evita la media aritmética cuando:

  • Los datos tienen outliers importantes: el salario de un directivo en una muestra de trabajadores hará que la media no represente a ningún empleado típico.
  • La distribución está muy sesgada: los precios de la vivienda, los ingresos o la población de las ciudades son ejemplos clásicos. La mediana es una mejor opción.
  • La variable es ordinal: promediar puntuaciones de satisfacción (1 = malo, 5 = excelente) asume distancias iguales entre categorías, lo cual no está garantizado.

Media truncada

La media truncada elimina un porcentaje fijo de los valores más bajos y más altos antes de calcular la media. Es una forma sencilla de reducir la influencia de los outliers sin cambiar completamente de medida.

Para calcular la media truncada al \(p\)%: ordena los datos, elimina el \(p\)% de los valores de cada extremo y calcula la media aritmética del resto.

Media truncada al 10%: los dos valores extremos (en rojo) se eliminan antes de promediar

Figure 2: Media truncada al 10%: los dos valores extremos (en rojo) se eliminan antes de promediar

Ejemplo: media truncada al 10%

Considera los siguientes 10 valores: (1, 17, 19, 20, 22, 23, 27, 29, 32, 210).

La media aritmética es: \[\bar{x} = \frac{1 + 17 + \cdots + 210}{10} = 40.\]

Con una truncación del 10%, se elimina 1 valor de cada extremo (10% de 10). Ordenando y eliminando los extremos:

1, 17, 19, 20, 22, 23, 27, 29, 32, 210

La media truncada es: \[\bar{x}_t = \frac{17 + 19 + 20 + 22 + 23 + 27 + 29 + 32}{8} = 23{,}625.\]

Los dos outliers (1 y 210) estaban arrastrando la media aritmética hasta 40, muy lejos de donde se concentran la mayoría de los valores.

Example icon

💡 Uso real de la media truncada

La media truncada se usa en contextos oficiales más de lo que la gente suele pensar. La media recortada se utiliza para calcular la nota final en gimnasia artística y patinaje artístico olímpico (eliminando la puntuación más alta y la más baja de los jueces). Algunos bancos centrales también la usan para medir la inflación subyacente, eliminando las categorías de precios más volátiles.

Media ponderada

La media aritmética asume que todas las observaciones tienen la misma importancia. La media ponderada permite que distintos valores contribuyan de forma diferente, según un peso \(w_i\) asignado a cada observación \(x_i\):

\[\bar{x}_w = \frac{\sum_{i=1}^k x_i \cdot w_i}{\sum_{i=1}^k w_i}.\]

Ejemplo: media ponderada en un sistema de calificaciones

Un curso tiene tres evaluaciones con pesos distintos: un examen parcial (20%), un proyecto (20%) y un examen final (60%). Un estudiante obtiene 5, 7 y 8.

\[\bar{x}_w = \frac{5 \cdot 0{,}2 + 7 \cdot 0{,}2 + 8 \cdot 0{,}6}{0{,}2 + 0{,}2 + 0{,}6} = \frac{1 + 1{,}4 + 4{,}8}{1} = 7{,}2.\]

Con una media aritmética simple la nota sería 6,67. La media ponderada refleja que el examen final tiene más peso.

Example icon

⚠️ Los pesos deben sumar un total con sentido

La fórmula divide entre (\sum w_i), por lo que los pesos no tienen por qué sumar 1 ni 100. Sin embargo, asegúrate de que los pesos reflejan la importancia relativa real. Un error frecuente es usar recuentos como pesos cuando lo que se quiere son pesos proporcionales, o al revés.

Media geométrica

La media geométrica es el promedio adecuado cuando se trabaja con valores que se multiplican entre sí, como tasas de crecimiento, ratios o índices. Se define como la raíz \(k\)-ésima del producto de \(k\) valores:

\[\bar{x}_g = \left(\prod_{i=1}^k x_i\right)^{\frac{1}{k}}.\]

Una fórmula equivalente y a menudo más práctica usa logaritmos:

\[\bar{x}_g = \exp\left(\frac{1}{k} \sum_{i=1}^k \ln(x_i)\right).\]

Ejemplo: tasa de crecimiento media de una inversión

Una inversión crece un 5%, un 10% y un 20% en tres años consecutivos. ¿Cuál es la tasa de crecimiento anual media?

Se convierten en multiplicadores: \(x = (1{,}05,\ 1{,}10,\ 1{,}20)\).

\[\bar{x}_g = (1{,}05 \times 1{,}10 \times 1{,}20)^{1/3} = 1{,}386^{1/3} \approx 1{,}1154.\]

La tasa de crecimiento anual media es aproximadamente 11,54%.

Para verificarlo: \(1{,}05 \times 1{,}10 \times 1{,}20 = 1{,}386\), y \(1{,}1154^3 \approx 1{,}386\). Correcto.

Usando la media aritmética en su lugar se obtendría \((1{,}05 + 1{,}10 + 1{,}20)/3 = 1{,}1167\), es decir, un 11,67%. La media aritmética sobreestima ligeramente el crecimiento compuesto.

Example icon

⚠️ La media geométrica requiere valores positivos

La media geométrica solo está definida cuando todos los valores son positivos. Si algún valor es cero o negativo, la fórmula no funciona. Al trabajar con tasas de crecimiento, asegúrate de usar multiplicadores (por ejemplo, 1,05 para un crecimiento del 5%), no porcentajes directos.