Rango en estadística
El rango es la medida de dispersión más sencilla: simplemente la diferencia entre el valor más grande y el más pequeño de un conjunto de datos. Es fácil de calcular e interpretar, pero tiene una debilidad crítica que lo hace poco fiable en muchas situaciones reales.
Definición
El rango \(R\) de un conjunto de datos \(X\) con \(n\) observaciones es:
\[ R = \max(X) - \min(X) \]
Mide la dispersión total de los datos de un extremo al otro.

Propiedades
- No negativo: \(R \geq 0\). Vale cero solo cuando todos los valores son idénticos.
- Sensible a los outliers: un único valor extremo cambia completamente el rango, independientemente de cómo se distribuya el resto de los datos.
- Solo usa dos valores: el rango ignora todo lo que hay entre el mínimo y el máximo. Dos conjuntos de datos con distribuciones muy distintas pueden tener exactamente el mismo rango.
- Transformación de escala: si \(Y = aX + b\) con \(a > 0\), entonces \(R(Y) = a \cdot R(X)\). Sumar una constante no cambia el rango.
⚠️ El rango no dice nada sobre lo que hay en medio
Considera estos dos conjuntos de datos:
- \(A = (1, 1, 1, 1, 1, 1, 1, 1, 1, 100)\)
- \(B = (1, 12, 23, 34, 45, 56, 67, 78, 89, 100)\)
Ambos tienen un rango de 99. Pero el conjunto A tiene 9 valores agrupados en 1 con un outlier extremo, mientras que el B está distribuido uniformemente por todo el rango. El rango no puede distinguir entre estas dos situaciones tan distintas.
Ejemplos
Ejemplo 1: rango de temperatura diaria
Una estación meteorológica registra las siguientes temperaturas horarias (°C) a lo largo de un día:
\[x = (12, 14, 15, 18, 22, 26, 28, 27, 24, 20, 17, 13)\]
El rango es: \(R = 28 - 12 = 16°C\).
Esto indica que las temperaturas variaron 16 grados a lo largo del día, lo cual es inmediatamente útil para decidir qué ropa ponerse o cómo planificar actividades al aire libre.
Ejemplo 2: el problema del outlier
Una startup tiene 8 empleados con los siguientes salarios anuales (en miles de USD):
\[x = (32, 35, 36, 38, 40, 41, 42, 210)\]
El rango es \(R = 210 - 32 = 178\), lo que sugiere una dispersión salarial enorme. Pero 7 de los 8 empleados ganan entre 32k y 42k. El rango de 178k está determinado por completo por el salario del CEO.

En este caso, el rango intercuartílico (IQR) sería una medida mucho más informativa: se centra en el 50% central de los datos e ignora ambos extremos.
Ejemplo 3: mismo rango, distribuciones distintas
Figure 1: Ambos conjuntos tienen el mismo rango (9), pero distribuciones completamente distintas
Cuándo usar el rango
A pesar de sus limitaciones, el rango es útil en situaciones concretas:
- Exploración rápida: cuando necesitas una idea aproximada y rápida de cuánto se dispersan los datos.
- Control de procesos: en fabricación y control de calidad, el rango de muestras pequeñas se usa en los gráficos de control (llamados gráficos R) para monitorizar la variabilidad del proceso en tiempo real.
- Límites naturales: cuando el mínimo y el máximo tienen significado por sí mismos, como el rango de temperatura diaria en una previsión meteorológica o el rango máximo-mínimo de precios en los mercados financieros.
💡 Usa el rango junto con otras medidas