Coeficiente de variación en estadística
El coeficiente de variación (CV) responde a una pregunta que la desviación típica no puede: ¿qué conjunto de datos es más variable en relación con su propia media? Es la medida indicada cuando se necesita comparar la variabilidad entre conjuntos de datos con distintas unidades o valores medios muy diferentes.
Definición
El coeficiente de variación es el cociente entre la desviación típica y la media, expresado como porcentaje:
\[ CV = \frac{\sigma}{\bar{x}} \times 100\% \]
donde \(\sigma\) es la desviación típica y \(\bar{x}\) es la media del conjunto de datos.
Un CV del 10% significa que la desviación típica representa el 10% de la media. Un CV del 80% indica que los datos están muy dispersos respecto a su centro.
La propiedad clave que hace útil al CV: es adimensional. No tiene unidades, por lo que se puede comparar directamente la variabilidad de salarios en euros con alturas en centímetros, o precios de acciones con rentabilidades de bonos.
Figure 1: Mayor CV significa más dispersión relativa respecto a la media: las tres distribuciones tienen la misma media pero distinta variabilidad relativa
Propiedades
- Adimensional: el CV no tiene unidades, que es precisamente lo que lo hace útil para comparar variables distintas.
- Siempre positivo: como la desviación típica es no negativa y se divide por la media, el CV es positivo cuando la media es positiva.
- Invariante a la escala: multiplicar todos los valores por una constante no cambia el CV. Doblar todos los salarios dobla tanto la media como la desviación típica, por lo que el cociente permanece igual.
- Sensible a la media: si la media es cercana a cero, el CV se dispara y pierde interpretabilidad. Si la media es negativa, el CV carece de sentido.
⚠️ El CV no funciona cuando la media es cero o negativa
Si los datos incluyen valores negativos o la media está próxima a cero, el CV deja de ser válido. Un conjunto de variaciones diarias de temperatura en Celsius puede tener una media cercana a cero, lo que hace que el CV sea enorme o esté indefinido. En esos casos, usa directamente la desviación típica o cambia de escala (por ejemplo, Kelvin para temperaturas).
Ejemplos
Ejemplo 1: comparar dos activos de inversión
Un gestor de cartera quiere saber cuál de dos activos es más arriesgado en relación con su rentabilidad:
- Activo A (acción tecnológica): rentabilidad media mensual = 8%, desviación típica = 4%
- Activo B (bono del Estado): rentabilidad media mensual = 2%, desviación típica = 1,5%
Comparar solo las desviaciones típicas (4% frente a 1,5%) sugiere que el activo A es más volátil. Pero ¿es más volátil en relación con lo que rinde?
\[CV_A = \frac{4}{8} \times 100\% = 50\%\]
\[CV_B = \frac{1{,}5}{2} \times 100\% = 75\%\]
El bono del Estado tiene un CV mayor: es más volátil en relación con su propia rentabilidad media. Por cada unidad de rentabilidad, conlleva más riesgo relativo que la acción tecnológica. La desviación típica sola habría dado la impresión contraria.
Ejemplo 2: comparar variables con distintas unidades
Un hospital quiere comparar la variabilidad de dos mediciones de pacientes recogidas en el mismo estudio:
- Talla: media = 170 cm, desviación típica = 8 cm
- Peso: media = 72 kg, desviación típica = 12 kg
No se pueden comparar 8 cm con 12 kg directamente. El CV los hace comparables:
\[CV_{\text{talla}} = \frac{8}{170} \times 100\% \approx 4{,}7\%\]
\[CV_{\text{peso}} = \frac{12}{72} \times 100\% \approx 16{,}7\%\]
El peso es considerablemente más variable en relación con su media que la talla. Esto indica al hospital que las mediciones de peso mostrarán más diferencias relativas entre pacientes.
Figure 2: El CV permite comparar directamente la variabilidad entre variables con distintas unidades
Ejemplo 3: control de calidad en producción
Una fábrica produce dos tipos de tornillos y quiere saber qué línea de producción tiene una salida más consistente:
- Línea 1: diámetro medio = 5 mm, desviación típica = 0,1 mm → \(CV = 2\%\)
- Línea 2: diámetro medio = 20 mm, desviación típica = 0,3 mm → \(CV = 1{,}5\%\)
Aunque la línea 2 tiene una desviación típica absoluta mayor (0,3 mm frente a 0,1 mm), su producción es en realidad más consistente en relación con el tamaño objetivo. La línea 1 es la que tiene la variabilidad relativa más alta.
💡 Cuándo usar el CV en lugar de la desviación típica
- Compares la variabilidad entre variables medidas en distintas unidades (salarios frente a horas, talla frente a peso).
- Compares la variabilidad entre conjuntos de datos con medias muy distintas (una acción a 10 USD frente a otra a 500 USD).
- Quieras una medida relativa de riesgo o consistencia, no absoluta.
Usa la desviación típica cuando todas las variables estén en la misma escala y necesites una medida interpretable en las unidades originales.