Media vs mediana – La diferencia que debes conocer

Introducción

¿Media o mediana? Aunque se parecen, no siempre significan lo mismo. En este artículo aprenderás cuál es la diferencia entre ambos conceptos y por qué importa cuando analizas datos. Además, te mostraremos cómo calcularlos fácilmente en R.

¿Qué es la media?

La media (o promedio) se calcula sumando todos los valores y dividiendo por el número total. Por ejemplo:

c(10, 20, 30, 40, 50)
mean() = (10+20+30+40+50)/5 = 30

Es útil cuando los datos están distribuidos de forma homogénea.

¿Qué es la mediana?

La mediana es el valor que queda en el centro cuando ordenas todos los datos. Por ejemplo:

c(10, 20, 30, 40, 50)
mediana = 30

Pero si tienes un dato muy extremo:

c(10, 20, 30, 40, 1000)
media = 220, mediana = 30

Aquí la mediana refleja mejor el centro de los datos.

¿Cuál usar en análisis de datos?

Depende del contexto:

  • Usa media si los datos no tienen valores extremos (outliers).

  • Usa mediana si los datos son asimétricos o hay valores atípicos.

El problema es que se abusa de la media y se pretende utilizar para todo como si representase un valor de referencia. Sin embargo, si tenemos estos datos: 2-2-2-2-492, la media será 100, un valor que no representa en absoluto la serie de valores.

¿Cómo hacerlo en R?

x <- c(10, 20, 30, 40, 1000)
mean(x)     # Media
median(x)   # Mediana

Sencillo y rápido. Y muy útil para entender la naturaleza de tus datos. Y si queires más estadística descriptiva, siempre puedes recurrir al resumen estadístico:

summary(x)     # Media, mediana, mínimo, máximo y cuartiles

Conclusión

Entender la diferencia entre media y mediana te ayuda a tomar mejores decisiones con datos, y te evitará confusiones, para que no creas que te da más información de la que te da realmente. Además, calcular media y mediana en R es tan simple como una línea de código.