Media vs mediana – La diferencia que debes conocer
Introducción
¿Media o mediana? Aunque se parecen, no siempre significan lo mismo. En este artículo aprenderás cuál es la diferencia entre ambos conceptos y por qué importa cuando analizas datos. Además, te mostraremos cómo calcularlos fácilmente en R.
¿Qué es la media?
La media (o promedio) se calcula sumando todos los valores y dividiendo por el número total. Por ejemplo:
c(10, 20, 30, 40, 50)
mean() = (10+20+30+40+50)/5 = 30
Es útil cuando los datos están distribuidos de forma homogénea.
¿Qué es la mediana?
La mediana es el valor que queda en el centro cuando ordenas todos los datos. Por ejemplo:
c(10, 20, 30, 40, 50)
mediana = 30
Pero si tienes un dato muy extremo:
c(10, 20, 30, 40, 1000)
media = 220, mediana = 30
Aquí la mediana refleja mejor el centro de los datos.
¿Cuál usar en análisis de datos?
Depende del contexto:
-
Usa media si los datos no tienen valores extremos (outliers).
-
Usa mediana si los datos son asimétricos o hay valores atípicos.
El problema es que se abusa de la media y se pretende utilizar para todo como si representase un valor de referencia. Sin embargo, si tenemos estos datos: 2-2-2-2-492, la media será 100, un valor que no representa en absoluto la serie de valores.
¿Cómo hacerlo en R?
x <- c(10, 20, 30, 40, 1000)
mean(x) # Media
median(x) # Mediana
Sencillo y rápido. Y muy útil para entender la naturaleza de tus datos. Y si queires más estadística descriptiva, siempre puedes recurrir al resumen estadístico:
summary(x) # Media, mediana, mínimo, máximo y cuartiles
Conclusión
Entender la diferencia entre media y mediana te ayuda a tomar mejores decisiones con datos, y te evitará confusiones, para que no creas que te da más información de la que te da realmente. Además, calcular media y mediana en R es tan simple como una línea de código.