Percentiles y Cuartiles: Ejemplos del día a día con R
Cuando empiezas con estadística en R, hay dos conceptos que aparecen constantemente y que mucha gente no termina de entender bien: percentiles y cuartiles.
En este artículo te voy a explicar qué son los percentiles y cuartiles, para qué sirven y cómo calcularlos en R con ejemplos muy cercanos al día a día. Nada de definiciones raras: vamos a lo práctico.
¿Qué es un percentil? Explicado fácil
Un percentil indica el valor por debajo del cual se encuentra un determinado porcentaje de los datos.
Por ejemplo:
-
Percentil 50 → el 50% de los datos está por debajo de ese valor
-
Percentil 90 → el 90% de los datos está por debajo de ese valor
Un ejemplo del día a día:
Si tu nota está en el percentil 80, significa que has sacado mejor nota que el 80% de las personas.
Así de simple.
¿Qué son los cuartiles?
Los cuartiles no dejan de ser percentiles concretos:
-
Q1 → percentil 25
-
Q2 → percentil 50 (la mediana)
-
Q3 → percentil 75
Dividen los datos en cuatro partes iguales y se usan muchísimo para analizar distribuciones y detectar valores extremos.
Ejemplo sencillo en R
Vamos a usar un vector numérico cualquiera, por ejemplo edades:
edades <- c(18, 20, 22, 25, 30, 35, 40, 45, 50)
Calcular percentiles en R
En R, la función clave es quantile().
Percentil 50 (mediana)
quantile(edades, 0.5)
Percentil 25 y 75
quantile(edades, c(0.25, 0.75))
Por defecto, R devuelve:
-
Mínimo
-
Q1
-
Mediana
-
Q3
-
Máximo
Esto es muy habitual en análisis exploratorio de datos.
Percentiles con datos reales: ejemplo práctico
Imagina que tienes las notas de un examen:
notas <- c(4, 5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5)
Percentil 80:
quantile(notas, 0.8)
Esto te dice a partir de qué nota estás en el 20% superior.
Este tipo de análisis se usa muchísimo en educación, salarios, tiempos, precios, etc.
¿Para qué sirven los percentiles y cuartiles?
Algunos usos muy comunes:
-
Comparar resultados sin depender de la media
-
Analizar distribuciones sesgadas
-
Detectar valores atípicos
-
Interpretar datos de forma más realista
-
Entender tu posición relativa dentro de un grupo
Por eso aparecen tanto en estadística descriptiva y análisis de datos con R.
Relación con los diagramas de caja (boxplot)
Los boxplots se basan directamente en los cuartiles:
-
La caja va de Q1 a Q3
-
La línea central es la mediana
-
Los bigotes muestran la dispersión
En R:
boxplot(notas)
Si entiendes cuartiles y percentiles, entiendes los boxplots.
Errores típicos al interpretar percentiles
Algunos errores muy comunes:
-
Pensar que el percentil 90 es una nota “sobre 10”
-
Confundir percentil con porcentaje
-
Creer que la media siempre representa bien los datos
-
No tener en cuenta la distribución
Son errores normales cuando se empieza.
Conclusión
Qué tienes que llevarte de este artículo:
-
Los percentiles indican posición relativa
-
Los cuartiles dividen los datos en cuatro partes
-
En R se calculan con
quantile() -
Son clave para análisis descriptivo
-
Se usan constantemente en la vida real
Si entiendes esto, tienes una base sólida de estadística en R.
Y en la academia online tienes cursos estructurados para aprender R y estadística de forma clara y sin perder tiempo.
-
Estadística desde cero
-
R base explicado fácil
-
Análisis de datos
-
Interpretación de resultados