lock Debes estar suscrito para ver este contenido.

Transformación de datos con R #09: Limpieza de variables

Allá por las primeras clases vimos que había una función que nos permitía eliminar filas completas cuando algún valor era NA. Esa función es “na.omit” y, aunque es muy útil, puede ser demasiado extrema.

¿Qué pasa si solo queremos averiguar dónde están los NA y con ello después decidir si los queremos eliminar o no? Pues gracias a todo lo aprendido en las anteriores clases y utilizando la función “is.na” podemos hacerlo. Y totalmente automatizado para cuando cambien los datos de entrada, por supuesto.

Además, hay otra limpieza de datos importante, sobre todo en estudios donde hay que analizar tablas con cantidades enormes de filas, y es la eliminación de datos duplicados. Si quieres aprender cómo sacarle el máximo, no te pierdas esta 9ª clase.