lock Debes estar suscrito para ver este contenido.

Curso de text-mining literario con R #08: Clustering

Ésta es la clase perfecta para que entiendas cómo funciona cualquier proyecto importante de análisis de datos. Tras tanto tiempo limpiando, transformando nuestros datos, vas a ver lo fácil que es agrupar. O, dicho de otra manera, aplicar técnicas de “clustering”.

En nuestro caso utilizaremos la frecuencia de las palabras para ver lo lejos que están unos documentos (capítulos) de otros. Así, podremos hacer grupos con los que más juntos estén. Y todo esto en muy pocas líneas de código, porque nos aprovecharemos de todo el proceso hasta ahora.

Lo más importante llegados a este punto es tener claro qué queremos analizar y, con ello, qué palabras nos interesa utilizar. Lo que aprenderás en esta clase se utiliza para identificar autores, analizar estilos y un sinfín de cosas. ¡No te la pierdas!