Curso de text-mining literario con R #07: Tf-idf

Curso de text-mining literario con R #08: Clustering

Curso de text-mining literario con R #09: Correlaciones

Ésta es la clase perfecta para que entiendas cómo funciona cualquier proyecto importante de análisis de datos. Tras tanto tiempo limpiando, transformando nuestros datos, vas a ver lo fácil que es agrupar. O, dicho de otra manera, aplicar técnicas de “clustering”.

En nuestro caso utilizaremos la frecuencia de las palabras para ver lo lejos que están unos documentos (capítulos) de otros. Así, podremos hacer grupos con los que más juntos estén. Y todo esto en muy pocas líneas de código, porque nos aprovecharemos de todo el proceso hasta ahora.

Lo más importante llegados a este punto es tener claro qué queremos analizar y, con ello, qué palabras nos interesa utilizar. Lo que aprenderás en esta clase se utiliza para identificar autores, analizar estilos y un sinfín de cosas. ¡No te la pierdas!

Clases disponibles (10 de 10)

play_circle

Curso de text-mining literario con R #08: Clustering

Clases disponibles (10 de 10)

Curso de text-mining literario con R #01: Introducción

Curso de text-mining literario con R #02: Descarga de novelas

Curso de text-mining literario con R #03: Preparación de los datos

Curso de text-mining literario con R #04: Frecuencias de palabras

Curso de text-mining literario con R #05: Posiciones de palabras

Curso de text-mining literario con R #06: Document.term matrix

Curso de text-mining literario con R #07: Tf-idf

Curso de text-mining literario con R #08: Clustering

Curso de text-mining literario con R #09: Correlaciones

Curso de text-mining literario con R #10: Análisis temático

Tu privacidad es importante

Personalizar preferencias de cookies