
Curso de text-mining literario con R #07: Tf-idf
La document-term matrix que creamos en la clase anterior nos servía para contextualizar la frecuencia de cada palabra en cada documento o capítulo, pero ¿cómo sabemos si eso es importante o no?
Por supuesto, podríamos hacer un análisis “a ojo”, pero nos llevaría horas y el resultado no sería precisamente muy fiable. Para ello, aplicaremos unas operaciones matemáticas sencillas y así tendremos números que nos avalen (o desmientan) las teorías.
En cualquier caso, estaremos consiguiendo información de valor.