El concepto de Stop Word hace referencia al conjunto de palabras que no son relevantes en un texto y son muy frecuentes. En este grupo se encuentran las presposiciónes, artículos, determinantes… etc.
Cuando se desea realizar búsquedas sobre textos en MySql, el primer pensamiento suele ser emplear el operador Like, pero esto es desaconsejable en la mayoría de los casos debido a lo ineficiente del mismo. Para ver si determinadas palabras pertenecen a un texto, lo aconsejable es incorporar a nuestra tabla un índice tipo Full Text que permite a MySql montar estructuras de información adecuadas para realizar búsquedas de términos. Este tipo de índice emplea las Stop Word para eliminar términos innecesarios que no aportan nada al texto. MySql dispone de una lista de Stop Word por defecto. Si queremos configurarla a nuetra medida, podemos cargar una de la siguiente manera:
mysqld --ft_stopword_file=stopword.txt
Recursos:
– Lista de Stop Word en varios idiomas.
– Índices Full Text en MySql a fondo. (Muy interesante)
No Comments Yet