Stop Word en MySql

El concepto de Stop Word hace referencia al conjunto de palabras que no son relevantes en un texto y son muy frecuentes. En este grupo se encuentran las presposiciónes, artículos, determinantes… etc.

Cuando se desea realizar búsquedas sobre textos en MySql, el primer pensamiento suele ser emplear el operador Like, pero esto es desaconsejable en la mayoría de los casos debido a lo ineficiente del mismo. Para ver si determinadas palabras pertenecen a un texto, lo aconsejable es incorporar a nuestra tabla un índice tipo Full Text que permite a MySql montar estructuras de información adecuadas para realizar búsquedas de términos. Este tipo de índice emplea las Stop Word para eliminar términos innecesarios que no aportan nada al texto. MySql dispone de una lista de Stop Word por defecto. Si queremos configurarla a nuetra medida, podemos cargar una de la siguiente manera:

mysqld --ft_stopword_file=stopword.txt

Recursos:

— Lista de Stop Word en varios idiomas.

Índices Full Text en MySql a fondo. (Muy interesante)

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: