Mysql
 sql >> Base de Dados >  >> RDS >> Mysql

Índice de palavras PHP, desempenho e resultados razoáveis


Pegue uma lista de palavras de parada (não-palavras-chave) daqui, o cara até as formatou em php para você.http://armandbrahaj.blog.al/2009/04/14/list-of-english-stop-words/

Em seguida, basta fazer um preg_replace na string que você está indexando.

O que eu fiz no passado foi remover sufixos como 's', 'ed' etc com regex e usar o mesmo regex na string de pesquisa. Não é o ideal embora. Isso foi para um site básico com apenas 200 páginas.

Se você estiver preocupado com o desempenho, considere usar um mecanismo de pesquisa como Lucine (solr) em vez de um banco de dados. Isso tornará a indexação muito mais fácil. Você não quer reinventar a roda aqui.