MongoDB
 sql >> Base de Dados >  >> NoSQL >> MongoDB

Pesquisa de texto completo e parcial do MongoDB


Como no MongoDB 3.4, o recurso de pesquisa de texto foi projetado para oferecer suporte a pesquisas que não diferenciam maiúsculas de minúsculas em conteúdo de texto com regras específicas de idioma para palavras irrelevantes e lematização. As regras de ramificação para idiomas suportados são baseadas em algoritmos padrão que geralmente lidam com verbos e substantivos comuns, mas desconhecem nomes próprios.

Não há suporte explícito para correspondências parciais ou difusas, mas os termos que levam a um resultado semelhante podem parecer estar funcionando como tal. Por exemplo:"gosto", "gosto" e bom gosto, todos derivam de "gosto". Experimente a página de demonstração de derivação do Snowball para experimentar mais palavras e algoritmos de derivação.

Seus resultados correspondentes são todos variações da mesma palavra "LEONEL" e variam apenas por maiúsculas e minúsculas e diacríticos. A menos que "LEONEL" possa ser reduzido a algo mais curto pelas regras do idioma selecionado, esse é o único tipo de variação que corresponderá.

Se você quiser fazer correspondências parciais eficientes, precisará adotar uma abordagem diferente. Para algumas ideias úteis, consulte:
  • Técnicas eficientes para correspondência difusa e parcial no MongoDB por John Page
  • Pesquisas parciais de palavras-chave eficientes por James Tan

Há uma solicitação de melhoria relevante que você pode assistir/votar no rastreador de problemas do MongoDB:SERVER-15090:Melhore os índices de texto para dar suporte à correspondência parcial de palavras.