PostgreSQL
 sql >> Base de Dados >  >> RDS >> PostgreSQL

Pesquisa de texto completo do Postgresql para o idioma tcheco (sem configuração de idioma padrão)


Eu nunca tentei, mas você deve ser capaz de criar um lematizador tcheco Snowball desde que esteja pronto para compilar o PostgreSQL a partir da fonte.

Há uma explicação em src/backend/snowball/README :

Agora há um lematizador tcheco Snowball disponível aqui , foi contribuído para o projeto. Não há dicionário de palavras de parada disponível, mas tenho certeza que você pode encontrar um ou criar um você mesmo.

O trabalho real seria instalar o Snowball e usar o compilador Snowball-to-C para criar os arquivos C e de cabeçalho para adicionar à fonte do PostgreSQL. Versão do PostgreSQL.

Se você estiver disposto a fazer o trabalho, mas não quiser corrigir o PostgreSQL e compilá-lo sempre a partir do código-fonte, você também pode considerar enviar um patch para o PostgreSQL. Contanto que o lematizador funcione bem, não espero que haja muita resistência lá (mas o processo de envio de patches ainda é tedioso).