Eu nunca tentei, mas você deve ser capaz de criar um lematizador tcheco Snowball desde que esteja pronto para compilar o PostgreSQL a partir da fonte.
Há uma explicação em
src/backend/snowball/README
:Agora há um lematizador tcheco Snowball disponível aqui , foi contribuído para o projeto. Não há dicionário de palavras de parada disponível, mas tenho certeza que você pode encontrar um ou criar um você mesmo.
O trabalho real seria instalar o Snowball e usar o compilador Snowball-to-C para criar os arquivos C e de cabeçalho para adicionar à fonte do PostgreSQL. Versão do PostgreSQL.
Se você estiver disposto a fazer o trabalho, mas não quiser corrigir o PostgreSQL e compilá-lo sempre a partir do código-fonte, você também pode considerar enviar um patch para o PostgreSQL. Contanto que o lematizador funcione bem, não espero que haja muita resistência lá (mas o processo de envio de patches ainda é tedioso).