PostgreSQL
 sql >> Base de Dados >  >> RDS >> PostgreSQL

Postgresql regex para corresponder a maiúsculas, com reconhecimento de Unicode


O mecanismo regexp do PG 9.1 e versões anteriores não classifica corretamente os caracteres cujo codepoint não cabe em um byte. O codepoint de 'Ó' sendo 211, acerta, mas o codepoint de 'Ą' é 260, além de 255.

O PG 9.2 é melhor nisso, embora ainda não esteja 100% correto para todos os alfabetos. Veja este commit no código-fonte do PostgreSQL, e particularmente nestas partes do comentário:

e

Infelizmente, isso não foi retroportado para 9.1