Oracle
 sql >> Base de Dados >  >> RDS >> Oracle

Qualquer coisa errada com o uso do windows-1252 em vez de UTF-8


O Windows 1252 é um dos muitos conjuntos de caracteres de tamanho fixo. O Mac tem seu próprio conjunto. existem algumas ISO para várias partes da Europa e para algumas outras partes do mundo. A maioria deles tem pequenas variações.

O ponto positivo é que você tem um caractere de tamanho fixo, ou seja, 1 caractere =1 byte, não importa o quê.

Os pontos ruins são:
  • Algumas pessoas podem não ter sua codificação instalada
  • Algumas pessoas podem usar uma codificação ligeiramente diferente, resultando em muito poucos problemas, não óbvios de ver, mas muito feios a longo prazo
  • Você só pode oferecer suporte a alguns idiomas

Isso inclui qualquer citação que você gostaria de fazer. No windows-1252 você não pode exibir russo, grego, polonês ...

UTF-8 é a codificação padrão para representação unicode em 1+ bytes. Ele pode representar uma grande maioria dos caracteres que você pode encontrar, embora seja projetado para idiomas baseados em latim, pois outros idiomas ocupam mais espaço de armazenamento.

É usado em XML, JSON e na maioria dos tipos de serviços da Web que você pode encontrar. É um bom padrão quando você não sabe qual codificação usar. Ele permite limitar o número de problemas de codificação, como "Eu pensei que você estivesse em Latin-1 / Não, eu estava usando latin-9, mas esse cara no mac usava Roman". Se você tiver mais de 1 pessoa trabalhando no conteúdo do site, elas podem ter codificações diferentes em seu plateforme e, portanto, seu conteúdo pode ficar confuso em algum momento.

UTF-8 é, até onde eu sei, a única maneira de padronizar facilmente a codificação usada entre as pessoas sem discussão.

Um exemplo típico é que, se o seu site estiver codificado em windows1252 e o novo desenvolvedor tiver um mac, você provavelmente terá problemas.