Sqlserver
 sql >> Base de Dados >  >> RDS >> Sqlserver

Dados de idioma japonês/chinês na tabela do SQL Server


A ordenação afeta apenas a ordem de classificação, não a codificação. Você precisa determinar qual é a codificação do seu conteúdo chinês e japonês (consulte isto ). Se não for UCS-2, você tem um problema (já que não pode suportar várias codificações de página simultaneamente). Se for UCS-2, você precisa ter certeza de que a codificação da sua página ASP também está definida como UTF-8 (e que o navegador reconhece isso configurando corretamente a codificação como UTF-8 - consulte Exibir/Codificação).

Ou em termos mais simples:se o aplicativo que criou o conteúdo não usou caracteres Unicode, você terá que alternar a codificação da página se alternar entre caracteres chineses, japoneses e europeus.

Se você tiver codificado corretamente o conteúdo Unicode em seu banco de dados e usar a codificação UTF-8 em suas páginas, não deverá ter problemas com a exibição de caracteres especiais (desde que use uma fonte Unicode na página):
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Percebo que desite de várias edições não estou sendo muito claro, então deixe-me adicionar algumas noções básicas.

Um conjunto de caracteres é uma representação padronizada de um conjunto de caracteres (por exemplo, ASCII, UNICODE, ...).

A codificação de caracteres é a representação binária usada para armazenar caracteres de um determinado conjunto de caracteres. ASCII tem sua própria codificação. Unicode, que é um conjunto de caracteres muito grande projetado para suportar todos os caracteres existentes, possui várias codificações (UTF-8, UTF-16, UCS-2, ...).

Somente o Unicode oferece a capacidade de oferecer suporte a conteúdo ocidental e do extremo oriente ao mesmo tempo com as mesmas configurações de banco de dados e aplicativos. Existem, no entanto, conjuntos de caracteres mais antigos para os idiomas chinês e japonês que não são Unicode. Se o seu conteúdo não for Unicode (BIG 5, por exemplo), você não poderá exibi-lo em uma página da Web codificada em UTF-8.

Isso pode se tornar complicado se o aplicativo que criou o conteúdo usou uma codificação (por exemplo, BIG-5) e o banco de dados o armazenou como dados Unicode. Se isso acontecer, as informações podem ter sido perdidas.

Você ainda precisa instalar os pacotes de idiomas correspondentes no Windows para ver os caracteres corretamente. Infelizmente, problemas de codificação não são simples de diagnosticar.