Database
 sql >> Base de Dados >  >> RDS >> Database

Trabalhando com dados JDBC não ASCII no Talend


Ao testar o Talend com o Easysoft JDBC-ODBC Bridge, observamos corrupção de texto ao gravar dados não ASCII de um banco de dados SQL Server em um arquivo de formato CSV.

A solução alternativa foi alterar o tipo de dados para a coluna do problema no esquema Talend de um String para um byte[] . Para fazer isso, nós:
  1. Acessou as propriedades do componente tJDBCInput.
  2. Escolha o botão Editar esquema.
  3. Alterou a definição do tipo de dados para a coluna relevante.

A codificação de caracteres padrão do Talend é UTF-8. Desde que os dados retornados por um driver JDBC sejam ASCII, os dados codificados com uma codificação de caracteres diferente não são um problema:os dados UTF-8 que contêm apenas caracteres ASCII são idênticos aos dados.