Ao testar o Talend com o Easysoft JDBC-ODBC Bridge, observamos corrupção de texto ao gravar dados não ASCII de um banco de dados SQL Server em um arquivo de formato CSV.
A solução alternativa foi alterar o tipo de dados para a coluna do problema no esquema Talend de um
String
para um byte[]
. Para fazer isso, nós:- Acessou as propriedades do componente tJDBCInput.
- Escolha o botão Editar esquema.
- Alterou a definição do tipo de dados para a coluna relevante.
A codificação de caracteres padrão do Talend é UTF-8. Desde que os dados retornados por um driver JDBC sejam ASCII, os dados codificados com uma codificação de caracteres diferente não são um problema:os dados UTF-8 que contêm apenas caracteres ASCII são idênticos aos dados.