Mysql
 sql >> Base de Dados >  >> RDS >> Mysql

Texto em bengali não exibido no arquivo Unicode CSV


De acordo com as respostas à pergunta Excel para CSV com codificação UTF8 , o Google Docs deve salvar CSV corretamente, ao contrário do Excel, que destrói todos os caracteres que não são representáveis ​​na codificação “ANSI” que está sendo usada. Mas talvez eles tenham mudado isso, ou algo errado, ou a análise da situação esteja incorreta.

Para Bangla (Bengali) codificado corretamente processado em programas do MS Office, não deve haver necessidade de nenhuma “fonte Bangla”, pois a fonte Arial Unicode MS (enviada com o Office) contém os caracteres Bangla. Então, os dados estão realmente em alguma codificação fora do padrão que depende de uma fonte especialmente codificada? Nesse caso, ele deve primeiro ser convertido para Unicode, embora possivelmente possa ser gerenciado de alguma forma usando programas que usam consistentemente essa fonte específica.

No Excel, ao usar Salvar como, você pode selecionar “Texto Unicode (*.txt)”. Ele salva os dados como TSV (valores separados por tabulação) na codificação UTF-16. Você pode precisar convertê-lo para usar vírgula como separador em vez de tabulação e/ou de UTF-16 para UTF-8. Mas isso só funciona se os dados originais estiverem codificados corretamente.