Sqlserver
 sql >> Base de Dados >  >> RDS >> Sqlserver

Erro de importação de arquivo CSV:valor da coluna contendo delimitador de coluna


Uma palavra de advertência:eu não sou um codificador C# regular.

Mas de qualquer forma este código faz o seguinte:

Ele abre um arquivo chamado C:\Input.TXT

Ele pesquisa cada linha. Se a linha tiver mais de 5 vírgulas, todas as vírgulas extras serão retiradas do penúltimo campo (notas)

Ele grava o resultado em C:\Output.TXT - é o que você precisa importar

Há muitas melhorias que podem ser feitas:
  • Obter caminhos de arquivo de gerenciadores de conexões
  • Tratamento de erros
  • Um programador C# experiente provavelmente poderia fazer isso em hlaf o código

Lembre-se de que seu pacote precisará de acesso de gravação à pasta apropriada
public void Main()
{
    // Search the file and remove extra commas from the third last field
    // Extended from code at
    // http://stackoverflow.com/questions/1915632/open-a-file-and-replace-strings-in-c-sharp
    // Nick McDermaid        

    string sInputLine;
    string sOutputLine;
    string sDelimiter = ",";
    String[] sData;
    int iIndex;

    // open the file for read
    using (System.IO.FileStream inputStream = File.OpenRead("C:\\Input.txt"))
    {
        using (StreamReader inputReader = new StreamReader(inputStream))
        {
            // open the output file
            using (StreamWriter outputWriter = File.AppendText("C:\\Output.txt"))
            {
                // Read each line
                while (null != (sInputLine = inputReader.ReadLine()))
                {
                    // Grab each field out
                    sData = sInputLine.Split(sDelimiter[0]);
                    if (sData.Length <= 6)
                    {
                        // 6 or less fields - just echo it out
                        sOutputLine = sInputLine;
                    }
                    else
                    {
                        // line has more than 6 pieces 
                        // We assume all of the extra commas are in the notes field                                

                        // Put the first three fields together
                        sOutputLine =
                            sData[0] + sDelimiter +
                            sData[1] + sDelimiter +
                            sData[2] + sDelimiter;

                        // Put the middle notes fields together, excluding the delimiter
                        for (iIndex=3; iIndex <= sData.Length - 3; iIndex++)
                        {
                            sOutputLine = sOutputLine + sData[iIndex] + " ";
                        }

                        // Tack on the last two fields
                        sOutputLine = sOutputLine +
                            sDelimiter + sData[sData.Length - 2] +
                            sDelimiter + sData[sData.Length - 1];


                    }

                    // We've evaulted the correct line now write it out
                    outputWriter.WriteLine(sOutputLine);
                }
            }
        }
    }


    Dts.TaskResult = (int)Microsoft.SqlServer.Dts.Runtime.DTSExecResult.Success;
}