PostgreSQL
 sql >> Base de Dados >  >> RDS >> PostgreSQL

O Sqoop no Dataproc não pode exportar dados para o formato Avro


O problema pode estar em diferentes versões do Avro no Hadoop do Dataproc (Avro 1.7.7) e Sqoop 1.4.7 (Avro 1.8.1).

Você pode tentar fazer o downgrade do Sqoop para 1.4.6 que depende do Avro 1.7 e usar avro-tools-1.7.7.jar durante o envio do trabalho.

Editado:

Para resolver o problema de carregamento de classe, você precisa definir mapreduce.job.classloader=true ao enviar o job do Dataproc:
gcloud dataproc jobs submit hadoop --cluster=<CLUSTER_NAME> \
    --class=org.apache.sqoop.Sqoop \
    --jars=gs://<BUCKET>/sqoop-1.4.7-hadoop260.jar \
    --properties=mapreduce.job.classloader=true \
    -- \
    . . .