O problema pode estar em diferentes versões do Avro no Hadoop do Dataproc (Avro 1.7.7) e Sqoop 1.4.7 (Avro 1.8.1).
Você pode tentar fazer o downgrade do Sqoop para 1.4.6 que depende do Avro 1.7 e usar
avro-tools-1.7.7.jar
durante o envio do trabalho. Editado:
Para resolver o problema de carregamento de classe, você precisa definir
mapreduce.job.classloader=true
ao enviar o job do Dataproc:gcloud dataproc jobs submit hadoop --cluster=<CLUSTER_NAME> \
--class=org.apache.sqoop.Sqoop \
--jars=gs://<BUCKET>/sqoop-1.4.7-hadoop260.jar \
--properties=mapreduce.job.classloader=true \
-- \
. . .