O erro que você recebe significa que o sagemaker não consegue iniciar sua imagem docker, isso ocorre porque você não definiu corretamente o ponto de entrada. Você pode dar uma olhada em meu repo . Basicamente no seu dockerfile você tem que instalar alguns pacotes, crie uma pasta digamos
/opt/ml/code
e coloque nesta pasta seu script de treinamento que será chamado de train
. O train
arquivo deve respeitar algumas indicações que você pode ler aqui .