Embora eu não tenha certeza do que desencadeia especificamente o problema (parece que uma conexão aberta pode de alguma forma acabar em um estado quebrado no lado do cluster RDS), parece que o problema é exasperado pelo pool de conexão agressivo e reutilizado em o lado do cliente acontecendo no MySQL .NET Connector.
Quando o problema ocorre, as conexões afetadas parecem permanecer no pool, sendo arbitrariamente retiradas do pool e reutilizadas repetidamente. (Provavelmente relacionado a como você vê o problema continuar a ocorrer aleatoriamente depois de iniciado.)
Adicionando
Vida útil da conexão=x
para a cadeia de conexão, x sendo o tempo em segundos que uma conexão é mantida ativa para reutilização, parece, no mínimo, reduzir os sintomas.