Acabou sendo um problema com o tcp_connect_timeout entre o servidor de aplicativos e o servidor de banco de dados. O tempo limite de conexão do tcp era padrão de 1 hora e minhas configurações de reciclagem do pool eram de 3 horas. Então, qualquer coisa entre 1 e 3 estava falhando. Postando a resposta para ajudar outras pessoas que possam enfrentar isso mais tarde.