Excluir funcionalidade com o dataframe do Spark sql

Se você deseja modificar (excluir registros) a fonte real de dados, ou seja, tabelas no postgres, o Spark não seria uma ótima maneira. Você pode usar o cliente jdbc diretamente para obter o mesmo.

Se você quiser fazer isso de qualquer maneira (de maneira distribuída com base em algumas pistas que você está computando como parte de dataframes); você pode ter o mesmo código do cliente jdbc escrito em correspondência com o dataframe que possui informações de lógica/gatilho para excluir registros e que podemos executar em vários trabalhadores paralelamente.

Como alterar o comportamento de classificação nula padrão do PostgreSQL no Django ORM

Pl/pgSQL não há parâmetro $1 na instrução EXECUTE

Seu guia definitivo para SQL Join:CROSS JOIN – Parte 3
Soluções de desafio do gerador de série de números - Parte 5
Surpresas e suposições de desempenho:SET NOCOUNT ON
Relacionamentos MySQL