Mysql
 sql >> Base de Dados >  >> RDS >> Mysql

MySQL seleciona registros para duplicatas usando várias colunas


Se você quiser contar duplicatas entre várias colunas, use group by :
select ColumnA, ColumnB, ColumnC, count(*) as NumDuplicates
from table
group by ColumnA, ColumnB, ColumnC

Se você deseja apenas os valores duplicados, a contagem é maior que 1. Você obtém isso usando o having cláusula:
select ColumnA, ColumnB, ColumnC, count(*) as NumDuplicates
from table
group by ColumnA, ColumnB, ColumnC
having NumDuplicates > 1

Se você realmente deseja que todas as linhas duplicadas sejam retornadas, junte a última consulta de volta aos dados originais:
select t.*
from table t join
     (select ColumnA, ColumnB, ColumnC, count(*) as NumDuplicates
      from table
      group by ColumnA, ColumnB, ColumnC
      having NumDuplicates > 1
     ) tsum
     on t.ColumnA = tsum.ColumnA and t.ColumnB = tsum.ColumnB and t.ColumnC = tsum.ColumnC

Isso funcionará, supondo que nenhum dos valores da coluna seja NULL. Se sim, tente:
     on (t.ColumnA = tsum.ColumnA or t.ColumnA is null and tsum.ColumnA is null) and
        (t.ColumnB = tsum.ColumnB or t.ColumnB is null and tsum.ColumnB is null) and
        (t.ColumnC = tsum.ColumnC or t.ColumnC is null and tsum.ColumnC is null)

EDITAR:

Se você tiver NULL valores, você também pode usar o NULL -operador seguro:
     on t.ColumnA <=> tsum.ColumnA and
        t.ColumnB <=> tsum.ColumnB and
        t.ColumnC <=> tsum.ColumnC