PostgreSQL

sql >> Base de Dados > >> RDS >> PostgreSQL

Verifique se há linhas duplicadas completas em uma tabela grande

Para descobrir se algum existe duplicata completa (idêntica em todas as colunas), esta é provavelmente a maneira mais rápida:

SELECT EXISTS (
    SELECT 1
    FROM   tbl t
    NATURAL JOIN tbl t1 
    WHERE  t.ctid <> t1.ctid
    )

UNIÇÃO NATURAL é uma abreviação muito conveniente para o caso porque (citando o manual aqui ):

EXISTS


 é provavelmente o mais rápido, porque o Postgres para de pesquisar assim que a primeira duplicata é encontrada. Como você provavelmente não tem um índice cobrindo toda a linha e sua tabela é enorme, isso economizará muito de tempo. 
 
 Esteja ciente de que NULL  é nunca considerado idêntico a outro NULL . Se você tiver NULL valores e considerá-los idênticos, você teria que fazer mais. 
 
 ctid é uma coluna do sistema
 que pode ser (ab-)usado como chave primária ad-hoc, mas não pode substituir uma chave primária real definida pelo usuário a longo prazo. 
 
 A versão desatualizada 8.1 parece não ter <> operador definido para um ctid . Tente transmitir para text :
 SELECT EXISTS (
    SELECT 1
    FROM   tbl t
    NATURAL JOIN tbl t1 
    WHERE  t.ctid::text <> t1.ctid::text
    )



            
                
                    
                    
                    Como posso criar um tipo de coluna personalizado com Typesafe Slick em Scala?    
                          
                
                
                
                    
                    O tamanho do banco de dados PostgreSQL é menor após o backup/carregamento no Heroku     
                    
                
             

             
                

                
             

             
                



                        
                            
                        
        
                        
                            
                                O SendGrid para PHP é lento. As solicitações sem bloqueio são possíveis? 
                            
                        
                    

                        
                            
                        
        
                        
                            
                                Modelagem de banco de dados para fins internacionais e multilíngues 
                            
                        
                    

                        
                            
                        
        
                        
                            
                                Como criar um campo calculado no Access 
                            
                        
                    

                        
                            
                        
        
                        
                            
                                Duas tabelas com as mesmas colunas ou uma tabela com coluna adicional?




        

        
            
            
                
                    
                    Compartilhar
                
                 
                    
                    
                    
                    
                
            

            
                
                    Database
  Mysql
  Oracle
  Sqlserver
  PostgreSQL
  Access
  SQLite
  MariaDB 


                
            


            
                
                    
                       

 
                            
                               
                            
                            
                                
                                    O tipo que chega ao nível 15.000                                 
                            
                        
    
                        
                                                     			




                                
                                    
                                       django.db.utils.OperationalError Não foi possível conectar ao servidor                                     
                                
                            




                                
                                    
                                       A consulta do Postgres é muito lenta com current_date::date em vez de data codificada                                     
                                
                            




                                
                                    
                                       Como converter um banco de dados postgres para sqlite                                     
                                
                            




                                
                                    
                                       Iterando sobre integer[] em PL/pgSQL                                     
                                
                            




                                
                                    
                                       Selecionando colunas com DISTINCT no PostgreSQL                                     
                                
                            




                                
                                    
                                       Como unir duas subconsultas em SQLAlchemy e postgresql



    
        
            
                
            

                © DIREITOS AUTORAIS
                https://pt.sqldat.com
                TODOS OS DIREITOS RESERVADOS