Database
 sql >> Base de Dados >  >> RDS >> Database

Por que vários JOINs são ruins para consulta ou não atrapalham o otimizador


Recentemente, me deparei com um aplicativo que gerava consultas de banco de dados. Entendo que não há nada de novo nisso, mas quando o aplicativo começou a ficar lento e tive que descobrir o motivo da lentidão, fiquei surpreso ao encontrar essas consultas. Aqui está o que o SQL Server às vezes tem que lidar:
SELECT COUNT(DISTINCT "pr"."id") FROM  ((((((((((((((((("SomeTable" "pr"
LEFT OUTER JOIN "SomeTable1698" "uf_pr_id_698" ON "uf_pr_id_698"."request" = "pr"."id") 
LEFT OUTER JOIN "SomeTable1700" "ufref3737_i2" ON "ufref3737_i2"."request" = "pr"."id") 
LEFT OUTER JOIN "SomeTable1666" "x0" ON "x0"."request" = "ufref3737_i2"."f6_callerper")
LEFT OUTER JOIN "SomeTable1666" "uf_ufref4646_i3_f58__666" ON "uf_ufref4646_i3_f58__666"."request" = "ufref3737_i2"."f58_")
LEFT OUTER JOIN "SomeTable1694" "x1" ON "x1"."request" = "ufref3737_i2"."f38_servicep")
LEFT OUTER JOIN "SomeTable3754" "ufref3754_i12" ON "pr"."id" = "ufref3754_i12"."request")
LEFT OUTER JOIN "SomeTable1698" "uf_ufref3754_i12_reference_698" ON "uf_ufref3754_i12_reference_698"."request" = "ufref3754_i12"."reference")
LEFT OUTER JOIN "SomeTable1698" "x2" ON "x2"."request" = "ufref3737_i2"."f34_parentse")
LEFT OUTER JOIN "SomeTable4128" "ufref3779_4128_i14" ON "ufref3737_i2"."f34_parentse" = "ufref3779_4128_i14"."request")
LEFT OUTER JOIN "SomeTable1859" "x3" ON "x3"."request" = "ufref3779_4128_i14"."reference")
LEFT OUTER JOIN "SomeTable3758" "ufref3758_i15" ON "pr"."id" = "ufref3758_i15"."request")
LEFT OUTER JOIN "SomeTable1698" "uf_ufref3758_i15_reference_698" ON "uf_ufref3758_i15_reference_698"."request" = "ufref3758_i15"."reference")
LEFT OUTER JOIN "SomeTable3758" "ufref3758_i16" ON "pr"."id" = "ufref3758_i16"."request")
LEFT OUTER JOIN "SomeTable4128" "ufref3758_4128_i16" ON "ufref3758_i16"."reference" = "ufref3758_4128_i16"."request")
LEFT OUTER JOIN "SomeTable1859" "x4" ON "x4"."request" = "ufref3758_4128_i16"."reference")
LEFT OUTER JOIN "SomeTable4128" "ufref4128_i17" ON "pr"."id" = "ufref4128_i17"."request")
LEFT OUTER JOIN "SomeTable1859" "uf_ufref4128_i17_reference_859" ON "uf_ufref4128_i17_reference_859"."request" = "ufref4128_i17"."reference")
LEFT OUTER JOIN "SomeTable1666" "uf_ufref4667_i25_f69__666" ON "uf_ufref4667_i25_f69__666"."request" = "uf_pr_id_698"."f69_"
WHERE ("uf_pr_id_698"."f1_applicant" IN (248,169,180,201,203,205,209,215,223,357,371,379,3502,3503,3506,3514,3517,3531,3740,3741)
OR "x0"."f24_useracco" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136)
OR "uf_ufref4646_i3_f58__666"."f24_useracco" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136)
OR "uf_ufref4667_i25_f69__666"."f24_useracco" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136)
OR ("uf_pr_id_698"."f10_status" Is Null OR "uf_pr_id_698"."f10_status" <> 111)  AND "ufref3737_i2"."f96_" = 0   AND (("ufref3737_i2"."f17_source"  Is Null OR "ufref3737_i2"."f17_source"  <> 566425)
AND ("ufref3737_i2"."f17_source"  Is Null OR "ufref3737_i2"."f17_source"  <> 566424)  OR ("uf_pr_id_698"."f10_status" Is Null OR "uf_pr_id_698"."f10_status" <> 56) )
AND ("uf_pr_id_698"."f12_responsi" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136)
OR "x1"."f19_restrict" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136)
OR "uf_ufref3754_i12_reference_698"."f12_responsi" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136)
OR "x2"."f12_responsi" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136)
OR "x3"."f5_responsib" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136) 
OR "uf_ufref3758_i15_reference_698"."f12_responsi" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136) 
OR "x4"."f5_responsib" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136)
OR "uf_ufref4128_i17_reference_859"."f5_responsib" IN (578872,564618,565084,566420,566422,566936,567032,567260,567689,579571,580813,594452,611522,611523,615836,621430,628371,633044,634132,634136))
AND ("uf_pr_id_698"."f12_responsi"  Is Null OR "uf_pr_id_698"."f12_responsi"  <> 579420)  ) AND "pr"."area" IN (700) AND "pr"."area" IN (700) AND "pr"."deleted_by_user"=0 AND "pr"."temporary" = 0

Os nomes dos objetos foram alterados.

O mais impressionante foi que a mesma tabela foi usada várias vezes, e o número de parênteses simplesmente me deixou louco. Não fui o único que não gostou desse código, o SQL Server também não gostou e gastou muitos recursos para construir um plano para ele. A consulta pode ser executada por 50 a 150 ms e a criação do plano pode levar até 2,5 ms. Hoje, não considerarei as formas de corrigir o problema, mas direi uma coisa – no meu caso, foi impossível corrigir a geração de consultas no aplicativo.

Em vez disso, gostaria de analisar os motivos pelos quais o SQL Server cria o plano de consulta por tanto tempo. Em qualquer SGBD, incluindo SQL Server, o principal problema de otimização é o método de união de tabelas entre si. Além do método de junção, a sequência de junções de tabelas é muito importante.

Vamos falar sobre a sequência de junções de tabelas em detalhes. É muito importante entender que o número possível de junções de tabelas cresce exponencialmente, não linearmente. Fox exemplo, existem apenas 2 métodos possíveis para juntar 2 tabelas, e o número pode chegar a 12 métodos para 3 tabelas. Diferentes sequências de junção podem ter diferentes custos de consulta e o otimizador do SQL Server deve selecionar o método mais ideal. Mas quando o número de tabelas é alto, torna-se uma tarefa que consome muitos recursos. Se o SQL Server começar a passar por todas as variantes possíveis, tal consulta pode nunca ser executada. É por isso que o SQL Server nunca faz isso e sempre procura um plano muito bom, não o melhor plano. O SQL Server sempre tenta chegar a um compromisso entre o tempo de execução e a qualidade do plano.

Aqui está um exemplo do crescimento exponencial dos métodos de junção. O SQL Server pode selecionar vários métodos de junção (árvores profundas à esquerda, à direita e espessas). Visualmente, fica da seguinte maneira:



A tabela abaixo mostra os métodos de junção possíveis quando o número de tabelas aumenta:



Você pode obter esses valores por conta própria:

Para fundo à esquerda: 5! =5 x 4 x 3 x 2 x 1 =120

Para árvore espessa: (2n–2)!/(n–1)!

Conclusão :Preste atenção especial ao número de JOINs e não atrapalhe com o otimizador. Se você não conseguir obter o resultado desejado na consulta contendo vários JOINs, divida-o em várias pequenas consultas e ficará surpreso com o resultado.

P.S. Claro, devemos entender que além de definir uma sequência de junções de tabelas, o otimizador de consultas também deve selecionar o tipo de junção, o método de acesso aos dados (Scan, Seek) etc.


Produtos úteis:


SQL Complete – escreva, embeleze, refatore seu código facilmente e aumente sua produtividade.