Se
b
é anulável, isso não é um bug. O problema é que o SQL Server transforma NOT IN
em uma série de <> 1 AND <> 2 AND <> 3
etc. Se você tiver <> NULL
, que retorna desconhecido, que neste caso significa falso. Em diferentes cenários, isso pode qualificar ou desqualificar TODOS linhas. Em vez do LEFT JOIN
abordagem, você deve dizer:FROM dbo.OuterTable AS t
WHERE NOT EXISTS (SELECT 1 FROM x WHERE b = t.a);
Aqui está uma demonstração rápida:
DECLARE @x TABLE(i INT);
INSERT @x VALUES(1),(2);
DECLARE @y TABLE(j INT);
INSERT @y VALUES(2),(NULL);
SELECT i FROM @x WHERE i NOT IN -- produces zero results
(SELECT j FROM @y);
SELECT i FROM @x AS x WHERE NOT EXISTS -- produces one result
(SELECT 1 FROM @y WHERE j = x.i);
Para muito mais detalhes (e métricas para provar por que
NOT EXISTS
é a melhor alternativa):http://www.sqlperformance.com /2012/12/t-sql-queries/left-anti-semi-join
Além disso, leia esta postagem no blog de Gail Shaw:
http://sqlinthewild. co.za/index.php/2010/02/18/not-exists-vs-not-in/