在JOIN和WHERE中过滤查询的区别?

问题描述 投票:25回答:3

在SQL中,我试图根据ID过滤结果,并想知道它们之间是否存在任何逻辑差异

SELECT value 
FROM table1 
JOIN table2 ON table1.id = table2.id 
WHERE table1.id = 1

SELECT value 
FROM table1 
JOIN table2 ON table1.id = table2.id AND table1.id = 1

对我来说,似乎逻辑是不同的虽然你总会得到相同的结果集,但我想知道是否有任何条件可以得到两个不同的结果集(或者它们总是返回完全相同的两个结果集) )

sql join where resultset
3个回答
39
投票

答案没有区别,但是:

我总是喜欢这样做。

  • 始终在ON子句中保留连接条件
  • 始终将过滤器放在where子句中

这使查询更具可读性。

所以我将使用此查询:

SELECT value
FROM table1
INNER JOIN table2
        ON table1.id = table2.id
WHERE table1.id = 1

但是当你使用OUTER JOIN'S时,将滤波器保持在ON状态和Where状态有很大的不同。

逻辑查询处理

以下列表包含查询的一般形式,以及根据逻辑处理不同子句的顺序分配的步骤编号。

(5) SELECT (5-2) DISTINCT (5-3) TOP(<top_specification>) (5-1) <select_list>
(1) FROM (1-J) <left_table> <join_type> JOIN <right_table> ON <on_predicate>
| (1-A) <left_table> <apply_type> APPLY <right_table_expression> AS <alias>
| (1-P) <left_table> PIVOT(<pivot_specification>) AS <alias>
| (1-U) <left_table> UNPIVOT(<unpivot_specification>) AS <alias>
(2) WHERE <where_predicate>
(3) GROUP BY <group_by_specification>
(4) HAVING <having_predicate>
(6) ORDER BY <order_by_list>;

流程图逻辑查询处理

Enter image description here

  • (1)FROM:FROM阶段标识查询的源表和进程表运算符。每个表运算符都应用一系列子阶段。例如,连接中涉及的阶段是(1-J1)笛卡尔积,(1-J2)ON滤波器,(1-J3)添加外行。 FROM阶段生成虚拟表VT1。
  • (1-J1)笛卡尔积:此阶段在表运算符中涉及的两个表之间执行笛卡尔积(交叉连接),生成VT1-J1。
  • (1-J2)ON过滤器:此阶段根据ON子句中出现的谓词(<on_predicate>)过滤VT1-J1中的行。只有谓词计算为TRUE的行才会插入到VT1-J2中。
  • (1-J3)添加外行:如果指定了OUTER JOIN(与CROSS JOIN或INNER JOIN相反),则保留的一个或多个未找到匹配项的表中的行将作为外部添加到VT1-J2的行中行,生成VT1-J3。
  • (2)WHERE:此阶段根据WHERE子句()中出现的谓词过滤VT1中的行。只有谓词计算为TRUE的行才会插入到VT2中。
  • (3)GROUP BY:此阶段根据GROUP BY子句中指定的列列表将VT2中的行排列成组,生成VT3。最终,每组将有一个结果行。
  • (4)HAVING:此阶段根据HAVING子句(<having_predicate>)中出现的谓词过滤VT3中的组。只有谓词计算为TRUE的组才会插入到VT4中。
  • (5)SELECT:该阶段处理SELECT子句中的元素,生成VT5。
  • (5-1)计算表达式:此阶段评估SELECT列表中的表达式,生成VT5-1。
  • (5-2)DISTINCT:此阶段从VT5-1中删除重复行,生成VT5-2。
  • (5-3)TOP:此阶段根据ORDER BY子句定义的逻辑顺序过滤VT5-2中指定的最大行数或行百分比,生成表VT5-3。
  • (6)ORDER BY:该阶段根据ORDER BY子句中指定的列列表对VT5-3中的行进行排序,生成游标VC6。

它来自this excellent link


12
投票

虽然使用INNER JOINS没有区别,正如VR46指出的那样,当使用OUTER JOINS并评估第二个表中的值时(对于左连接 - 右连接的第一个表),存在显着差异。请考虑以下设置:

DECLARE @Table1 TABLE ([ID] int)
DECLARE @Table2 TABLE ([Table1ID] int, [Value] varchar(50))

INSERT INTO @Table1
VALUES
(1),
(2),
(3)

INSERT INTO @Table2
VALUES
(1, 'test'),
(1, 'hello'),
(2, 'goodbye')

如果我们使用左外连接从中选择并在where子句中放入一个条件:

SELECT * FROM @Table1 T1
LEFT OUTER JOIN @Table2 T2
    ON T1.ID = T2.Table1ID
WHERE T2.Table1ID = 1

我们得到以下结果:

ID          Table1ID    Value
----------- ----------- --------------------------------------------------
1           1           test
1           1           hello

这是因为where子句限制了结果集,因此我们只包含table1中ID为1的记录。但是,如果我们将条件移动到on子句:

SELECT * FROM @Table1 T1
LEFT OUTER JOIN @Table2 T2
    ON T1.ID = T2.Table1ID
    AND T2.Table1ID = 1

我们得到以下结果:

ID          Table1ID    Value
----------- ----------- --------------------------------------------------
1           1           test
1           1           hello
2           NULL        NULL
3           NULL        NULL

这是因为我们不再通过table1的ID为1过滤结果集 - 而是我们过滤JOIN。因此,即使table1的ID为2 DOES在第二个表中有匹配,它也会从连接中排除 - 但不是结果集(因此为空值)。

因此,对于内连接并不重要,但是为了可读性和一致性,您应该将它保留在where子句中。但是,对于外连接,您需要注意,放置条件的位置很重要,因为它会影响结果集。


3
投票

我认为答案标记为“正确”是不对的。为什么?我试着解释一下:

我们有意见

“始终将连接条件保留在ON子句中始终将过滤器放在where子句中”

这是错误的。如果你在内连接中,每次都将过滤器参数放在ON子句中,而不是放在哪里。你问为什么?尝试使用复杂的WHERE子句(例如,使用的函数或计算)来计算复杂查询,总共有10个表(例如,每个表有10k recs)连接。如果在ON子句中放置过滤条件,则不会在这10个表之间发生JOINS,WHERE子句根本不会执行。在这种情况下,您不在WHERE子句中执行10000 ^ 10计算。这是有道理的,不仅仅在WHERE子句中使用过滤参数。

© www.soinside.com 2019 - 2024. All rights reserved.