在T-SQL中将大型表上的子查询关联起来的最有效方法是什么?

问题描述 投票:0回答:2

我有一个表,其中包含机器销售的制造商,型号,序列号和发票日期,我想将其与包含品牌,序列号,记录用量,使用单位和记录日期的表配对 - 除了用法/记录表是HUUUUUUGE,可能没有每台机器的记录。

我尝试编写OUTER JOIN,但是Usage / Records表中的数据太多,无法有效运行。我试着写一个CROSS APPLY,但我一定搞砸了,因为这似乎也没有效果。

文件示例:

我的基本查询:

Inv. Date      Mk      Model      Serial
2019-03-29     AA      420D       0FDP09999
2019-03-21     AA      A19B-SSL   0DX240481

用法/记录表:

Mk      Serial      Usage      Units      Record Date
AA      0FDP09999   2345.0     H          2019-03-27
AA      0FDP09999   2349.2     H          2019-03-28
AA      0FDP09999   2351.8     H          2019-03-29
AA      0DX240481   0.0        H          2019-03-21
AA      0DX240481   24.0       H          2019-03-22

输出应该是:

Inv. Date      Mk      Model      Serial      Usage      Units      Record Date
2019-03-29     AA      420D       0FDP09999   2351.8     H          2019-03-29
2019-03-21     AA      A19B-SSL   0DX240481   0.0        H          2019-03-21

...仅返回发票日期之前的最新条目的使用情况,单位和记录日期。

有什么建议?

sql-server tsql correlated-subquery
2个回答
1
投票

你可以试试左连接和row_number()

SELECT t1.[Inv. Date],
       t1.[Mk],
       t1.[Model],
       t1.[Serial],
       t2.[Usage],
       t2.[Units],
       t2.[Record Date]
       FROM (SELECT t1.[Inv. Date],
                    t1.[Mk],
                    t1.[Model],
                    t1.[Serial],
                    t2.[Usage],
                    t2.[Units],
                    t2.[Record Date],
                    row_number() OVER (PARTITION BY t1.[Inv. Date]
                                       ORDER BY t2.[Record Date] DESC) rn
                    FROM table1 t1
                         LEFT JOIN table2 t2
                                   ON t2.[Mk] = t1.[Mk]
                                      AND t2.[Serial] = t1.[Serial]
                                      AND t2.[Record Date] <= t1.[Inv. Date]) x
       WHERE x.rn = 1;

为了表现,请尝试第一张表格的([Mk], [Serial], [Inv. Date])和第二张表格的([Mk], [Serial], [Record Date])。或者也许尝试切换[Mk][Serial]的位置,如果连续剧在不同品牌上或多或少“独特”。


0
投票

为了解决这个问题,我最终在最初的基本查询之外创建了其他查询。

在第一个外部查询中,我执行了此操作(“发票编号”是我调用的附加字段,以确保唯一的行编号,以防机器出售一次,买回,然后在该时间段内再次出售):

CASE
    WHEN Q1.[Usage] IS NULL
    THEN 1
    ELSE ROW_NUMBER() OVER (PARTITION BY Q1.[Serial Number], Q1.[Mk], Q1.[Invoice Number] ORDER BY Q1.[Record Date] DESC)
END AS [RowNum]

这可确保表中的每个条目都具有排序机制,即使连接表中没有使用度测量。

然后,下一个外部查询仅抓取RowNum = 1的行。

© www.soinside.com 2019 - 2024. All rights reserved.