如何在ADW中检查新行的输入?

问题描述 投票:0回答:2

我已经安排了各种管道,将来自On Premises SQL DB的增量数据复制到Azure Datawarehouse,有时行数存在一些问题,比如行数不匹配或者行被复制,如何检查要复制的行?转到Datawarehouse,以便如果存在冗余或差异,我应该注意。

我知道ADF V1管道监控功能只显示复制过的行数,但没有显示复制过的行数,是否有办法让我可以找到复制的内容和不复制的内容。

当我们处理具有百万行的表时,这会变得更加困难。

sql-server azure azure-data-factory azure-sqldw
2个回答
0
投票

由于Azure SQL Datawarehouse不支持主键约束,因此您可以创建用于插入新数据的临时表,然后调用存储过程,将新数据与已有数据进行比较,并仅将新行插入到实际表格。

这不是一个很好的做法,最好的方法是在实际的ETL过程中控制新行的插入,如果你没有这个,你可能会更好地使用Azure SQL服务器,它几乎支持内部部署sql server支持的所有内容,而不是仓库。

干杯!


0
投票

DW的模式通常是将数据放入阶段表,然后使用T-SQL继续将数据处理到prod表中。使用此模式,您可以在继续处理之前简单地运行SELECT COUNT_BIG(*)FROM以获取登台表中的行计数。

© www.soinside.com 2019 - 2024. All rights reserved.