如何从在日期列上划分的配置单元表中获取最新日期?

问题描述 投票:0回答:1

例如如果我的日期列是load_date,则使用max(load_date)运算符将扫描配置单元中的每个数据文件,从而使其成为昂贵的操作。相反,有什么最佳方法可以从表中获取最新的load_date。

sql hadoop hive hiveql hadoop-partitioning
1个回答
0
投票

嗨,

配置单元中检查最大日期的唯一方法是使用max聚合函数。在您的情况下,其max(load_date)。在任何关系数据库中,不仅配置单元而且是查找最新日期的方法。如果设计需要,则可以有一个元数据表,其中记录了配置单元中加载的每个文件的统计信息,这有助于您获取最新记录。

© www.soinside.com 2019 - 2024. All rights reserved.