Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。
试图通过侧面观察并爆炸将数组中的值包含在蜂巢中并导致多行爆炸
我有一个包含两列的表,我正在尝试使用数组中的值获取多行。我的表就是这样。日期用户2019-01-01 [“ U00001”,“ U00002”,“ U00002”]我是...
我对Hive表中的列具有以下值(格式):2019-04-22 08:25:43.243754000000(yyyy-MM-dd HH:mm:ss.SSSSSSSSSSSS)有没有办法截断该值如下 ? :2019-04-22 ...
我有一个方案...我有一个名为sample的表,该表包含三列:id,name,address,其中id是唯一的自动增量列。这是我的数据:id名称地址1 john LA 2 peter ....
我有一个表,其中列(COL1)的值可以为0到1(包括0)。我想从此列中创建一个新列,该列使用预定义范围对COL1进行分类(即创建箱)。 ...
是否有任何方法可以查看我们在hive终端中使用哪个数据库。当使用webGUI(hue)在蜂巢中工作时,有一个数据库列表,我们可以从中选择数据库(将......>
我使用从按日期划分的大型配置单元表中选择数据(格式:yyyyMMdd),配置单元查询需要从6个月的数据中获取几个字段(总共180个日期分区。...
我想为一列的运行值添加总和,但是如果序列失败,那么我们就不必添加
我有这样的桌子+ ---- + -------- + ------ + ------ + | id |州| num |流行+ ---- + -------- + ------ + ------ + | 1 | ny | 1 | 100 | | 1 | ny | 2 | 200 | | 1 | ny | 3 | ...
Hive查询无法识别表达式指定中'select''max''('附近的输入
我的蜂巢中有一个具有以下结构蜂巢的表>描述stock_summary; OK ...
我在HDFS中有一个目录,其中固定结构和列名的.csv文件将在每天结束时转储,可能看起来像这样:我有一个配置单元表,应该具有新数据...
我具有这样的表结构| --------------------- | ---------- | ------- ---- | | col_1 | col_2 | col_3 | | --------------------- | ---------- | ----------- | | 2018-01-15 17:56 | ...
[当我执行以下代码时:添加JAR hdfs:///user/hive/warehouse/hive-serdes-1.0-SNAPSHOT.jar;在Hive中,我得到以下错误:处理语句时出错:无法读取外部资源...
我有一个配置名称为模式,联系人,地址,主题名称的配置单元表联系人地址主题abc 1111孟买数学egf 2222 nashik science pqr 3333 delhi history ...
我有一个Hive临时表,没有任何具有所需数据的分区。我想选择此数据,然后插入按日期划分的另一个表中。我尝试过以下运气不好的技术。 ...
我有一个数据集,我正在使用以下代码进行重复数据删除:从(选择*,ROW_NUMBER()OVER(PARTITION BY session_id,sol_id,date)中选择session_id,sol_id,id,session_context_code ...
我有以下实际上有效的查询:SELECT replace(z.PRODUCT_TITLE,'''','')作为PRODUCTTITLE,z.NICK FROM table1 z WHERE NICK <= 200但是当我使用create执行相同的查询时...
我有一个表,在其中需要为每个组标记不同交易的数量。如果两次后续交易之间的天数少于7天,则将其视为相同的...
我有从view1中查询选择col1,col2的查询,并且我只想在(从table1中选择列值)> 0时执行,否则什么都不做。如果(从表1中选择列值)> 0,则选择...