impala 相关问题

Apache Impala是Apache Hadoop的开源原生分析数据库。 Impala由Cloudera,MapR,Oracle和亚马逊提供。

使用HUE中的JAR

我有jar文件,获取IP作为参数并返回csv:国家,组织I.ejar.jar 8.8.8.8将返回国家,组织美国,谷歌我有Hadoop表与IP地址,我想...

回答 1 投票 0

在impala中ROW_NUMBER()OVER

我有一个用例,我需要在PARTITION上使用ROW_NUMBER():类似于:SELECT Column1,Column 2 ROW_NUMBER()OVER(按FREQ,MAN,MODEL分类的ACCOUNT_NUM分区)为......

回答 4 投票 5

Impala SQL查询组具有多个条件

给出以下情况:CREATE TABLE IF NOT EXISTS`table1`(`time` int(11)NOT NULL,`aircraft` varchar(50)NOT NULL,`height` int(11)NOT NULL); INSERT INTO`table1`(`time`,`...

回答 2 投票 1

Hive - 巨大的10TB表重新分区(添加新的分区列)

技术人员,背景 - 我们有10TB现有的蜂巢表,它在A列上进行了范围分区。业务案例有变化,现在除了A列之外还需要添加分区列B.

回答 1 投票 0

在通过sqoop将数据导入Hadoop时,用什么替换sql server中的数据类型datetime?

我试图将数据从SQL Server导入Hadoop,我导入的表中包含datetime字段。如果没有替换,它将在Hive中存储一些数字。我想替换......

回答 1 投票 0

从pandas.read_sql读取时编码impala数据

当我使用pyhive库和pandas.read_sql读取impala数据时,我收到错误UnicodeDecodeError:'utf-8'编解码器无法解码位置3071中的字节0xe2:意外的数据结束原因...

回答 1 投票 0

RODBC错误:无法在mysql中使用SQLExecDirect

我一直在尝试编写一个R脚本来查询Impala数据库。以下是对数据库的查询:从databaseA.tableA中选择columnA,max(columnB)其中columnC in(select distinct(columnC)from ...

回答 1 投票 9

如何使用日常数据构建年度数据?

我有一组结构如下的数据:[uid,product,currency,platform,date] [100,product_1,USA,desktop,2019-01-01] [100,product_2,USA,desktop,2019-01 -03] [...

回答 1 投票 2

从spark代码中使元数据/刷新imapala无效

我正在开发一个NRT解决方案,要求我经常更新Impala表上的元数据。目前,此失效是在我的spark代码运行后完成的。我想加快速度......

回答 2 投票 3

如何在SQL表中使用列条件返回前一行值?

我有下面的SQL表,其中我只需要条件类型为00时才需要最近的价格。表:产品ID条件类型日期价格00001 01 2018-01-01 ...

回答 2 投票 1

Impala有没有像to_date(oracle)这样的函数?

我想通过Impala-shell操作日期,其功能类似于Oracle的TO_DATE(string1 [,format_mask] [,nls_language])。有什么建议我怎么办?

回答 1 投票 0

使用Slick与Kudu / Impala

Kudu表可以通过Impala访问,因此它的jdbc驱动程序。多亏了它可以通过标准的java / scala jdbc api访问。我想知道是否有可能使用光滑的。或者如果不是......

回答 1 投票 0

pyodbc sql结果被切断了

我有一个脚本如下所示cursor = connection.cursor()select_string =“SELECT * from mytable”cursor.execute(select_string)data = cursor.fetchall()print(data)print len(data)数据如下所示...

回答 1 投票 0

SQL Union NULL没有显式列出列名的列

我有两个相当宽的表(30列)但具有非常相似的模式(两个表共享20多列)。我想将这两个表结合在一起,但希望新表拥有所有...

回答 2 投票 0

无法使用Java 1.8获取Impala JDBC连接[重复]

我试图在Jboss 6上部署的应用程序中获取impala jdbc连接;下面是相同的spring bean(ID1)数据源定义。我在连接时遇到异常;请 ...

回答 1 投票 1

如何从一个impala表创建分区到另一个

我想在我们的数据库中克隆一个名为'blah'的impala表用于测试目的(所以我不小心删除了我不应该删除的东西)。但是,表'blah'有分区,看起来不像......

回答 3 投票 2

使用R JDBC将数据插入Impala

有没有人知道是否可以使用R与JDBC(或者不使用JDBC)将整个表(数据框,矩阵,等等)插入到Impala中?我们可以轻松地从Impala中进行选择。

回答 1 投票 2

Impala连接错误

我试图在我的cloudera集群中运行下面的impala命令impala-shell -i connect 10.223.121.11:21000 -d prod_db -f /home/cloudera/views/a.hql但是我收到错误,因为错误,无法解析。 ..

回答 2 投票 1

Spark:将时间戳写入镶木地板并从Hive / Impala中读取

我需要在镶木地板上写一个时间戳,然后用Hive和Impala读取它。为了写它,我尝试了例如my.select(...,unix_timestamp()为“myts”.write .parquet(dir)然后读我...

回答 1 投票 0

动态删除impala中的分区

Impala允许动态添加分区,如下所示。插入table1分区(part_col1 =“merged”,part_col2,part_col3)从table2中选择col1,col2,col3,part_col2,part_col3,其中col =“...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.