presto 相关问题

Presto是一个开源的分布式SQL查询引擎,用于针对各种大小(从千兆字节到千兆字节)的数据源运行分析查询。

BigQuery + Amazon Athena + Presto:分区和列的数量限制

基于Google BigQuery文档,BigQuery具有以下限制(https://cloud.google.com/bigquery/quotas):1)每个分区表的最大分区数-4,000。 2)最大值...

回答 1 投票 0

在AWS Athena中提取数组中的json

我已将日志从kubernetes发送到S3存储桶,并希望使用Athena对其进行查询。日志如下所示[{“ date”:1589895855.077230,“ log”:“ 192.168.85.35--[19 / May / 2020:13 :44:15 + ...

回答 1 投票 1

使用Presto插入静态配置单元分区

假设我想插入静态配置单元分区,我可以使用Presto做到这一点吗? PARTITION关键字仅适用于配置单元。插入表员工分区(department ='HR')的原因:com ....

回答 1 投票 0

回答 1 投票 0

REGEX简单模式

[我正在尝试创建遵循模式Quote + 6 digit + Quote的正则表达式模式,即“ 123456”“ 789456”“ 456456” REGEXP_LIKE(String,'\“ \ ^ [0-9] {6} $ \” \')as reg知道我在做什么错吗? ...

回答 2 投票 0

如何在预设值中取最大值?

我有以下查询:使用(id)从table1中选择id,table1.date1,table2.date2,table1.name加入table2。我还希望另外一个具有MAX(table1.date1,table2.date2)的列,但是我不要...

回答 1 投票 0

如何在Presto中将小时解析为人类可读的字符串? (十进制为时间)

我正在运行以下SELECT A,B,AVG(date_diff('hour',creation_date,current_timestamp))as AVG_in_hours FROM table GROUP BY A,B这给了我:AB AVG_in_hours 1 2 1587.25 1 3 ...] >

回答 1 投票 0

在我的IDE中运行Presto时如何获取堆栈日志?

我最近正在学习Presto,所以我在IDE中运行了Presto。我想获取一些堆栈日志以了解有关Presto的更多详细信息,但是我没有找到配置Presto的正确方法。我找到了一个日志...

回答 1 投票 0

重复条件(SQL)

我想获得每个商人ID的商品ID重复项的数量,其中邮政编码是相同的。请参见下面的示例:表商人ID物品ID邮政编码1 ...

回答 2 投票 0

WHERE子句中的单引号与双引号返回不同的结果

似乎Athena的查询结果中包含CSV列标题。我使用TBLPROPERTIES(“ skip.header.line.count” =“ 1”)删除了标题,并重新创建了包含以下DDL的表。 ...

回答 1 投票 0

将product_id放入价格范围内

我想为给定的product_id添加价格范围(以500为增量)。例如,价格为450的产品的价格范围应为500,而价格为2450的产品的价格范围应为...

回答 1 投票 0

如何在AWS Athena中的查询中创建对已解析字段的引用?

在此查询中,使用parse_datetime解析时间字段2次:SELECT date_trunc('HOUR',parse_datetime(time,'yyyy-MM-dd''T''HH:mm:ss.SSSSSS''Z') ),* FROM日志中parse_datetime(time,...

回答 2 投票 1

重复条件

我想获得每个商户ID的article_id重复项的数量,其中zip_code不相同。请参见下面的示例:表商人ID物品ID邮政编码1 ...

回答 1 投票 0

如何在AWS Athena中为查询中的已解析字段创建引用?

在此查询中,使用parse_datetime解析时间字段2次:SELECT date_trunc('HOUR',parse_datetime(time,'yyyy-MM-dd''T''HH:mm:ss.SSSSSS''Z') ),* FROM日志中parse_datetime(time,...

回答 1 投票 0

如何为查询中的已解析字段创建引用?

在此查询中,使用parse_datetime解析时间字段2次:SELECT date_trunc('HOUR',parse_datetime(time,'yyyy-MM-dd''T''HH:mm:ss.SSSSSS''Z') ),* FROM日志中parse_datetime(time,...

回答 1 投票 0

过滤过去2年中每年至少有3笔交易的客户

我有一个称为cust_trans的客户交易表,其中,客户进行的每笔交易都存储为一行。我还有一个名为visit_date的列,其中包含交易日期。我...

回答 2 投票 1

SQL Join:两端的所有值都有累积条件(Presto / AWS Athena)

我一直在解决这个看似简单的问题一段时间,没有解决方案,假设我有一个带有日期列表的表,另一个带电话号码,人和日期的表,我需要一个...] >

回答 1 投票 1

以前,如何在相同的字段上同时在两个条件下使用max_by两次?

我想两次使用max_by(event_id,date_created):一次,当date_created <= first_upgrade_date时,一次,一次,当date_created <= projection_point时,有一种方法可以在一个查询中而不是....>]

回答 1 投票 0

presto sql中的cardinality()是什么?

有人知道sql中cardinality()函数的用途吗?嵌套功能如何工作? SELECT story_id,基数(image_tags)作为image_tags,基数(comment_tags)为...

回答 1 投票 0

Windows函数在某些日期不存在时按日期排序

假设此示例查询:从选项卡中将id,date,sum(var)选择为(按ID顺序按日期前30行的ID顺序进行划分)作为roll_sum,当date列上不存在某些日期时,该窗口将不...]

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.