presto 相关问题

Presto是一个开源的分布式SQL查询引擎,用于针对各种大小(从千兆字节到千兆字节)的数据源运行分析查询。

Athena 相当于 Presto 在数组列上的 find_first_index

find_first_index(数组(E), 函数(T, 布尔值)) → BIGINT# 返回对于 function(T,boolean) 返回 true 的数组第一个元素的索引。 如果不存在这样的元素,则返回 NULL。 这个

回答 1 投票 0

很快就显示一切为空

我配置了单节点 Presto 集群,并且能够根据自定义 s3 服务中的数据创建表。但是,当我尝试查询像 select * from test limit 10; 这样的数据时我得到的结果...

回答 1 投票 0

AWS Athena 希望加入表一次而不是 3 次

您能否帮忙重写 AWS Athena 上的 SQL,以使用具有 1 次连接而不是 3 次连接的表 我需要得到结果: t1 为 ( 选择 1 个 ID、1 个 ID1、2 个 ID2、3 个 ID3 联合所有 选择 2 我...

回答 1 投票 0

如何从 presto 中的 json 数组中获取元素的索引(位置)?

我正在使用 Presto,并且有两列。 A 列是一个 json 数组,看起来像 ["apple", "banana", "cherry"] B 列是字符串值“cherry” 我想要的一切...

回答 1 投票 0

Presto/Athena - 查询以发现 JSON 属性频率?

我定义了一个 Hive 表,其中单个列包含 JSON 文本: 如果不存在则创建外部表 my.rawdata ( json字符串 ) 分区依据(dt 字符串) 行格式 SERDE 'org.apache.hadoo...

回答 2 投票 0

Athena SQL - 无法根据需要 UNNEST JSON 字符串

我在 Athena 中的 JSON 字符串如下: [{name=agreementUrl,value=agmt-id00001},{name=sellerOfRecord,value=ABC Corporation}] [{name=agreementUrl,value=agmt-id00002},{name=sellerOfRecord,value=...

回答 1 投票 0

Athena 查询不带结构的 JSON 数组

在 Athena 中,如何构造一个 select 语句来按时间戳查询以下内容?数据存储为字符串 [{ “数据”: [{ “ct”:“26.7” }, { &

回答 1 投票 0

如何在presto中有效地选择按年月日分区的2个日期之间的数据?

有一个表,其中有 y(年)、m 月、d(日)列。如何在2个日期之间选择查询?喜欢: select * from my_table where y m d 介于“2018-12-01”和“2021-01-01”之间 她有两个问题...

回答 2 投票 0

我可以以 JSON 格式打印 presto 解析器表达式吗

(抱歉我之前找不到类似的问题)。 我们想要以 JSON 格式打印 presto 解析器的表达式。 https://github.com/slackhq/presto/blob/b147a2bc6614c4028ffb09cf668821a79c2af0fa/presto-

回答 1 投票 0

在 Athena 中使用正则表达式提取括号前的字符串值

我正在尝试了解正则表达式,并且正在尝试使用 regexp_extract 提取开括号字符之前的数据。 字符串值: 设备 iPhone-iOS-CX 12.45.0(2144) 预期输出: d...

回答 1 投票 0

如何启用分区并使“Where”子句在自定义 Trino 插件中工作

我构建了一个自定义 Trino 插件,它从存储在文件系统中的 XML 文件中获取数据。 SELECT 查询工作正常,现在我们需要使 WHERE 子句为此工作。据我所知,我...

回答 1 投票 0

地图类型急速

我正在使用 presto 来执行 sql,下面的代码不起作用,我也尝试过 json extract,这也不适用于 presto,你们能帮我解决这个代码吗? ..

回答 1 投票 0

在 AWS Athena 中重用子查询会生成大量扫描数据

在AWS Athena上,我尝试使用WITH子句重用计算数据,例如 使用临时表 AS (...) 选择 ... 来自临时表 t0、临时表 t1、临时表 t2 在哪里 ... 如果查询速度很快,“

回答 1 投票 0

在子窗口 SQL Presto 内执行具有特定条件的值计数

假设我有一个包含 3 列的表:id、date_time、颜色。数据如下: id、日期时间、颜色 1, 2023-10-01 12:15, 绿色 1, 2023-10-01 12:16, 黄色 1, 2023-10-01 12:17, 黄色 1, 2...

回答 1 投票 0

Presto:聚合所有列的数组

我有下表: 给宠物起名字 亚历克斯[狗、猫、鸟] 汤姆[兔子、猫] 玛丽[蛇、狗、鱼、牛] 戴夫[狗] 我想知道是否可以创建一个查询来查找所有 p...

回答 3 投票 0

查询嵌套类型映射<string, timestamp>

我有一个示例表,我们称之为表: ID 事件 1 {请求=1719-05-08 11:11:11.111,创建=1820-05-08 11:11:11.699,完成=1869-69-69 15:11:13.111} 2 {创建=6969-01-01 09:01:01.466...

回答 1 投票 0

删除名称中包含“.”的 AWS Athena 表

我有一个客户端将名称类似于 foo.bar 的格式错误的表上传到 Athena 实例中。我可以使用什么语法来删除表?如果我尝试 如果存在`foo.bar`则删除表 该命令默默失败,

回答 2 投票 0

Athena/Trino/Presto 代码使用自定义行分隔符解析文本文件

我想使用 Trino/Presto 代码解析纯文本文件中的一些日志文件,其中记录跨越多行。我的数据如下所示:每条记录有多行,每行有一个 va...

回答 2 投票 0

sql中的Value_map数组

我是sql新手,这是分配给我的任务,我需要count()所有其中vehicleViewId 20054133、vehicleViewId 20054133(存在于value_map中)位于第一个的会话

回答 1 投票 0

基于列中的 n 值的滚动平均值

我有一个具有以下结构的表格 - |日期1 |组 |价值| n | |:-----------:|:------:|:-----:|:-:| | 2023-10-01 | g1 | 10 | 10 30| | 2023-10-02 | g1 | 15 | 15 30| | 2023-...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.