amazon-athena 相关问题

Amazon Athena是一种针对存储在Amazon S3上的数据运行SQL查询的服务。 Amazon Athena是Amazon Web Services(AWS)的一部分。

Athena GZIP JSON 日期/小时分区投影不返回结果

我已设置 Firehose 以使用 yyyy/MM/dd/HH/ 路径模板将 GZIP JSON 文件传送到 S3: s3://bucket-name/events/2022/11/08/16/file-2022-11-08-16-47-41-xxx.gz 如果我在 A 中创建外部表...

回答 1 投票 0

在 Athena 中为序曲地图数据创建表时出现问题

我正在使用此处的查询来尝试为 Overture 地图数据创建表格。当我尝试运行下面的查询时,我收到下面显示的错误。我已经尝试过不行了答案包括...

回答 1 投票 0

Grafana 通过 Amazon Athena 查询失败

我尝试使用 Amazon Athena 作为源在 Grafana 中进行查询。 实验1 首先,我创建了一个名为 xx-workgroup 的 Amazon Athena 工作组,并将查询输出位置设置为 S3 路径。我可以确认...

回答 1 投票 0

带上最后日期(结果)

我试图通过以下查询提供最近的日期: 选择ID、金额、年月日 从 ( 选择 ID, 数量, 年月日, row_number() OVER (PARTITION BY id ORDER BY try(date_parse(

回答 1 投票 0

(AWS) Athena:查询结果似乎太短

我的 Athena 查询的结果似乎太短。试图找出为什么? 设置: 胶水目录(尺寸为 118.6 G)。 数据:以 CSV 和 JSON 格式存储在 S3 中。 雅典娜询问:什...

回答 4 投票 0

在 Athena 中,如何查询结构体数组中的结构体成员?

我正在尝试弄清楚如何查询在创建以下表的情况下检查使用值的位置: 如果不存在则创建外部表 foo.test ( `id` 字符串, `foo` 结构...

回答 3 投票 0

如何从 Athena 中的数组中删除 NULL

我有使用此查询聚合的数组: 选择字段名称1, 字段名称2, “array_agg”(DISTINCT )“array_agg” 来自 分组依据...

回答 1 投票 0

如何在亚马逊雅典娜查询中查找去年当前月份?

例如,如果今天是 2023-09-23 (yyyymm) 那么我需要提取2022年9月到2023年9月(2022-09-01到2023-09-30)的数据。 对于下面的代码,我的目的是打印 2022 年的数据

回答 1 投票 0

Amazon Athena CREATE EXTERNAL TABLE 不匹配输入“外部”无效请求异常

我正在尝试在 Amazon Athena 中创建外部表。我的查询如下: 创建外部表价格表( 工作日 STRING, 月日 INT, 价格00浮动, 价格01浮动, 价格02...

回答 8 投票 0

AWS Quicksight Athena 导入加密 S3 数据时出错

我有一个存储在 S3 中的加密数据湖,未使用 AWS Quicksight 中的 Athena 正确导入该数据湖。在尝试之前已启用 S3 的权限(以及针对此特定存储桶)...

回答 2 投票 0

为一系列事件添加 id,一旦出现相同事件,该 id 就会中断

我有一个数据集,看起来包含 id 和 event 等列。我想添加的是desired_id,每次列事件中的价值展示次数都会增加。你可以吗

回答 1 投票 0

NoSuchModuleError:无法加载插件:sqlalchemy.dialects:amazonathena

我对 python 和 athena 非常陌生。 我正在尝试使用 python 查询 athena。 代码: 进口熊猫 从 sqlalchemy.engine 导入 create_engine 引擎 = create_engine("amazonathena:///?AccessKe...

回答 1 投票 0

sql presto athena 中的分组/聚合

我有一张桌子,看起来像这样: id、作者 1、{条目..} 1、{条目2..} 1、{条目3..} 2、{条目x} 2、{条目y} 我想分组并生成另一张看起来......

回答 1 投票 0

将一个数组取消嵌套到另外两个数组sql中(athena/presto)

我在 athena 中有一个嵌套数组,如下所示: [ {org=[..],auth={..}},{org=[..],auth={..}},{org=[..],auth={..}} ] 数组及其内容都是可选的。我想取消嵌套...

回答 1 投票 0

如何从 Athena 中的电子邮件地址提取域名

我正在尝试使用 Athena 从电子邮件地址中选择域名,但我的菜鸟眼镜找不到有效的翻译。 根据我的理解,以下内容应该有效,但所需的乐趣......

回答 2 投票 0

AWS Glue 无法访问输入数据集

我在 Glue / Athena 中注册了一个数据集,将其命名为 my_db.table。我可以通过 Athena 查询它,一切似乎都正常。 我正在尝试在胶水作业中使用这张桌子,但是

回答 3 投票 0

sql athena/presto 检查嵌套 json 数组中的值是否

我在 athena 中运行查询,如下所示: SELECT element_at(col_name,1).entities FROM "db_name"."the_table" limit 10; 我得到了一个嵌套的 jsons/dicts 数组,如下所示: [{国家=美国,续...

回答 1 投票 0

PyAthena 正确解析 ARRAY<VARCHAR> 列,但结果是字符串

从 ARRAY 类型的单列 abc 开始,其中一行: 选择数组 ['a', 'b', 'c'] AS abc 如果我们使用 ArrowCursor 通过 pyathena 执行查询: 光标 = pyathena.conne...

回答 1 投票 0

端点设计:查询 AWS Athena 而不是数据库

我正在构建一个端点,该端点将由 5k - 10k 用户使用,例如: 获取 /magic/spells?spellIds=1,2,3 “咒语”的底层数据源经常更改并存储在压缩...

回答 1 投票 0

Athena 连接和高基数分区

我有一个对请求进行分类的 S3 表。它包含大量“小”行。每行代表一个请求,以及一些我喜欢用来过滤查询的小整数/标志。 每个...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.