amazon-redshift 相关问题

Amazon Redshift是一种PB级数据仓库服务,它使用现有的商业智能工具来分析数据。 Redshift是一个基于ParAccel的面向列的MPP数据库

按 Redshift 中的总运行时间、执行时间、等待/队列时间列出热门查询?

我知道 Amazon 为 Redshift 提供了各种管理脚本,例如这个: https://github.com/awslabs/amazon-redshift-utils/blob/master/src/AdminScripts/top_queries.sql 其中列出了顶部

回答 3 投票 0

如何通过查询获取 Redshift 中查询的总运行时间?

我正在对 redshift 中的一些查询进行基准测试,以便我可以对我对表所做的更改做出一些明智的判断,例如添加编码和运行真空。我可以查询

回答 3 投票 0

从 databricks jdbc 连接读取数据到 redshift 时出错

我们使用 databricks 集群,在 30 分钟不活动后关闭(13.3 LTS(包括 Apache Spark 3.4.1、Scala 2.12))。 我的目标是读取红移表并将其写入雪花,我是

回答 1 投票 0

在 Redshift 中从 bigquery 实现以下内容

尝试使用listagg()但结果如下: 1 a、b、c 1 a、b、c 1 a、b、c 2 嗯 需要与 image bigquery 类似的实现: 数据 1 为 ( 选择 1 斯克, 'a' st, 时间戳('1900-05-08 04:00:00...

回答 1 投票 0

从 Kafka 读取数据到 AWS Redshift 的最佳实践

将数据从 Kafka 集群移动到 Redshift 表的最佳实践是什么? 我们有连续的数据到达 Kafka,我想将其写入 Redshift 中的表(它不必位于...

回答 2 投票 0

AWS Athena 从通过 GLUE Crawler 输入来自 S3 的 csv 创建的表返回零记录

第一部分: 我尝试在 s3 中加载的虚拟 csv 上运行胶水爬虫,它创建了一个表,但是当我尝试在 athena 中查看表并查询它时,它显示返回了零记录。 但是At中ELB的demo数据...

回答 10 投票 0

使用 RANGE 窗口框架子句将 SUM 分析函数从 PostgreSQL 移动到 Redshift

我在 PostgreSQL 中有以下代码,我需要在 Amazon Redshift 上重现该代码: 选择 * 从 ( 选择不同的 援助 , sum(a.is_batch_empty then 1 else 0 end) over (

回答 2 投票 0

将 SUM 分析函数从 PostgreSQL 移至 Redshift

我在 PostgreSQL 中有以下代码,我需要在 Amazon Redshift 上重现该代码: 选择 * 从 ( 选择不同的 援助 , sum(a.is_batch_empty then 1 else 0 end) over (

回答 1 投票 0

如何将单个对象数组从 JSON 复制到 Redshift

考虑以下 JSON 数据结构 [{“a”:1,“b”:2} ,{"a":3,"b":4} ,{"a":5,"b":6} ] 我想使用 Redshift COPY 命令复制此内容。 我认为 JsonPath 是需要的。关闭...

回答 2 投票 0

JSON 文件未加载到 redshift

我在 redshift 中使用复制命令加载 JSON 对象时遇到问题,我收到以下 JSON 格式的文件,在尝试使用复制命令时失败,但是当我调整

回答 2 投票 0

SQL 中的自定义日期范围

我正在尝试向我的 sql 查询添加日期范围。 日期范围应每季度更改一次 2024 年 4 月 1 日的示例 - 数据的日期范围应为过去 12 个月,即应查看...

回答 1 投票 0

获取每个分区第一条记录的最佳方法:FIRST_VALUE 与 ROW_NUMBER

我正在寻找使用 SQL 获取每个分区 (a,b) 的第一条记录(a,b,c 列)的最快方法。表大约有 10, 000, 000 行。 方法#1: 选择 * 从 ( 选择a、b、c, ROW_N...

回答 2 投票 0

从 Redshift 中的超类型获取值

在我的表中,我有一个名为 zip 的超级类型列。我认为列包含字典,它不是有效的 json。如何将值提取为单独的列。我的意思是 zip.zip4、zip.zip5 我尝试使用,

回答 1 投票 0

在 Spark SQL 中计算运行总和

我正在研究一个逻辑,我需要根据每日扫描计数计算totalscan、last5dayscan、month2dayscan。截至今天,我每天都会对每日扫描计数进行汇总,但现在数据量让

回答 1 投票 0

为什么Redshift中的information_schema.table_privileges不支持truncate类型?

我想查询用户对表的select、insert、update、delete、truncate权限。 但是,table_privileges 视图不显示截断权限。 当我尝试包含

回答 1 投票 0

在 Redshift 上更新插入之前会以任何方式帮助锁定表吗?

我在查看一些存储库时进入了这段代码,我知道锁的作用,还知道 Redshift 有一种在使用快照的查询之间维护表的当前版本的方法。 所以问题...

回答 1 投票 0

redshift 错误:无效的 Dateatime 日期字符串:上下文:输入长度 57 超出日期时间范围

我在完成 SQL 查询时遇到问题,我认为这与某些时间戳单元格为空/NULL 有关 这是查询: 选择 交互ID, 由新2解析, (

回答 1 投票 0

查询图结构的SQL(传递闭包问题)

我们有一个表格,用于跟踪客户使用的所有礼品卡。这是多对多的关系,一个客户可以使用多张礼品卡,并且一张礼品卡可以被多个人使用

回答 1 投票 0

无法在 redshift 中使用随机数据创建临时表?

我正在尝试创建一个简单的日期和随机数临时表。 这有效: 从中选择 * (选择 now()::date -generate_series(0, 29) 作为日期, CAST(RANDOM() * 10 AS INT) as nmb) ...

回答 1 投票 0

用于查询图结构的SQL

我们有一个表格,用于跟踪客户使用的所有礼品卡。这是多对多的关系,一个客户可以使用多张礼品卡,并且一张礼品卡可以被多个人使用

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.