将数据从redshift直接复制到EMR群集-这是一个好习惯吗？

问题描述投票：0回答：1

Amazon提供了非常详细的文档，用于将数据从EMR复制到Redshift（通过S3），但是似乎没有其他文档，这让我想知道从中加载数据是否是一个好习惯转移到EMR（直接或通过某种媒介）]

理论上我不明白为什么不这样做，但我不知道它的后果

amazon-redshift amazon-emr

1个回答

0
投票

我认为您可以使用Redshift卸载。将数据导出为Parquet，然后从EMR Hadoop（Spark，Hive）中读取数据]

UNLOAD ('select-statement')
TO 's3://object-path/name-prefix'
authorization
FORMAT PARQUET

https://docs.aws.amazon.com/redshift/latest/dg/r_UNLOAD.html

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.