Amazon提供了非常详细的文档,用于将数据从EMR复制到Redshift(通过S3),但是似乎没有其他文档,这让我想知道从中加载数据是否是一个好习惯转移到EMR(直接或通过某种媒介)]
理论上我不明白为什么不这样做,但我不知道它的后果
我认为您可以使用Redshift卸载。将数据导出为Parquet,然后从EMR Hadoop(Spark,Hive)中读取数据]
UNLOAD ('select-statement')
TO 's3://object-path/name-prefix'
authorization
FORMAT PARQUET
https://docs.aws.amazon.com/redshift/latest/dg/r_UNLOAD.html