我的问题是在这里创建一个复制管道,该复制管道将表和数据从MySql RDS复制到Redshift,并且我不能使用任何托管服务。另外,RDS中的任何新更新也应复制到redshift表中。
查看了许多解决方案后,我对以下步骤有所了解:
所以,我只是想确认上述方法是否合适?同样,每次发生更新时,旧数据将被完全删除并替换为新数据,还是可能仅更新必要的记录。如果是,那么如何?
任何帮助将不胜感激。预先感谢。
是的,上面的策略还不错,good
。我在生产system
中使用了它,并且效果很好,尽管您必须仔细制定该策略以确保它可以解决用例effectively
和efficiently
。
这里有几点,我指的是有效和高效。
Redshift
的记录,这意味着使用包括CPU
,Memory
的优化查询来标识潜在的记录。redshift
,以便它使用最小的storage
和network bandwidth
。例如压缩并压缩gzip
CSV文件,以使其在S3
存储中的大小最小,并节省network
带宽。copy redshift
查询。希望这会有所帮助。