我正在尝试建立一个管道,该管道将数据从Snowflake发送到S3,然后再从S3发送回Snowflake(在Sagemaker上通过生产ML模型运行数据之后)。我是数据工程的新手,所以我很想听听社区中推荐的路径。管道要求如下:
query_01012020,query_01022020,query_01032020
这样存储在自己的S3子文件夹中。我希望您能够为此目的在相关文档/教程上指导我。我真的很感谢指导。
非常感谢。
我正在尝试建立一个管道,该管道将数据从Snowflake发送到S3,然后再从S3发送回Snowflake(在Sagemaker上通过生产ML模型运行数据之后)。我是Data的新手...
雪花没有任何编排工具,例如Airflow或Oozie。因此,您需要使用或考虑使用某些Snowflake Partner Ecosystem工具,例如Mattilion等。或者,您可以使用Spark或python或任何其他可以使用JDBC / ODBC / Python连接雪花的编程语言来构建自己的端到端流连接器。