我正在尝试为存储桶编写基于 S3 事件的触发器。我正在考虑一旦数据集被删除就会触发事件。问题是有超过 140 个数据集在不同的时间和日期被放入 S3 存储桶中。
文件的格式为 file_name_date.parquet ( file_name_20240322.parquet),file_name 始终相同,但日期始终不同。不确定这是否有意义。
您似乎在说:
这里的问题是知道“所有”文件何时上传。
处理此问题的一个好方法是向正在上传文件的系统添加一个操作,以便在上传所有文件后,它会上传一个具有特殊文件名的额外文件,或者最好在不同的目录中上传。然后可以使用这个“额外文件”来触发您的下一个流程。