AWS CLI S3仅在选定文件上同步吗?

问题描述 投票:5回答:2

我需要同步两个AWS S3存储桶,但是我只需要同步列表中的文件。这是场景:

BucketA:

File1.jpg Deleted  
File2.jpg Modified
File3.jpg Deleted
File4.jpg Modified
File5.jpg Modified
File6.jpg New

BucketB:

File1.jpg 
File2.jpg 
File3.jpg 
File4.jpg 
File5.jpg 

我正在寻找这样的命令:

aws s3 sync s3://BucketA s3://BucketB --delete --exclude "*" --include "File1.jpg;File2.jpg;File4.jpg"

结果BucketB必须是这样的:

File1.jpg deleted
File2.jpg Modified
File3.jpg No changed
File4.jpg Modified
File5.jpg No changed

任何想法?

amazon-web-services amazon-s3 sync aws-cli
2个回答
7
投票

看起来似乎可以实现,除了删除部分。

此命令将仅sync指定的文件:

aws s3 sync s3://bucketA s3://bucketB --exclude "*" --include "File1.jpg" --include "File2.jpg" --include "File4.jpg"

但是,--delete参数似乎仅查看BucketA参数中包含的--include中的文件,从而导致所有其他文件“不可见”并因此从BucketB中删除。

此命令:

aws s3 sync s3://bucketA s3://bucketB --delete --exclude "*" --include "File1.jpg" --include "File2.jpg" --include "File4.jpg"

实际上删除File2.jpgFile4.jpg以外的所有文件。因此,您似乎无法以预期的方式进行选择性删除。

这是一个测试以上所有内容的脚本:

aws s3 cp foo s3://bucketa/File1.jpg
aws s3 cp foo s3://bucketa/File2.jpg
aws s3 cp foo s3://bucketa/File3.jpg
aws s3 cp foo s3://bucketa/File4.jpg
aws s3 cp foo s3://bucketa/File5.jpg
aws s3 sync s3://bucketa s3://bucketb
aws s3 rm s3://bucketa/File1.jpg
aws s3 rm s3://bucketa/File3.jpg
aws s3 cp foo s3://bucketa/File6.jpg
aws s3 cp bar s3://bucketa/File2.jpg
aws s3 cp bar s3://bucketa/File4.jpg
aws s3 cp bar s3://bucketa/File5.jpg

aws s3 ls s3://bucketa
2015-07-23 08:50:44         49 File2.jpg
2015-07-23 08:50:49         49 File4.jpg
2015-07-23 08:50:53         49 File5.jpg
2015-07-23 08:50:20         24 File6.jpg

aws s3 ls s3://bucketb
2015-07-23 08:49:35         24 File1.jpg
2015-07-23 08:49:35         24 File2.jpg
2015-07-23 08:49:36         24 File3.jpg
2015-07-23 08:49:36         24 File4.jpg
2015-07-23 08:49:36         24 File5.jpg 

aws s3 sync s3://bucketa s3://bucketb --exclude "*" --include "File1.jpg" --include "File2.jpg" --include "File4.jpg"

0
投票

没有办法同步特定文件,但实际上有一些不良的解决方法。

  1. 正如@John Rotenstein提到的,可以使用--exclude =“ *” --indclude =“ FILEPATH”

    • 此解决方案适用于一个或两个文件
    • 如果您要同步更多文件,则将比仅同步所有文件持续更长时间
    • 之所以需要更长的时间,是因为'sync'命令将递归地遍历目标目录的所有文件
    • 对于通过--include传递的每个参数,将有一个迭代的整体文件
    • 同步将检查通过--include传递的模式是否与文件路径匹配
    • 您还可以通过通配符而不是通过--include传递路径>
    • 通过使用--debug选项,您可以自行验证
  2. 您可以使用'cp'命令代替'sync'并将文件路径附加到目标目录的路径中

  • 此方法不检查是否需要同步,它只会复制文件
  • 对于每个文件路径,执行整个复制命令,这非常耗时

因此,对于至少几个文件,您可以使用这些解决方法,但如果像我这样,有几百个文件,那就没有办法。

[如果您想推动此操作,我已经在github上打开了一张票:https://github.com/aws/aws-cli/issues/5167

© www.soinside.com 2019 - 2024. All rights reserved.