使用scala从s3存储桶下载所有文件

问题描述 投票:3回答:2

我尝试下面的代码成功下载一个文件但无法下载所有文件列表

client.getObject(
new GetObjectRequest(bucketName, "TestFolder/TestSubfolder/Psalm/P.txt"),
new File("test.txt"))          

提前致谢

更新我尝试了下面的代码,但获取目录列表,我想要的文件列表

val listObjectsRequest = new ListObjectsRequest().
withBucketName("tivo-hadoop-dev").
withPrefix("prefix").
withDelimiter("/")
client.listObjects(listObjectsRequest).getCommonPrefixes
scala amazon-s3
2个回答
2
投票

我不知道为什么人们对这个问题投了反对票。这是一件简单的事情,但在结束下面提到的答案之前我就像任何事情一样挣扎。 我找到了一个java代码并相应地更改为scala并且它有效希望它会帮助其他人。如果有人有更好和简单的答案请帮助

 val client = new AmazonS3Client(credentials)
         val listObjectsRequest = new ListObjectsRequest().
         withBucketName("bucket-name").
         withPrefix("path/of/dir").
         withDelimiter("/")

 var objects = client.listObjects(listObjectsRequest);
 do {
     for (objectSummary <- objects.getObjectSummaries()) {
         var key = objectSummary.getKey()
                 println(key)
                 var arr=key.split("/")
                 var file_name = arr(arr.length-1)
                 client.getObject(
                         new GetObjectRequest("bucket" , key),
                         new File("some/path/"+file_name))
     }
     objects = client.listNextBatchOfObjects(objects);
 } while (objects.isTruncated())

0
投票

下面的代码非常快速且有用,尤其是当您要下载特定本地目录中的所有对象时。它将文件维护在完全相同的s3前缀层次结构下

val xferMgrForAws:TransferManager = TransferManagerBuilder.standard().withS3Client(awsS3Client).build();
var objectListing:ObjectListing = null;
objectListing = awsS3Client.listObjects(awsBucketName, prefix);
val summaries:java.util.List[S3ObjectSummary] = objectListing.getObjectSummaries();
if(summaries.size() > 0) {
  val xfer:MultipleFileDownload = xferMgrForAws.downloadDirectory(awsBucketName, prefix, new File(localDirPath));
  xfer.waitForCompletion();
  println("All files downloaded successfully!")
} else {
   println("No object present in the bucket !");
}
© www.soinside.com 2019 - 2024. All rights reserved.