amazon-data-pipeline 相关问题

简单的服务,在亚马逊数据存储服务之间传输数据,启动Elastic MapReduce作业,以及连接外部数据服务。

需要将s3与DBT管道集成

我正在构建一个 DBT 数据转换管道,它需要从 s3 位置读取 parquet 数据并将输出再次写入另一个 S3 位置。 将会有哪些配置更改

回答 1 投票 0

自动归档 aws-redshift 表的最佳方法

我在 redshift 中有一个大表,我需要自动化每月数据的归档过程。 目前的做法如下(手动): 将redshift查询结果卸载到s3 创建新备份...

回答 3 投票 0

aws数据管道触发awsglue爬虫

我有一个带有 EMR 活动的 Aws 数据管道,它在 S3 上写入数据。在此过程结束时,它还会将一些元数据写入该位置的特定 S3 文件夹。 有没有办法触发...

回答 2 投票 0

如何将数据库从 DynamoDB 传输到 Aurora PostgreSQL?

您好 Stack Overflow 社区, 我目前正在开发一个项目,需要将数据从 DynamoDB 迁移到 Aurora PostgreSQL。我过去曾尝试将 PostgreSQL 连接到 Lambda 解析器

回答 1 投票 0

AWSGlue AccessDeniedException,状态代码 400

我正在尝试为数据工程项目构建数据管道在 S3、Glue、Athena 等的帮助下,我在设置胶水爬虫以对数据建立索引时遇到了困难。 连我都设定了角色

回答 1 投票 0

哪种AWS服务适合场景[关闭]

][1]当 hanadb(源)中出现红旗并且用户数据存储在多个 S3 存储桶中时,我们如何自动化删除特定用户数据的过程。 前任。在我的项目中,我们有 hana db 作为

回答 0 投票 0

从 deequ VerificationSuite 获取错误记录

当我们运行任何deequ VerificationSuite时,当规则有任何错误时,我们是否可以看到关于每个规则的输入数据异常记录。例如:如果 100 条记录中的 10 条记录规则 1 失败

回答 0 投票 0

是否可以在已停止的现有 EC2 实例上运行 Data Pipeline ShellCommandActivity?

我的最终目标是使用带有预装软件的现有机器执行数据转换——更确切地说,该软件是一个使用非标准包的 R 脚本 [可能安装了 manu...

回答 1 投票 0

为多数据源构建CDC架构的最佳实践

我们现在用自己的数据库运行这三个服务,我们想在它们之上构建聚合层。为此,我想构建 CDC(更改数据捕获)管道,我可以提出...

回答 0 投票 0

AWS数据管道中不支持'm3.xlarge'。

我是AWS的新手,试图通过从DynamoDB加载数据到S3来运行AWS数据管道。但我得到以下错误。请帮助 Unable to create resource for @EmrClusterForBackup_2020-05-01T14:18:...。

回答 1 投票 0

AWS数据管道S3 CSV到DynamoDB的JSON错误。

我试图用AWS DATA Pipeline插入几个位于S3目录下的csv,但是,我出现了这个错误。 在javax.security.Auth.Subject.doAs(Subject.java:422) 在org.apache.hadoop.security....

回答 1 投票 0

EC2资源的AWS数据管道名称标签选项

我正在EC2资源示例json中运行Shell活动以创建EC2资源。 {“ id”:“ MyEC2Resource”,“ type”:“ Ec2Resource”,“ actionOnTaskFailure”:“ terminate”,“ actionOnResourceFailure” ...

回答 1 投票 0

如何从Shell脚本捕获Spark错误

[AWS Data Pipeline中有一个管道,该管道运行名为shell.sh的外壳程序脚本:$ spark-submit transform_json.py在群集上运行命令... [54.144.10.162]运行命令... [52.206.87.30]。 ..

回答 1 投票 1

数据管道(从DynamoDB到S3)-如何格式化S3文件?

我有一条数据管道,将我的DynamoDB表导出到S3存储桶,因此我可以将S3文件用于QuickSight,Athena和Forecast等服务。但是,为了使我的S3文件可以使用这些服务,...

回答 1 投票 0

数据管道和EMR错误:未找到默认VPC。但是我无权创建默认的VPC

我需要将DynamoDB表导出到S3存储桶。我已经创建了数据管道,但是它处于“等待运行器”状态,因此我检查了runsOn值,并显示“ EmrClusterForBackup”。然后我...

回答 1 投票 1

无法通过AWS Datapipeline连接RDS MySQL数据库

我创建了一个AWS Datapipeline,用于将数据从RDS MySQL数据库移至S3,但是我遇到了以下错误。请帮助amazonaws.datapipeline.connector.SqlInputConnector:查询字符串为:...

回答 1 投票 0

AWS数据管道:将CSV文件从S3上传到DynamoDB

我正在尝试使用数据管道将CSV数据从S3迁移到DynamoDB。数据不是DynamoDB导出格式,而是普通CSV。我了解数据管道更典型地是...

回答 1 投票 0

试图将多个Amazon DynamoDB表合并为一个表

场景:我有一个JSON格式的半结构化数据集。我将数据集中的3个子集(new_records,upated_records和删除的记录)存储在3个不同的Amazon DynamoDB表中。 ...

回答 1 投票 0

如何使用AWS数据管道为Spark应用程序正确设置Google云存储

我正在设置集群步骤,以使用Amazon Data Pipeline运行Spark应用程序。我的工作是从S3读取数据,处理数据并将数据写入Google云存储。对于Google Cloud ...

回答 1 投票 3

AWS数据管道:Tez在简单的HiveActivity上失败

我正在尝试为我的POC运行简单的AWS Data Pipeline。我遇到的情况是:从存储在S3上的CSV数据中获取数据,对它们执行简单的配置单元查询,然后将结果返回给S3。我创建了...

回答 1 投票 4

© www.soinside.com 2019 - 2024. All rights reserved.