emr-serverless 相关问题


AWS EMR 集群中元数据的 AWS 粘合数据目录

我们计划使用AWS EMR集群来处理json和parquet文件。我有一个基本问题,我们真的需要 aws 数据目录来处理存储在 S3 中的 json 和 parquet 文件...


如何在 AWS EMR 上配置/安装 JDBC SQLServerDriver for Spark 3.5?

我正在开发一个 PySpark ETL 管道应用程序,以便最终部署在 AWS EMR 上。数据从 Microsoft SQL Server 数据库中提取或提取。当我在本地运行代码时,我使用本地 mas...


Spark中同规格硬件上本地处理和集群处理有什么区别?

本地模式 vs 集群模式 我是一个刚刚使用EMR的新手。 我正在使用 AWS EMR。 有主节点、核心节点、任务节点。 为什么要使用多核/任务?我不能只用一个吗?难道是……


(0 , core_1.default) 不是使用 @middy/core 的 lambda 处理程序上的函数

我正在尝试在我的 lambda 中间件上使用 middy,我的堆栈是使用 TypeScript 和 Serverless v3、Node.js v18 创建的。 有一个最小生殖的例子: tsconfig.json: { “编译器操作...


Apache Spark Structured Streaming 中 Spark UI 上的查询和阶段卡住了

我在 EMR 集群 (6.14) 上使用 Apache Spark Structured Streaming (3.1.2)。 Spark 结构化流将数据从 Apache Kafka 流式传输到 Delta Lake 表。当我打开 Spark UI 时,我看到以下内容


如何使用 Serverless 框架将 sns 的资源策略添加到 sqs

我在为我的 sqs 队列分配正确的策略时遇到问题,以便任何 sns 主题在该队列订阅时都可以向它发送消息。我尝试在服务中使用 UpdatePolicy 和 Metadata...


需要帮助对 Synapse 中的复制活动进行故障排除

我正在尝试通过复制活动将数据从 ADLS Gen 2(一个 Excel 文件)复制到在 sql serverless 池中创建的数据库中。我正在使用自动创建表选项,但管道无法运行


© www.soinside.com 2019 - 2024. All rights reserved.