amazon-emr 相关问题

Amazon Elastic MapReduce(Amazon EMR)是一项Web服务,使企业,研究人员,数据分析师和开发人员能够轻松且经济高效地处理大量数据。它利用在Amazon Elastic Compute Cloud(Amazon EC2)和Amazon Simple Storage Service(Amazon S3)的Web规模基础架构上运行的托管Hadoop框架。

尝试使用AmazonElasticMapReduce运行作业流程时出错

[我正在尝试使用AmazonElasticMapReduce运行作业流程,并且收到以下错误:线程“ main” com.amazonaws.services.elasticmapreduce.model ...中的异常...]

回答 1 投票 0

AWS-教育帐户无法创建群集,EC2权限不足

我的教育AWS账户无法创建集群。它给了我这样的错误核心-2:服务角色EMR_DefaultRole没有足够的EC2权限。我已经搜索了AWS支持中心和...

回答 1 投票 0

lambda函数中python中两个不同事件(sns和emr)之间可能有所不同的函数

我有一个由sns事件和emr事件触发的lambda函数。这些事件看起来并不相同,并且不共享任何key:value对。我当前的方式一直在给我KeyError。理想情况下,我...

回答 1 投票 0

创建EMR群集时出错,EMR服务角色无效

我正在通过cloudformation和lambda函数创建一个emr集群。创建堆栈后,当我运行lambda函数时,它将通过赋予EMR服务角色来启动集群:is invalid error ....

回答 1 投票 0

火花失败-期货超时

我正在使用在Amazon EMR集群上运行的apache spark 2.2.1。有时,作业会因“期货超时”而失败:java.util.concurrent.TimeoutException:期货在[100000毫秒]之后出现超时...

回答 1 投票 2

将AWS EMR工件存储库与构建工具一起使用

我尝试使用EMR工件存储库将emrfs-hadoop-assembly及其依赖项打包到我的应用程序中。我找到的资源告诉我必须使用的Maven存储库的URL ...

回答 1 投票 1

使用cloudformation创建堆栈以通过lambda启动emr时出错

我正在尝试使用cloudformation创建堆栈以通过触发lambda函数来启动emr。但是在创建堆栈时,我在创建ManagedApiPolicy时遇到此错误:...

回答 1 投票 0

如何在EMR集群中运行两个火花作业?

我有一个在EMR群集中运行的实时Spark作业,还有另一个在另一个EMR群集中运行的批处理作业,并且该作业在特定时间触发。如何在一个EMR中运行这两个作业...

回答 1 投票 0

EMR笔记本查询动态表

我正在使用EMR笔记本从S3提取数据并对数据进行一些操作,然后将其推入不同的s3存储桶。基本上,代码是使用ipython笔记本(jupyter)编写的。我需要查询DynamoDb ...

回答 1 投票 0

Amazon EMR上的纱线资源管理上的火花:如何利用所有可用的内核执行火花作业执行

我有一个在具有以下群集配置的EMR群集上运行的spark作业:主服务器:1:m4.2xlarge:32 GiB内存,8个vCPU。核心:2:m4.2xlarge:32 GiB内存,8个vCPU。任务节点...

回答 1 投票 0

无效的模板资源属性'Ref'

我不熟悉编写yaml脚本,当我尝试在Cloudformation上创建堆栈时,不断收到此错误'无效的模板资源属性'Ref'。我的代码中缺少什么吗? ...

回答 1 投票 0

您如何创建限制资源的AutoScaling IAM角色?

如果我正在创建自定义自动缩放策略,并尝试仅限制使用KJ分配资源,而创建EMR自动缩放状态会失败,而不是如果我指定“ *”则可以正常工作...

回答 2 投票 0

从架构Scala提取列详细信息和类型

我正在使用AWS EMR v5.29.0 Spark v2.4.4和Scala v2.11.12。我正在使用推断模式方法读取文件,并使用以下代码val df = ...

回答 2 投票 0

如何配置EMR以通过用户访问ID和密钥从S3存储桶中读取

是否有一种方法可以读取不在您的AWS账户中的S3存储桶,并且您不能承担获取访问权限的角色-特别是在EMR中。在纯Hadoop或Spark中,您可以指定:fs.s3 ....

回答 1 投票 0

如何从Amazon emr访问.pem文件

我是Amazon EMR的新手,我想在EMR中使用.pem文件。 .pem文件在我的本地文件夹中。当我在EMR实例中使用pem文件内容创建相同文件时,它不起作用。如果...

回答 3 投票 1

添加的影响是什么:spark.yarn.submit.waitAppCompletion = false

[这里,我试图了解在提交Spark步骤时添加:spark.yarn.submit.waitAppCompletion = false配置的影响。据我所知,如果将其设置为true,则...

回答 1 投票 0

我如何在AWS EMR笔记本上安装python库?

我想在AWS Notebook(连接到EMR集群)上安装其他库,但是看不到从Notebook连接到Internet的任何选项。如果我执行“ pip install”,它总是会回来...

回答 1 投票 0

如何先顺序运行EMR步骤,然后并行运行?

[借助Step Function等编排引擎可以轻松实现此过程,但是由于某些原因,我们无法使用。在这里,我想了解我们是否可以对...

回答 1 投票 0

如何仅通过boto3获得与特定名称匹配的EMR的ID

如何获取与boto3的特定名称匹配的AWS EMR集群ID列表?我在这里有这段代码:import sys import time import boto3 client = boto3.client(“ emr”)cluster_name ='Adhoc-CSDP -...

回答 1 投票 0

具有Docker支持的EMR 6 Beta具有S3访问问题

我正在探索具有Docker支持的新EMR 6.0.0,以便决定是否要使用它。我们的项目之一是用Scala 2.11编写的。但是EMR 6.0.0带有从Scala 2.12构建的Spark。 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.