YARN(又一个资源谈判者)是第二代Apache Hadoop基础架构的关键组件。不要将它用于JavaScript / Node.js Yarn包管理器(改为使用[yarnpkg])!最初由Apache描述为重新设计的资源管理器,YARN现在被描述为用于大数据应用的大规模分布式操作系统,包括下一代MapReduce(MR2)。
什么是流媒体的Hadoop YARN version命令行选项可能的完整列表?
我是通过Hadoop的网站浏览,发现下面的链接Hadoop的数据流。 https://hadoop.apache.org/docs/current1/streaming.html但是,我更感兴趣的是Hadoop的纱(MRv2) - ...
我使用hadoop2.7.1的rest api在集群外部运行mapreduce作业。此示例“ http://hadoop-forum.org/forum/general-hadoop-discussion/miscellaneous/2136-how-can-i-run-mapreduce-job-by-rest -...
我有一个火花的工作,从一个配置文件中读取数据。这个文件是一个类型安全的配置文件。它读取配置的代码看起来像这样:ConfigFactory.load()getConfig(“com.mycompany”)...
所以我有一段代码,其索引记录到弹性。此代码与火花和Hadoop运行。我刚刚升级Elasticsearch 2.3.1。当我在本地机器上运行我的代码它的工作原理...
我有几个不同的工作,以Hadoop集群上运行。有些需要很少的资源和更多一些,例如记忆。我想,因为它支持纱线到我的集群上同时运行这些作业。我想,如果我...
[嗨,我有一个Spark作业,可以在本地使用较少的数据运行良好,但是当我在YARN上调度它来执行时,我不断收到以下错误,慢慢地,所有执行程序都从UI和我的作业中删除了...
无论我多少修改yarn-site.xml中的设置,即使用以下所有选项yarn.scheduler.minimum-allocation-vcores yarn.nodemanager.resource.memory-mb yarn.nodemanager ....
在我的Spark工作中,我从资源文件中读取了一些额外的数据。一些示例Resources.getResource(“/ more-data”)它在本地工作得很好,当我从spark-submit master = local [*]运行时我只...
我试图在yarn-client上运行pyspark,我不确定可能是什么原因而无法正确解释日志从pyspark.sql导入sys导入来自pyspark导入的SparkSession SparkContext,...
我在AWS上设置了10节点HDP平台。以下是我的配置2服务器 - 名称节点和备用名称节点7数据节点和每个节点有40个vCPU和160 GB内存。我想计算......
纱线日志 - 标准输出和stderr成为巨大的文件 - 如何避免这种情况
亲朋好友和学院我们有带有hadoop版本的ambari集群 - 2.6.4集群包括52台datanode机器,以下问题发生在9台数据节点机器上,所以我将解释......
如何从ResourceManager Web UI中终止应用程序
有没有办法从RM Web UI中删除应用程序而不是运行yarn应用程序-kill?
我如何修复“文件只能被复制到0个节点而不是minReplication(= 1)。”?
我刚才问了一个类似的问题,并且认为我解决了这个问题,但事实证明它只是因为我正在处理一个较小的数据集而消失了。很多人问过这个......
目的 - 将自定义日志从流媒体应用程序存储到HDFS或UNIX目录以用于流应用程序我正在群集模式下运行spark流程序。但是日志没有写入给定日志...
spark-submit集群模式不适用于python spark,但适用于scala spark
我有一个集群,我们有hadoop设置与spark集成。 spark版本是spark v2.0.0,当你在集群模式下部署scala spark时,它按预期工作。以下是命令:...
我是Spark,Hadoop和Yarn的初学者。我安装Spark:https://spark.apache.org/docs/2.3.0/和Hadoop / Yarn:https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common / ...
在Kubernetes上运行Apache Hive(不含YARN)
是否可以在Kubernetes上运行Apache Hive(没有在Kubernetes上运行YARN)?我在网上找不到任何合理的信息 - 在Kubernetes上运行Hive这样一个不寻常的事情......
我正在使用EMR 5.4并且我向纱线提交火花作业当我尝试使用纱线日志-applicationId application_1528461193301_0001来检索日志时,我有以下错误:18/06/08 12:38:01 INFO ...
是否有任何hadoop / yarn命令可以动态列出作业使用的映射器/减速器/插槽的数量