我正在作为AWS EMR步骤运行pyspark作业,该脚本需要花费超过15分钟的时间来运行。我在EMR群集中有1个主节点和3个核心节点。我想找出原因以及脚本的哪一部分需要花费很长时间。为此,我想查看Spark Web UI。当我在Yarn UI(端口8088)中单击“ Tracking URL:Applicationmaster”时,我的浏览器一直在旋转,并且无法显示Spark UI。浏览器中的URL链接为:
http://ip-172-31-x-x.ec2.internal:20888/proxy/application_1579701541309_1029/
这显然是私有DNS。即使这是我暂时进行故障排除,如何查看Spark UI。如果需要,我可以更改AWS Security组。后来,当我在生产环境中时如何处理?
谢谢
@ netrocks我想您确实解决了问题,但是仅出于其他目的,我发布了如何访问EMR UI来查看计划和其他调试信息的信息
ssh -i ~/.ssh/emr -ND 8157 [email protected]
(适用于Mac)