我正在探索具有Docker支持的新EMR 6.0.0,以便决定是否要使用它。我们的项目之一是用Scala 2.11编写的。但是EMR 6.0.0带有从Scala 2.12构建的Spark。所以我改用6.00-beta,它是从Scala 2.11构建的Spark 2.4.3。如果它适用于6.0.0-beta,那么我们会将代码升级到Scala 2.12并使用6.0.0。
当我尝试运行Scala Spark作业时遇到的几个问题:
我猜测在引导过程中或在Docker文件中必须设置一些东西。
有人可以帮忙吗?谢谢!
我找出了S3问题。在测试版中,未安装/ mnt / s3并具有读取和写入权限。
所以我需要将“ docker.allowed.rw-mounts”添加到如下所示的容器执行器配置中:
docker.allowed.rw-mounts = / etc / passwd,/ mnt / s3