EMR 6.8 支持什么版本的 Python?
看起来 EMR 的早期版本支持 Python 3.7,该版本将在 6 个月后弃用。
EMR 6.8 运行 Spark 3.3.0,最高支持 Python 3.9。
我在官方发布指南上找不到答案: https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-680-release.html
您可以使用哪种 Python 是一个关于您在 EMR 中使用哪种计算来运行 PySpark 的问题。如果您想要另一个 Python,您可能需要选择另一个 AMI、不同的容器映像,或者直接与 AWS 联系。
由于 Python 3.7 在 6 个月内失去支持,我还遇到了需要在 EMR 上使用特定 Python 版本的问题。
我认为解决方案是使用虚拟环境来触发步骤。以下是一些人们声称已经成功做到这一点的来源。
https://blog.datank.ai/make-the-most-out-of-emr-with-pyspark-and-pyenv-954c028a7552
自从提出这个问题以来,他们已使用您提供的信息更新了页面 https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-release-app-versions-6.x.html正在找。现在有一个包含 Python 版本的行项目。
emr-6.8.0 包括 Python 版本 2.7、3.7。