Aws Glue 在使用 BeautifulSoup 运行 python 脚本时抛出错误

问题描述 投票:0回答:1

我有一个Python代码,它使用Beautifulsoup从网站上抓取数据,并且它在Jupyter.im中运行良好,尝试在awsglue中运行相同的脚本,并在glue作业键中添加以下作业参数:--additional-python-modules值:bs4 。作业失败并出现错误“ModuleNotFoundError:没有名为“bs4”的模块

将 pandas 导入为 pd

从 bs4 导入 BeautifulSoup

导入请求

导入boto3

从 io 导入 StringIO

更新: 按照建议,在我的 s3 存储桶中上传 beautifulsoup 的 whl 文件,并在附加参数部分给出路径,它仍然抛出相同的错误。

whl 文件来自 https://pypi.org/project/beautifulsoup4/#files

我该如何解决这个问题?

python amazon-web-services beautifulsoup aws-glue
1个回答
0
投票

我可以通过使用以下方法让它工作

%additional_python_modules beautifulsoup4==4.12.3

看来你必须拼写整个包。我知道这篇文章已经有一年多了,但如果其他人将来遇到同样的问题并发现它,我希望您发现它有帮助。花了我2个小时>_<

© www.soinside.com 2019 - 2024. All rights reserved.