我正在参加 Kaggle 竞赛“反馈论文评估”。 比赛规则要求我在 Kaggle 的笔记本上提交笔记本,并且禁用互联网访问。 我需要使用 NLTK 库来实现我的特征提取算法之一,但是当我提交笔记本时,它会抛出此错误:
LookupError:
**********************************************************************
Resource omw-1.4 not found.
Please use the NLTK Downloader to obtain the resource:
>>> import nltk
>>> nltk.download('omw-1.4')
For more information see: https://www.nltk.org/data.html
Attempted to load corpora/omw-1.4
Searched in:
- '/root/nltk_data'
- '/opt/conda/nltk_data'
- '/opt/conda/share/nltk_data'
- '/opt/conda/lib/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
我尝试下载nltk包并将它们上传到Kaggle的输入数据集,但内核无法识别该包。我尝试覆盖并将其链接到上传的包,但它不起作用。
如何在禁用互联网访问的情况下下载 omw-1.4?
我遇到了同样的问题,正如https://github.com/nltk/nltk/issues/3024中所述,你只需要下载omw-1.4。看起来新版本的 nlkt 需要 omw-1.4 包的存在,而以前不需要。
import nltk
nltk.download('omw-1.4')