nltk.download('punkt') 给出的输出为 false

问题描述 投票:0回答:1

这是我的代码:

df['num_words'] = df['text'].apply(lambda x:len(nltk.word_tokenize(x)))

这给了我以下错误:

Resource punkt not found.
Please use the NLTK Downloader to obtain the resource:
   
>>> import nltk
>>> nltk.download('punkt')
  
For more information see: https://www.nltk.org/data.html

Attempted to load tokenizers/punkt/english.pickle

然后我尝试安装

nltk
并使用
'punkt'
下载文件
nltk.download('punkt')
。 但我得到了这个error

我尝试了一些替代代码,例如:

import nltk
import ssl

try:
    _create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
    pass
else:
    ssl._create_default_https_context = _create_unverified_https_context

nltk.download()

还尝试更改网络,因为在某些地方我发现它说服务器问题。

python machine-learning nlp data-science nltk
1个回答
0
投票

尝试以管理员身份启动 jupyter notebooks 会话(以管理员身份打开命令或 anaconda 提示符)。

最后一个选项是手动下载语料库。您可能会发现this对您的情况有帮助。

© www.soinside.com 2019 - 2024. All rights reserved.