nltk.download('punkt') 给出的输出为 false

Question

这是我的代码：

df['num_words'] = df['text'].apply(lambda x:len(nltk.word_tokenize(x)))

这给了我以下错误：

Resource punkt not found.
Please use the NLTK Downloader to obtain the resource:
   
>>> import nltk
>>> nltk.download('punkt')
  
For more information see: https://www.nltk.org/data.html

Attempted to load tokenizers/punkt/english.pickle

然后我尝试安装

nltk

并使用

'punkt'

下载文件

nltk.download('punkt')

。但我得到了这个

。

我尝试了一些替代代码，例如：

import nltk
import ssl

try:
    _create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
    pass
else:
    ssl._create_default_https_context = _create_unverified_https_context

nltk.download()

还尝试更改网络，因为在某些地方我发现它说服务器问题。

Answer 1

尝试以管理员身份启动 jupyter notebooks 会话（以管理员身份打开命令或 anaconda 提示符）。

最后一个选项是手动下载语料库。您可能会发现this对您的情况有帮助。

nltk.download('punkt') 给出的输出为 false

问题描述投票：0回答：1

1个回答

最新问题

nltk.download('punkt') 给出的输出为 false

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1