这是我的代码:
df['num_words'] = df['text'].apply(lambda x:len(nltk.word_tokenize(x)))
这给了我以下错误:
Resource punkt not found.
Please use the NLTK Downloader to obtain the resource:
>>> import nltk
>>> nltk.download('punkt')
For more information see: https://www.nltk.org/data.html
Attempted to load tokenizers/punkt/english.pickle
然后我尝试安装
nltk
并使用'punkt'
下载文件nltk.download('punkt')
。
但我得到了这个。
我尝试了一些替代代码,例如:
import nltk
import ssl
try:
_create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
pass
else:
ssl._create_default_https_context = _create_unverified_https_context
nltk.download()
还尝试更改网络,因为在某些地方我发现它说服务器问题。
尝试以管理员身份启动 jupyter notebooks 会话(以管理员身份打开命令或 anaconda 提示符)。
最后一个选项是手动下载语料库。您可能会发现this对您的情况有帮助。