import numpy as np
import pandas as pd
import torch
from torch.utils.data import Dataset
import stanza
stanza.download('en')
nlp = stanza.Pipeline(lang='en')
以上代码用于创建管道
Stanza 为我们可以使用的 66 种人类语言提供了大量预先训练的 NLP 模型。下载预先训练的模型并创建管道非常简单: 显示此错误的代码如下所示
Downloading https://raw.githubusercontent.com/stanfordnlp/stanza-resources/main/resources_1.5.0.json
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
Cell In[21], line 8
----> 8 stanza.download('en')
--> 547 download_resources_json
--> 441 request_file(
--> 152 download_file(url, temppath, proxies, raise_for_status)
--> 119 with tqdm(total=file_size, unit='B', unit_scale=True, \
--> 245 self.colour = colour
--> 204 self.container.children[-2].style.bar_color = bar_color
我还升级了jupyter笔记本,tqdm和stanza
pip install --upgrade stanza
pip install --upgrade tqdm
但问题仍然存在。这是关于
的项目我在另一个图书馆也遇到了同样的问题。在终端中,它可以工作并显示进度条,在笔记本单元中它会引发上述错误。
我通过捕获尝试显示进度条的命令的输出来解决这个问题:
from contextlib import redirect_stdout
f = io.StringIO()
with redirect_stdout(f):
problematic_function()
(在我的例子中,有问题的函数是来自 langchain 的 SentenceTransformerEmbeddings)
我在从 Huggingface 加载模型时遇到了同样的问题:
模型 = SentenceTransformer('释义-多语言-MiniLM-L12-v2')
尝试此解决了问题:
pip install --升级 ipywidgets