带有 spacy pack 的 Probem

问题描述 投票:0回答:0

我对此比较陌生,但我希望你能帮助我 我有一个代码应该训练一个基于 Openmp 和 SummarizationCNN/DM 的模型。

这里是开始

import torch
import spacy
import torch.nn as nn
import torch.optim as optim
import torchtext

import math
from torchtext.datasets import TranslationDataset
from torchtext.data import Field, BucketIterator
nlp = spacy.load("en_core_web_sm")

定义源文本和目标文本的字段

SRC = Field(tokenize='spacy', init_token='<sos>', eos_token='<eos>', lower=True)
TRG = Field(tokenize='spacy', init_token='<sos>', eos_token='<eos>', lower=True)

加载数据

train_data = TranslationDataset(path='train.txt', exts=('.src', '.trg'), fields=(SRC, TRG))
valid_data = TranslationDataset(path='valid.txt', exts=('.src', '.trg'), fields=(SRC, TRG))

建立词汇

SRC.build_vocab(train_data, min_freq=2)
TRG.build_vocab(train_data, min_freq=2)

问题是由于某种原因我无法上传必要的包。起初 torchtext 有问题,在最新版本中,由于某种原因没有字段,我安装了一些旧的 0.6.0 并且它似乎可以工作,现在 spacy 不起作用。无论我做什么,都会出现错误

OSError:[E941] 找不到型号“en”。看起来您正在尝试从快捷方式加载模型,该快捷方式自 spaCy v3.0 起已过时。要加载模型,请改用其全名:

nlp = spacy.load("en_core_web_sm")

无论我做什么,我都无法应付,也许你知道发生了什么事,可以告诉我一些事情。

我在这里看到一个关于这个错误的问题,但是他们建议添加一行,。我已经写过了,恐怕这里还有更深层次的问题

python-3.x spacy
© www.soinside.com 2019 - 2024. All rights reserved.