我对此比较陌生,但我希望你能帮助我 我有一个代码应该训练一个基于 Openmp 和 SummarizationCNN/DM 的模型。
这里是开始
import torch
import spacy
import torch.nn as nn
import torch.optim as optim
import torchtext
import math
from torchtext.datasets import TranslationDataset
from torchtext.data import Field, BucketIterator
nlp = spacy.load("en_core_web_sm")
SRC = Field(tokenize='spacy', init_token='<sos>', eos_token='<eos>', lower=True)
TRG = Field(tokenize='spacy', init_token='<sos>', eos_token='<eos>', lower=True)
train_data = TranslationDataset(path='train.txt', exts=('.src', '.trg'), fields=(SRC, TRG))
valid_data = TranslationDataset(path='valid.txt', exts=('.src', '.trg'), fields=(SRC, TRG))
SRC.build_vocab(train_data, min_freq=2)
TRG.build_vocab(train_data, min_freq=2)
问题是由于某种原因我无法上传必要的包。起初 torchtext 有问题,在最新版本中,由于某种原因没有字段,我安装了一些旧的 0.6.0 并且它似乎可以工作,现在 spacy 不起作用。无论我做什么,都会出现错误
OSError:[E941] 找不到型号“en”。看起来您正在尝试从快捷方式加载模型,该快捷方式自 spaCy v3.0 起已过时。要加载模型,请改用其全名:
nlp = spacy.load("en_core_web_sm")
无论我做什么,我都无法应付,也许你知道发生了什么事,可以告诉我一些事情。
我在这里看到一个关于这个错误的问题,但是他们建议添加一行,。我已经写过了,恐怕这里还有更深层次的问题