下载变压器模型以离线使用

问题描述 投票:1回答:1

我有一个受过训练的变压器NER模型,我想在未连接到互联网的机器上使用。加载此类模型时,当前它会将高速缓存文件下载到.cache文件夹。

要离线加载和运行模型,您需要将.cache文件夹中的文件复制到离线计算机。但是,这些文件具有较长的,非描述性的名称,如果要使用多个模型,则很难识别正确的文件。有什么想法吗?

Example of model files

python nlp pytorch huggingface-transformers
1个回答
0
投票

处理此问题的一种相对简单的方法是简单地“重命名”经过预先训练的模型,如this线程中所述。

基本上,对于您要使用的任何模型,您要做的就是这样的事情:

from transformers import BertModel

model = BertModel.from_pretraiend("bert-base-uncased")
model.save_pretraien("./my_named_bert")

该线程还详细说明了本地模型文件夹的命名方式,请参见LysandreJik的文章:

嗨,它们之所以这样命名是因为这是确保S3上的模型与缓存中的模型相同的一种干净方法。名称是从S3上托管的文件的etag创建的。 [...]

© www.soinside.com 2019 - 2024. All rights reserved.