我正在尝试训练 spacy3 NER 模型。我的机器上有可用的 GPU,具有以下规格:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.86.01 Driver Version: 515.86.01 CUDA Version: 11.7 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Tesla T4 Off | 00000000:00:04.0 Off | 0 |
| N/A 68C P0 29W / 70W | 567MiB / 15360MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 1352 C python 563MiB |
+-----------------------------------------------------------------------------+
当 GPU 处于活动/可用状态并通过以下命令运行时:
>>>import torch
>>>torch.backends.cudnn.is_available()
True
>>>torch.backends.cudnn.version()
8500
>>>torch.cuda.is_available()
True
>>>torch.zeros(1).cuda()
tensor([0.], device='cuda:0')
>>>torch.cuda.get_device_name()
'Tesla T4'
当我运行以下命令来训练我的 spacy ner 模型时,
python3 -m spacy train configs/config.cfg --output training/ --path.train corpus/train.spacy --path.dev corpus/train.spacy --gpu-id 0
我收到以下错误:
ValueError: No GPU devices detected
我已经解决了版本错误,最重要的是,GPU 可用于正常任务。我已经解决了以下 stackoverflow 问题,但这些问题都没有帮助。
torch.cuda.is_available()
仍返回False?
我对这个问题感到震惊,无法找到解决方案。非常感谢任何形式的帮助。
我分别使用以下版本的python和pytorch
Python 3.10.6
1.13.1+cu117
我是一名学生,正在学习深度学习并使用 Spacy NER GPU 进行项目。 请检查,您是否在配置文件内的“[system]”中设置了“gpu_allocator =”pytorch“”和“seed = 0”。 抱歉,我的英语不好。