我正在 google colab pro 上安装 RAPIDS,但这需要很长时间,最后 2 个安装花费了一个多小时,而不是安装期间所说的大约 15 分钟“在 Colab 上开始 RAPIDS 安装。这将需要大约 15 分钟”。有什么办法可以加快这个过程吗?我只想使用 cuML 库,我不关心其他正在安装的库。
对于安装,我使用以下步骤
!git clone https://github.com/rapidsai/rapidsai-csp-utils.git
!python rapidsai-csp-utils/colab/env-check.py
!bash rapidsai-csp-utils/colab/update_gcc.sh
import os
os._exit(00)
import condacolab
condacolab.install()
import condacolab
condacolab.check()
!python rapidsai-csp-utils/colab/install_rapids.py stable
import os
os.environ['NUMBAPRO_NVVM'] = '/usr/local/cuda/nvvm/lib64/libnvvm.so'
os.environ['NUMBAPRO_LIBDEVICE'] = '/usr/local/cuda/nvvm/libdevice/'
os.environ['CONDA_PREFIX'] = '/usr/local'
5/14/24更新:
cuDF 和 cudf.pandas 现在预装在 Google Colab 的 GPU 实例上。您仍然可以使用 RAPIDS+Colab Pip 安装模板
将其余 RAPIDS 库(例如 cuML、cuGraph、cuXfilter 和 cuSpatial)pip 安装到启用 GPU 的 Colab 实例上上一篇:
此功能的 OSS 代码位于:https://github.com/rapidsai-community/rapidsai-csp-utils。
大部分时间都花在通过
conda
来解决问题上。如果您在 RAPIDS 之前安装 mamba
,它的求解速度会更快。
您可以使用 Colab 编辑文件
install_rapids.py
,使用 https://rapids.ai/start.html#rapids-release-selector 上的选择器安装您想要的内容。您仍然会拉 cudf
,因为 cuml
需要它。
请理解,存在其他“立即尝试”解决方案(请参阅网站),Colab 上最新的兼容 RAPIDS 版本是 21.12