我在个人计算机和Google驱动器中有一个400MB数据集文件的两个副本。我想在Google Colab Jupyter笔记本上使用编程语言Julia来处理数据集。我找到了一个工作代码段,它将默认Colab运行时类型从Python 3更改为Julia 1.3.1。如果在代码单元中运行以下代码,然后重新加载Colab页面,则运行时类型将变为Julia:
%%shell
if ! command -v julia 2>&1 > /dev/null
then
wget 'https://julialang-s3.julialang.org/bin/linux/x64/1.3/julia-1.3.1-linux-x86_64.tar.gz' \
-O /tmp/julia.tar.gz
tar -x -f /tmp/julia.tar.gz -C /usr/local --strip-components 1
rm /tmp/julia.tar.gz
fi
julia -e 'using Pkg; pkg"add Plots; add PyPlot; add IJulia; add Knet;"'
julia -e 'using Pkg; pkg"build Knet;"'
当运行时类型变为Julia时,单击Mount Drive按钮将返回以下错误消息:
仅在托管的Python运行时上可以安装Google云端硬盘。
[当我尝试在Python运行时类型期间安装驱动器,然后将运行时类型转换为Julia时,Colab会清除所有内容,包括已安装的驱动器。因此,该方法也不起作用。
[当我尝试从计算机上将数据集上传到Colab时,一切开始顺利。但是,每次我尝试从计算机上载数据集来代替安装驱动器时,都会遇到以下两个问题之一:上载过程失败,或者由于不活动而导致Colab停止了Julia运行时(如何开始活动)没有我的数据集)。当上传过程停止而没有完全上传文件时,页面左下方的黄绿色圆圈表示已完成任务的百分比变为完全红色。除了这个红色圆圈,它没有给出任何错误消息。当我将上传的(不完整的)文件下载到我的计算机上时,我看到它只有大约20MB(原始文件是400MB)。因此,我可以理解上传过程已失败。
The same question之前曾被问过。但是,答案建议将驱动器安装在Python运行时中,然后再更改运行时类型。这对我不起作用,因为当运行时发生更改时,所有内容都会消失,如上所述。
顺便说一下,我的数据集在其他任何地方都找不到。因此,示例数据集文件夹不起作用。
所以,我如何在Julia的Google Colab上使用我的数据集?
如果数据集不是最高机密,则可以公开共享它,并使用gdown
命令下载它
run(`gdown --id 1-7dVdjCIZIxh8hHJnGTK-RA1-jL1tor4`)
这里1-7dV...or4
是从共享URL中获取的file_id。